Дом Бизнес Google упрощает машинное обучение с помощью SQL

Google упрощает машинное обучение с помощью SQL

Оглавление:

Видео: Migrating Microsoft SQL Server 2008 Databases to AWS - AWS Online Tech Talks (Ноябрь 2024)

Видео: Migrating Microsoft SQL Server 2008 Databases to AWS - AWS Online Tech Talks (Ноябрь 2024)
Anonim

Google теперь добавил возможности машинного обучения (ML) в свою Google BigQuery, петабайтную (PB) масштабную облачную базу данных компании. Теперь эта версия, получившая название BigQuery ML, позволяет использовать простые операторы языка структурированных запросов (SQL) для построения и развертывания моделей ML для прогнозной аналитики.

Это не просто хорошая новость для ученых, использующих Google. Это также хорошо для бизнес-операторов, заинтересованных в расширении своих возможностей анализа данных, поскольку добавляет еще одного эффективного конкурента в довольно небольшой список поставщиков, способных обеспечить такой уровень сложности с помощью облака. Двумя другими наиболее известными именами являются Amazon Relational Database Service и Microsoft Azure SQL, и вы можете найти больше в нашем недавнем обзоре службы облачных баз данных.

Бич всех продавцов и покупателей продуктов данных всегда был недостатком навыков. Это особенно верно для тех, кто интересуется ОД и прогнозной аналитикой, поскольку эти дисциплины часто требуют знания новых технологий и запросов к языкам.

«На каждого ученого, работающего с данными, работают сотни аналитиков, и большинство из них использует SQL», - сказал PCMag Судхир Хасбе, директор по управлению продуктами в Google Cloud. Что-то нужно было дать, если бы сила армии аналитиков данных должна была быть откупорена от узкого места, созданного слишком немногими и слишком перегруженными исследователями данных.

Ответ Google на эту дилемму не что иное, как замечательный. В то время как ML является горячей тенденцией и проявляется во всех видах продукции повсюду, он все еще остается надежной областью для исследователей данных. Множество поставщиков добились прогресса в упрощении технологии, но уродливая правда заключается в том, что вы можете упростить ее значительно, и это все еще слишком сложно для использования более чем 99 процентам людей. Тем не менее, мы должны быть в состоянии использовать его, потому что ML может делать больше и делать это быстрее, чем группа супер-умных людей.

Google внедряет ML в Google BigQuery, чтобы он располагался ближе к данным. Приложение предоставит возможности ML быстрее, чем традиционные модели ML, отчасти потому, что аналитика данных может выполняться в источнике. В настоящее время в бета-версии BigQuery ML позволяет аналитикам (и ученым) запускать прогностическую аналитику, такую ​​как прогнозирование продаж и создание клиентских сегментов прямо над данными, где они хранятся. Уже одно это респектабельное и заметное обновление.

Однако Google пошел дальше, добавив возможность, позволяющую аналитикам данных использовать простые операторы SQL для построения и развертывания моделей ML. Прямо сейчас, варианты - это линейная регрессионная и логистическая регрессионная модели для прогнозного анализа, так как эти две модели наиболее часто используются.

Вот иллюстрация, которую Google предоставил, чтобы продемонстрировать, как аналитики данных будут использовать эту возможность:

По словам Хасбе, Google планирует со временем добавить к этой возможности дополнительные параметры ML. «Нам нужно узнать от наших клиентов, какие модели они хотят, чтобы мы добавили, чтобы мы сначала предоставили наиболее полезные модели», - сказал он.

Дополнительные обновления Google BigQuery

Первым в списке существенных обновлений после ML являются возможности кластеризации, BigQuery Geographic Information Systems (BigQuery GIS), новый соединитель данных Google Sheets и новый соединитель данных Google Sheets.

Кластеризация также находится в стадии бета-тестирования и позволяет создавать кластеризованные таблицы в процессе оптимизации данных, который объединяет строки с одинаковыми ключами кластера. Это снижает затраты, поскольку повышает производительность и позволяет Google BigQuery взимать с пользователя плату только за отсканированные данные, а не за всю таблицу или раздел.

BigQuery GIS в настоящее время находится в альфа-версии и используется для анализа геопространственных данных. В то время как команда Google Cloud сотрудничала с Google Earth Engine для создания ГИС BigQuery, вы должны представить свои собственные геопространственные данные в таблицу. Это не проблема в нескольких отраслях, включая подключенные автомобильные системы, Интернет вещей (IoT), производство, розничная торговля, умные города и телематика. Не говоря уже о правительственных учреждениях, от Агентства по охране окружающей среды (EPA) и Национального агентства геопространственной разведки до Национального управления океанических и атмосферных исследований (NOAA) и всех военных отделений, конечно.

BigQuery GIS использует библиотеку S2, которая в настоящее время насчитывает более миллиарда пользователей с помощью различных продуктов, таких как Google Earth Engine и Google Maps. Если вам нужно больше геопространственных данных, то федеральное правительство делится огромным количеством этих данных на GeoPlatform.

Новый коннектор данных Google Sheets может порадовать многих аналитиков данных просто потому, что он настолько практичен для повседневного использования. Вы можете получить доступ к Google BigQuery из Google Sheets (программа для работы с электронными таблицами) и использовать такие инструменты Google Sheets, как Explore, который представляет собой комбинированный инструмент для совместной работы, визуализации данных и запросов на естественном языке.

Google BigQuery теперь также имеет новый пользовательский интерфейс в бета-версии. Одним из наиболее интересных элементов является функция визуализации одним щелчком, которую поддерживает Google Data Studio. В общем, это отличный раунд обновлений для и без того элегантного сервиса. Эти обновления будут протестированы в следующем раунде проверок решения «База данных как услуга» (DBaaS) PCMag после того, как ошибки будут устранены, и продукты выйдут за пределы своих соответствующих альфа- и бета-статусов.

PCMag EIC Дэн Коста обсуждает будущее данных:
Google упрощает машинное обучение с помощью SQL