Дом Бизнес Бизнес-справочник по машинному обучению

Бизнес-справочник по машинному обучению

2024

Видео: Ð Ð¡ DONI ft Ð¢Ð¸Ð¼Ð°Ñ Ð¸ Ð Ð¾Ñ Ð¾Ð´Ð° Ð Ñ ÐµÐ¼Ñ ÐµÑ Ð° ÐºÐ»Ð¸Ð¿Ð°, 2014 (Октября 2024)

Машинное обучение (ML) вошло во многие аспекты самых популярных бизнес-технологий - от обработки естественного языка (NLP) до глубокого обучения и за его пределами. ML является лишь одним из факторов революции в области искусственного интеллекта (ИИ), но это важный фактор. Алгоритмы ML - это жизненно важный уровень интеллекта, который внедряется в продукты, которые мы используем, и в будущем мы увидим, как он будет распространяться только по большему количеству вариантов использования.

Алгоритмы ML встроены в структуру большинства технологий, которые мы используем каждый день. Инновации ML, охватывающие компьютерное зрение, глубокое обучение, НЛП и другие, являются частью большой революции вокруг практического ИИ. Это не автономные роботы или разумные существа, а тип интеллекта, интегрированный в наши приложения, программное обеспечение и облачные сервисы, который сочетает в себе алгоритмы искусственного интеллекта и большие данные под поверхностью.

Тенденция еще более выражена в бизнесе. ML больше не используется исключительно для специализированных исследовательских проектов, осуществляемых группой ученых-данных. В настоящее время предприятия используют ML для получения бизнес-аналитики и бизнес-аналитики на основе постоянно растущих объемов данных. Вот почему как никогда важно не только знать, что такое ОД, но и изучать наиболее эффективные стратегии его использования для достижения материальной ценности.

Тед Даннинг, доктор философии, является главным архитектором приложений в MapR, который предоставляет распределения больших данных и инструменты управления данными для предприятий, а также является соавтором двух книг, которые он называет «Практическое машинное обучение». Ветеран Силиконовой долины десятилетиями работал в этой области, наблюдая, как методы ИИ и пространство развиваются до такой степени, что достижения в области когнитивных вычислений и доступность инструментов с открытым исходным кодом действительно привели МЛ к массовому распространению. Даннинг поговорил с PCMag, чтобы разобраться с жаргоном, объяснить, что на самом деле означает ML, и поделиться мудростью и лучшими практиками того, как компании могут максимально использовать свои инвестиции в ML.

Практическое определение

Прямое определение ML дает системам возможность действовать, итеративно учиться и вносить коррективы, без какого-либо явного программирования. Даннинг сказал, что ML - это отрасль статистики, но очень практичная. Он подчеркнул, что в реальном деловом контексте вы должны быть прагматичными и реалистичными в том, как вы это применяете. Основная задача ML - создать бизнес-процесс, который будет воспроизводимым, надежным и выполнимым.

«Машинное обучение не сводится к тому, чтобы оглядываться назад на научные данные и пытаться решить, какие выводы являются жизнеспособными», - сказал Даннинг. «Речь идет о том, чтобы смотреть вперед и спрашивать, что мы можем предсказать о будущем и что произойдет в различных сценариях. Когда дело доходит до ведения бизнеса с этими данными, мы говорим об очень ограниченных ситуациях, когда вам нужна тиражируемость».

Изображение предоставлено Тоддом Джакитом на Futurism.com. Нажмите, чтобы развернуть полную инфографику.

Глубокое обучение против дешевого обучения

Вы можете разбить эту основную идею на ряд различных областей в ML, но Даннинг указал на две, в частности, на обоих концах спектра: глубокое обучение и то, что он называет «дешевым обучением». Глубокое обучение является более сложной концепцией.

«Мы хотели, чтобы машинное обучение пошло глубже. Это начало термина», - сказал Даннинг. «За последние 10 или 15 лет были разработаны методы, которые действительно делают это. Раньше требовалось много инженерных работ, чтобы сделать отношения в данных видимыми для алгоритмов, которые долгое время были не такими умными, как мы хотел, чтобы они были. Вы должны были передать алгоритмы эти приятные на вкус данные на пластине, поэтому мы использовали для ручного кодирования все эти функции, которые системы теперь делают самостоятельно ».

Глубокое обучение - это то, что лежит в основе инноваций вокруг нейронных сетей. Он объединяет сложные методы, такие как компьютерное зрение и НЛП, в слои «более глубокого» обучения, которые привели к огромным успехам в таких областях, как распознавание изображений и текста. Это отлично подходит для сложного моделирования, но может быть излишним для более простых, повседневных бизнес-задач, которые могут опираться на установленные структуры и методы ML с гораздо меньшими параметрами.

Дешевое обучение, объяснил Даннинг, означает простые, эффективные, проверенные временем методы, в которых предприятиям не нужно вкладывать дорогостоящие ресурсы, чтобы изобретать велосипед.

«В области вычислительной техники мы много говорим о низко висящих фруктах. Доступность данных и значительное увеличение вычислительной мощности означают, что мы сократили все дерево», - пояснил он. «Простое машинное обучение больше не только для ученых данных».

Как работает дешевое обучение?

Базовые алгоритмы ML могут определять корреляции и давать рекомендации, или делать опыт более контекстным и персонализированным. Даннинг сказал, что почти во всех аспектах того, как мы взаимодействуем с компьютерами, есть возможность использовать дешевое обучение, чтобы просто заставить вещи работать лучше.

Одним из примеров дешевого обучения на практике является обнаружение мошенничества. Банки и продавцы имеют дело с широко распространенным мошенничеством, но оно часто рассеяно и касается достаточно низких ценностей, о которых не сообщается. Даннинг объяснил, что с помощью алгоритма дешевого обучения (то есть существующего теста ML, запрограммированного для этой конкретной задачи), продавцы могут легче определить общие точки компромисса, которые подвергают пользователей риску, и выявлять схемы мошенничества, которые иначе не были бы видимый.

«Предположим, что вы хотите выяснить, какие продавцы, по-видимому, пропускают данные, которые ведут к мошенничеству. Вы можете использовать тест G ^2, чтобы просто определить, какие продавцы перепредставлены в истории транзакций жертв мошенничества по сравнению с потребителями без мошенничества», - Даннинг сказал. «Это кажется слишком простым, чтобы его можно было назвать машинным обучением, но оно находит плохих парней в реальной жизни. Расширения этой техники могут быть использованы, чтобы дополнить несколько более продвинутых методов, позволяющих более простым алгоритмам обучения преуспеть там, где они могут потерпеть неудачу в противном случае».

Дешевое обучение можно использовать по-разному, поэтому Даннинг привел еще один пример того, как его можно использовать в онлайн-бизнесе. В этом случае он объяснил, как существующий алгоритм ML может решить простую задачу ранжирования комментариев.

«Предположим, у вас есть статья с несколькими комментариями к ней. В каком порядке они должны быть размещены? Как насчет того, чтобы упорядочить комментарии в соответствии с тем, насколько интересные люди думают о них? Вы можете подсчитать, сколько раз люди читали комментарий, и как Много раз они поддерживали это, но немного магии все еще необходимо, "сказал Даннинг.

«Одно голосование от одного читателя, вероятно, на самом деле не лучше, чем восемь голосов из десяти читателей», - пояснил он. «Еще хуже, если вы поставите первых победителей на первое место, другие комментарии никогда не увидят свет, и поэтому вы никогда не узнаете о них. Небольшая часть машинного обучения, называемая выборкой Томпсона, может решить эту проблему путем сбора данных о новых комментариях. и где рейтинги являются неопределенными, но, как правило, упорядочивают их таким образом, чтобы дать пользователям лучший опыт ".

Даннинг также изложил набор лучших практик, позволяющих вашему бизнесу максимально эффективно использовать ML. Чтобы узнать, как логистика, данные и арсенал различных алгоритмов и инструментов влияют на успешную бизнес-стратегию, ознакомьтесь с историей успеха «7 советов по машинному обучению».

2018 и далее: где сейчас ML

Возможно, это неудивительно для вас, но пространство для больших данных и связанных с ними баз данных быстро растет, если не сказать больше. В ходе конференции BigData SV 2018 в Сан-Хосе главный научный сотрудник аналитической компании Wikibon Research Питер Баррис представил выводы, свидетельствующие о том, что доходы от мировой индустрии больших данных, согласно оценкам, вырастут с 35 млрд долларов в 2017 году до 42 млрд долларов в 2018 году. В довершение всего, Burris прогнозирует, что к 2027 году выручка достигнет 103 миллиардов долларов.

Для эффективной обработки всех этих данных интеллектуальные решения ML станут еще более необходимыми, чем сейчас. Очевидно, что ML будет оставаться горячей темой в обозримом будущем. Когда мы в последний раз разговаривали с MapR's Dunning год назад, он подчеркивал, что нужно использовать взвешенный, реалистичный подход к ML для бизнеса. Но год - это долгое время, когда ты говоришь о технологиях. Недавно мы встретились с Даннингом, и, по его словам, со времени нашего последнего разговора ситуация не изменилась. «На этом более высоком уровне мало что изменилось», - сказал Даннинг. «Основная идея рассуждений на основе фактических данных, безусловно, не новость за последний год, но некоторые инструменты изменились».

Имея это в виду, Даннинг также сказал, что на поле больше игроков, чем было год назад, но это не обязательно хорошая вещь. «Одна вещь, которая произошла, это появление все большего количества продавцов, которые говорят о« волшебном »машинном обучении, чтобы сказать противное слово этому», объяснил он. «Существует большое заблуждение, что вы можете просто выбросить свои данные в продукт и получить из него прекрасную информацию».

Почему машинное обучение - это будущее? Почему машинное обучение - это будущее?
Comet.ml хочет изменить то, как мы взаимодействуем с машинным обучением Comet.ml хочет изменить то, как мы взаимодействуем с машинным обучением
Google упрощает машинное обучение с SQL Google упрощает машинное обучение с SQL

По словам Даннинга, ожидание магического результата от ML может быть «неутешительным». «Вам все еще нужно подумать о том, какая проблема на самом деле имеет значение. Вам все еще нужно собирать данные, и вам все равно нужно управлять развертыванием вашей системы», - сказал он. «И эти прагматичные, логистические реалии все еще доминируют в проблеме».

Даннинг не согласен с некоторыми из высокого маркетинга, предлагаемого некоторыми компаниями-разработчиками программного обеспечения. «Ничто из магического искусственного интеллекта даже не решает эту проблему», - сказал он. У него есть совет для бизнеса, чтобы рассмотреть. По его словам, одним из способов обеспечения надлежащей практики является наем конкретного бизнес-аналитика ИИ, чтобы вы могли, чтобы кто-то в вашей компании определил аспекты вашего бизнеса, которые можно улучшить с помощью технологии ML.

«В некоторых случаях это может стать расширением вашего бизнеса для новых возможностей», - объяснил Даннинг. Но в большинстве случаев, однако, он подчеркнул, что найм кого-то, чтобы понять потребности вашей организации и использовать эту информацию для руководства вашей стратегией ОД, имеет решающее значение.