Дом мнения Большие данные - это просто большая афера | Джон с. Dvorak

Большие данные - это просто большая афера | Джон с. Dvorak

Видео: Nnnnnnn (Ноябрь 2024)

Видео: Nnnnnnn (Ноябрь 2024)
Anonim

Недавно появившийся мем «больших данных» никогда не определялся каким-либо значимым и окончательным образом. Это самый аморфный новый термин, который я видел за последнее десятилетие. Это один из тех терминов «глаз смотрящего», который используется для оживления семинара и, в конечном итоге, для привлечения инвесторов.

Давайте начнем с вопроса, что означают большие данные? Много данных? Больше данных, чем вы можете обработать? Аморфные данные? Из контрольных данных? Полезные данные для анализа? Бесполезные данные? Информационная перегрузка?

Если вы прочитали достаточно о больших данных, это все выше и многое другое. Ключ не в данных, а в том, как обращаться с данными и что делать с самими данными.

Другими словами, как мы можем сделать эту огромную кучу данных, которую нам удалось накопить, полезными новыми и прибыльными способами? Пулы данных могут поступать откуда угодно с помощью различных вычислительных механизмов, таких как сообщения в Facebook, журналы АНБ, списки рассылки, клиенты и т. Д.

Я бы сказал, что большинство читателей этой колонки сами являются хранилищами больших данных. Я только что купил диск на 3 терабайта для резервного копирования. У меня много данных для резервного копирования! Большие данные!

Я могу представить себе полезный инструмент для анализа больших данных, который полиция может использовать, чтобы найти вас виновным в каком-то случайном преступлении, просматривая ваши файлы. Или, по крайней мере, найти что-то, что смутило бы вас. Большие данные!

Все это возвращается к комментарию, сделанному бывшим генеральным директором American Express, который сказал аудитории, что если компания хочет (и это относится ко всем компаниям, выпускающим кредитные карты), она может использовать ваши личные покупательские привычки и тенденции, чтобы собрать воедино досье и обязательно скажите, есть ли у вас роман или нет. Большие данные!

Из того, что я могу сказать, это именно то, что большие данные делают лучше всего, шпионить за людьми.

Популярный в отрасли комментарий гласит, что огромные базы данных, содержащие информацию о вас, будут использоваться для вашей выгоды. Да, вы знаете, так что вы получите s для вещей, которые вам действительно интересны. Таргетированная реклама. Это выгодно всем!

Вот как это работает. Я заинтересован в покупке новой камеры и слышу о новой Bogus One. Я прочитал статью о PCMag.com о камере, затем захожу в Amazon и проверяю цены и отзывы пользователей. Похоже, что никто не любит камеру. Это очевидный кусок дерьма. Все рецензенты избегали камеры. Покупатели ненавидят камеру. Это не камера, которую я хочу. Но программное обеспечение для анализа больших данных решает дать мне сотни объявлений на каждой веб-странице, которую я посещаю, и все они показывают камеру Bogus One. Большие данные!

Это хуже чем это. Если бы дела пошли в другом направлении, и я решил, что мне понравилась камера, и я действительно купил камеру, я все равно получил бы рекламу, побуждающую меня купить камеру. Большие данные!

Таргетированная реклама «больших данных» - самая большая нагрузка на деньги.

Хорошо, так что давайте забудем об этом и перейдем к использованию больших данных для трендов. Большие данные могут найти разные иголки в разных стогах сена. Таким образом, вы получите что-то вроде этого: сорок процентов всех покупателей Subaru - вегетарианцы / веганы, и 80 процентов из них - демократы. Но это число увеличилось до 60 и 90 процентов соответственно, если мы говорим об Subaru Outback. Кроме того, он увеличивается до 99 процентов вегетарианцев / веганов и до 99 процентов демократов, если автомобиль окрашен в зеленый цвет.

Теоретики больших данных проведут полевой день на семинаре с этой информацией. Но он игнорирует все переменные, которые могут изменить расчеты и тенденции, которые бесконечны. Как долго продержатся какие-либо из этих больших данных, если генеральный директор Subaru подъедет к собравшимся в зеленом Outback'е и объявит, что «все киты должны быть уничтожены!»?

Даже не нужно так много, чтобы изменить динамику выводов больших данных. Несмотря на то, что говорит парень American Express, данные на самом деле слепы. Вот почему вы получаете рекламу продуктов, которые вы уже купили.

Большие данные заставили бы вас сделать поспешные выводы.

Если кто-то покупает десять книг о том, как сделать бомбу, значит ли это, что он хочет взорвать Федеральное здание? Что, если он был экспертом по утилизации бомб, и это не было включено в его должность в качестве консультанта полиции? Большие данные пока не могут знать все. Он не может знать, что вы думаете. Я думаю, например, что камера Bogus One отстой. Большие данные не могут этого знать, если меня не допрашивают. И я могу солгать об этом.

Ничто из этого не звучит хорошо или полезно для общества. Прыгать к выводам, делать предположения, действовать на основе ложных предположений. Изгонять публику с бесполезными с.

Большие данные как высокая концепция никогда не будут полностью определять себя и умирать несчастной смертью. Я надеюсь.

Большие данные - это просто большая афера | Джон с. Dvorak