Дом Отзывы Использование математики для поиска самых глупых (и самых умных) комментаторов в Интернете

Использование математики для поиска самых глупых (и самых умных) комментаторов в Интернете

Оглавление:

Видео: Маленькое королевство Бена и Холли - Вылазка ⭐Лучшие моменты (Ноябрь 2024)

Видео: Маленькое королевство Бена и Холли - Вылазка ⭐Лучшие моменты (Ноябрь 2024)
Anonim

содержание

  • Использование математики для поиска самых глупых (и самых умных) комментаторов в Интернете
  • В список…
  • Нижняя часть ствола

Когда-то люди надеялись, что Всемирная паутина объединит людей из всех слоев общества в новом духе цифрового кумбаянса. В то время как технология действительно объединила нас беспрецедентными способами, она также дала возможность тем, кто мало интересуется вежливостью, но имеет много свободного времени, чтобы анонимно извергать злобную, фактически недостоверную рвоту слова ВСЕХ КАПОВ по всему Интернету.

Разделы комментариев по всему Интернету перекликаются с вызовами «GAY !!!», «LIBTARD !!!!», «NAZI !!!» и «RON PAUL 2016 !!!!» Именно так Интернет обсуждает насущные проблемы дня. (И давайте не будем забывать о теориях заговора с использованием cray cray, которые вплетаются в совершенно не связанные посты.)

Но вы когда-нибудь задумывались, какому интернет-сообществу не хватает коммуникативных навыков? Конечно, у вас есть мнение по этому вопросу. Мы все можем назвать хотя бы один веб-сайт, когда думаем об этих людях .

К сожалению, любая попытка создать иерархию комментариев неизбежно будет испорчена пятном (или, по крайней мере, внешним видом) предвзятости. Однако, действительно, может быть способ удалить все предубеждения и идеологию из этого вопроса и использовать холодный, управляемый числом анализ относительной глупости различных сообществ комментариев.

«Калькулятор читаемости» на сайте Online-utility.org присваивает оценки в соответствии с рядом различных тестов на читаемость, таких как Индекс Gunning Fog Index.

Эти оценки являются результатом уравнений, которые учитывают количественно определяемые атрибуты, такие как количество слов, предложений и слогов. Уравнение для индекса Ганнинга выглядит так:

Оценка совпадает с количеством лет формального образования в США, которое человеку нужно было бы легко понять в тексте. Таким образом, оценка 12 означает, что она соответствует уровню чтения кого-либо в двенадцатом классе, тогда как оценка 4 означает, что текст был на уровне чтения четвертого класса, и так далее.

Чтобы понять, как это может относиться к Интернету, мы взяли несколько разделов комментариев восьми популярных веб-сайтов из разных уголков англоязычного цифрового Интернета: (перечислены здесь в алфавитном порядке) CNN, Fox Nation, Gawker, New York Times, PCMag (да, мы сами себя включаем), Reddit, The Atlantic и YouTube. Мы проверяли их с помощью калькулятора читабельности в погоне за суровыми фактами о том, у кого самые умные и глупые комментаторы.

Результаты могут вас удивить.

Во-первых, краткий обзор нашей методологии:

Для каждого веб-сайта, включенного в наш опрос, мы выбрали три высоко комментируемых материала для использования в качестве набора данных. Когда это было возможно, мы выбирали из самого комментируемого раздела сайта (или из аналогичного списка «самых популярных» историй - что-то, что указывало на то, что эти статьи были очень активными).

Затем мы скопировали 50 лучших комментариев из каждой истории в документ Word. Затем, с помощью сложной серии операций поиска и замены, мы отделили текст комментария от всего постороннего мусора, такого как аватары, имена комментаторов, подписи времени и т. Д.

Затем мы получили документ, полный чистого, незапятнанного пользователем текста, такого как этот:

Затем мы объединили извлеченный текст в основной текст, который мы поместили в «Калькулятор читаемости».

В качестве быстрого примера мы проанализировали первую главу классического произведения Мермана Дика Германа Мелвилла (доступного здесь как документ общественного достояния) и обнаружили, что он набрал следующие баллы читабельности.

Индекс Ганнинг Тумана: 12.02

Индекс Колман-Ляу: 8, 62

Уровень Flesch-Kincaid: 10.16

ARI (индекс автоматической читаемости): 9, 97

Индекс SMOG: 11, 33

В этом случае оценка Тумана указывает, что текст находится на уровне чтения старшеклассника. Для большинства работ, предназначенных для широкой публики, лингвисты считают, что идеальная оценка составляет где-то около 7 или 8.

Остальные индексы (в каждом из которых используются разные уравнения для расчета балла) показывают, что для изучения Моби Дика может потребоваться образование в возрасте от 8 до 11 классов.

Понял? Хорошо, продолжайте читать, чтобы увидеть, как набрали лучшие сайты в Интернете.

Продолжить чтение: в список>

Использование математики для поиска самых глупых (и самых умных) комментаторов в Интернете