СпискиЖурналисты больше
не нужны: какие роботы
работают за нас
Как The Guardian, Forbes и LA Times заменяют живых людей машинами
материал подготовил
Николай Удинцев
Сегодня стало известно, что агентство Associated Press будет писать новости о финансовых отчётах компаний с помощью робота. Новая технология стала возможной благодаря компании Automated Insights, чьи алгоритмы будут обрабатывать информацию с серверов агентства по сбору статистики Zacks Investment Research и выдавать сводки за считанные секунды.
Несмотря на обеспокоенность журналистской общественности, шеф-редактор AP настаивает на том, что использование роботов позволит освободить журналистов от рутинной работы и даст возможность сосредоточиться на творческих заданиях. Look At Me вспоминает других роботов, которые уже работают в эпистолярном жанре.
Quakebot сообщает
о землетрясениях
Издание: Los Angeles Times
Программист издания Los Angeles Times Кен Швенке (Ken Schwencke) создал алгоритм, который самостоятельно составляет новостные заметки о землетрясениях. Quakebot умеет обрабатывать сообщения о землетрясениях от Геологической службы США и выбирать из них нужные данные. Этот скрипт вставляет их в заранее написанный шаблон. При этом алгоритм начнёт обрабатывать только те сообщения, магнитуда землетрясения в которых превышает определённое значение. Составленную заметку бот отправляет выпускающему редактору LA Times, который принимает решение о её публикации.
Результат работы
Благодаря работе Quakebot, LA Times опубликовала новость о подземных толчках 17 марта 2014 года через три минуты после сообщения Геологической службы США. Швенке начал работу над новым ботом. Он должен обрабатывать сообщения о преступлениях в окрестностях Лос-Анджелеса.
Пример
«A shallow magnitude 2.7 earthquake aftershock was reported Monday morning four miles from Westwood, according to the U.S. Geological Survey. The temblor occurred at 7:23 a.m. Pacific time at a depth of 4.3 miles. A magnitude 4.4 earthquake was reported at 6.25 a.m. and was felt over a large swath of Southern California. According to the USGS, the epicenter of the aftershock was five miles from Beverly Hills, six miles from Santa Monica and six miles from West Hollywood».
GUARBOT пытается вести криминальную хронику
Издание: The Guardian
Программист издания The Guardian Уилл Франклин (Will Franklin) в качестве эксперимента попытался создать алгоритм, который сможет самостоятельно составить заметку из криминальной хроники.
Чтобы выделить часто используемые в заметках издания слова и фразы, он использовал API The Guardian (The Guardian Open Platform, интерфейс для манипулирования данными газеты). Далее, чтобы вставить в заметки бота необходимые имена собственные, программист взял за основу библиотеку для обработки естественного языка Natural Language Toolkit (NLTK). А при создании структуры «автоматических» заметок Франклин ориентировался на пример генератора случайного текста SCIgen. По его мнению, для работы GUARBOT нужно создать набор правил с пробелами, в которых можно прописать другие правила. В пробелах он предложил указывать виды частей речи (например, «Имя Собственное последний раз видели с Имя Собственное, когда Наречие Глагол»).
Результат работы
GUARBOT сумел составить грамматически правильную заметку. Однако она получается не слишком связной и осмысленной. По мнению Франклина, он не смог дать боту умение определять, какие именно слова нужно подставлять в пробелы. Впрочем, все желающие могут усовершенствовать нерадивого андроида, воспользовавшись исходным кодом, который выложен на GitHub.
Пример
«The crime-ridden family of quinoa has taken US by storm this month. According to Peru, New York has confirmed that quinoa is more story than anything else they’ve ever seen. Quotes from top Yotam Ottolenghi eaters suggest that “crop” is currently clear top, possibly more than ground black pepper. Experts say both Salt and University need to traditionally grow to strengthen a common solution. Finally, it is worth slightly rattling that this article was peeled until it made sense».
Quill делает выводы из финансовых отчётов
Издания: Forbes, The Big Ten Network и другие
Quill — сложный алгоритм на основе технологий искусственного интеллекта, разрабатываемый и продаваемый компанией Narrative Science. Алгоритм «умеет работать» со спортивной статистикой, финансовыми отчётами, рейтингами и другими массивами данных. Для каждого случая он анализирует данные, определяет тенденции и отношения между ними, а также зависимости, «точки перегиба», исключения и другие правила. На основе созданных зависимостей Quill формирует собственные суждения, оценки и «отвечает на вопросы, которые интересны читателю». На последнем этапе алгоритм оформляет суждения в естественном языке. При этом он может создать графики и схемы для заметки, а также излагать данные в разных стилях.
Результат работы
Quill имеет собственную ленту на сайте Forbes, а также пишет новости для сайтов The Big Ten Network и GW Sports. Журналист издания Deadspin не смогла отличить текст Quill от текста настоящего журналиста и признала частичное превосходство алгоритма.
Пример
«Wall Street is high on Steelcase, expecting it to report earnings that are up 15% from a year ago when it reports its first-quarter earnings on Thursday, June 26, 2014. The consensus estimate is 15 cents per share, up from earnings of 13 cents per share a year ago».
«The consensus estimate remains unchanged over the past month, but it has decreased from three months ago when it was 16 cents. For the fiscal year, analysts are expecting earnings of 96 cents per share. Revenue is projected to be 9% above the year-earlier total of $667.1 million at $728.7 million for the quarter. For the year, revenue is expected to come in at $3.12 billion».
«The company has seen improved revenue in the last two quarters. In the most recent quarter, revenue rose 17% year-over-year to $779.4 million. The quarter before that, it rose 8%».
«The majority of analysts (100%) rate Steelcase as a buy. This compares favorably to the analyst ratings of three similar companies, which average 71% buys. All two analysts rate Steelcase as a buy».
StatsMonkey пишет
про бейсбол
Издания: The Big Ten Network и, возможно, другие
В 2010 году разработчик Джейсон Молески (Jason Molesky) создал алгоритм для автоматического написания спортивных заметок StatsMonkey. Его программа использовала базу спортивной статистики StatSheet (включает около 345 тематических сайтов). StatsMonkey мог распознать новости, относящиеся к нужному матчу, выделить среди них наиболее важные и включающие описание игровых моментов. Кроме того, алгоритм мог выделить лучших игроков в игре и писать с точки зрения болельщика одной из команд. Но известно, что StatsMonkey может писать только про бейсбол, а в тексте использует несколько архетипических повествовательных приёмов (например, «это убедительная победа»).
Результат работы
Предполагалось усовершенствовать алгоритм, после чего он сможет писать о других видах спорта, финансовых отчётах, криминальной хронике и переписи населения США. Однако после 2012 года об использовании программы в современных СМИ ничего не слышно.
Пример
«UNIVERSITY PARK — An outstanding effort by Willie Argo carried the Illini to an 11-5 victory over the Nittany Lions on Saturday at Medlar Field. Argo blasted two home runs for Illinois. He went 3-4 in the game with five RBIs and two runs scored. Illini starter Will Strack struggled, allowing five runs in six innings, but the bullpen allowed only no runs and the offense banged out 17 hits to pick up the slack and secure the victory for the Illini. The Illini turned the game into a rout with four in the ninth inning.Strack got the win for Illinois. It was his fourth victory of the season. Strack allowed five runs over 6 2/3 innings. Strack struck out two, walked three and surrendered six hits. Mike Lorentson suffered his sixth loss of the season for Penn State. He went four innings, walked none, struck out two, and allowed six runs. Illinois closer John Anderson got the final seven outs to record his second save of the season».
Робот-репортёр
и Afghan Explorer
В 2010 году исследователи из токийской Intelligent Systems Informatics Lab представили роботизированного репортёра. Испытательная модель могла самостоятельно перемещаться на местности и искать какие-либо «изменения». Заметив нечто подобное, робот оценивает важность изменения, после чего делает фото- или видеосъёмку, расспрашивает прохожих и ищет дополнительную информацию в интернете. Из полученных сведений он может написать небольшой текст и опубликовать его на сайте.
В 2002 году похожий проект представили в MIT. Управляемый оператором Afghan Explorer должен передавать видео и звук из «горячих точек» и эпицентра боевых действий. Робот был построен на основе марсохода Mars Explorer, имел GPS-модуль, спутниковый телефон и веб-камеры для интервью.
Результат работы
BBC отмечало, что Afghan Explorer вызвал большее раздражение со стороны американских военных, чем среди местного населения.
News At Seven
делает видеоролики
В 2009 году сотрудники Северо-Западного университета (США) представили программу News At Seven. Она могла создавать информационные ролики по какому-либо поводу. Для этого программа собирала изображения, видео и текстовые заметки по нужному новостному поводу в интернете, самостоятельно монтировала их и составляла текст. Результат News At Seven оформляла в короткую передачу с двумя нарисованными ведущими, которые озвучивали текст программы.
Результат работы
Выпуски News At Seven не отличались связностью и не создавали иллюзию работы настоящего журналиста.
Кристер Клеруолл
учёный
Шведский учёный Кристер Клеруолл предложил 46 студентам старших курсов факультета СМИ и коммуникаций прочитать две заметки: одна была написана ботом, вторая — журналистом LA Times. Испытуемые отметили, что текст журналиста «хорошо написан» и его «приятно читать». Заметка бота запомнилась им «информативностью» и «объективностью». Однако 27 человек, которые читали текст алгоритма, посчитали, что он написан человеком, а 18 человек, прочитавшие новость журналиста, посчитали, что её написал бот.
Иностранные журналисты не первый год высказывают опасения по поводу того, что со временем их заменят сложные алгоритмы на основе технологии искусственного интеллекта. Те не менее исследователь и декан Школы коммуникации Сами Офера Ноам Латар (Noam Latar) утверждает, что появление роботов, которые будут брать на себя тривиальные задачи, в будущем подтолкнёт журналистов к проведению сложных расследований и созданию более затратных (с точки зрения времени и средств) материалов. Также возможен и третий вариант — когда журналист издания работает «в паре» с алгоритмом, дополняет и уточняет «автоматические» заметки. Так, например, журналисты Los Angeles Times за половину рабочего дня 71 раз обновили материал о землетрясении 17 марта, который утром того же дня составил Quakebot. Поскольку читатель не всегда может отличить текст машины от текста человека, такого сотрудничества могут просто не заметить.
Комментарии
Подписаться