В так называемых фермах контента нет ничего нового: сайты массово выпускают новостные статьи, нацеленные на получение дохода от рекламы с помощью кликбейтных заголовков.
Для этих сайтов технология искусственного интеллекта, генерирующая текст, является настоящей находкой. Американская организация Newsguard, специализирующаяся на анализе недостоверной информации
в интернете, в ходе нового исследования на данный момент выявила 49 сайтов, на которых для создания текстов используется
искусственный интеллект.
Фактическое число таких ресурсов, несомненно, намного выше, поскольку Newsguard изначально ограничивала своё исследование семью языками: английским, китайским, чешским, французским, португальским, тагальским и тайским.
Найденные 49 ресурсов были в формате обычных новостных сайтов, но их контент был полностью или частично сгенерирован искусственным интеллектом. Это тревожные результаты.
Многочисленные и мощные инструменты ИИ становятся всё более доступными для общественности, и опасения, что они создают целые новостные агентства - то, что когда-то было предположением учёных в области СМИ - теперь стало реальностью.
Сайты, проверенные Newsguard, имеют безобидные и ненавязчивые названия, которые указывают на авторитетное издательство, например, Market News Reports или Biz Breaking News. Однако часто отсутствуют выходные данные или другая информация об издателе.
Из 29 операторов, с которыми связалась организация, только двое подтвердили, что используют искусственный интеллект. 17 даже не ответили на запросы организации. Однако из статьи часто видно, написана ли она ИИ. Иногда важной частью текста было сообщение от соответствующего чат-бота о том, что он не может реализовать подсказку.
Британская газета The Guardian сама протестировала несколько сайтов и нашла, среди прочего, некролог президенту США Джо Байдену на сайте Celebritiesdeaths.com. За заявлением о том, что он мирно скончался во сне и что вице-президент Камала Харрис теперь займёт его место, последовало примечание о том, что «вводящий в заблуждение контент противоречит политике OpenAI».
Как распознавать сайты с ИИ-контентом
The Guardian также сообщает о грамматически странных, но оптимизированных для
SEO заголовках, постоянных повторениях в текстах и чрезмерно упрощенных формулировках в предположительно научных текстах. Однако не всегда легко распознать контент, созданный ИИ.
В дополнение к отсутствующим выходным данным Newsguard указывает на несколько функций, на которые следует обратить внимание. Некоторые сайты генерируют сотни статей в день, что вряд ли возможно в обычной редакции. Кроме того, многие сайты переполнены
рекламой, поскольку доход от нее является единственной причиной их существования.
Это использование искусственного интеллекта всё ещё находится в зачаточном состоянии. Как отмечает The Guardian, будущие ИИ будут учиться на текстах, созданных другими представителями своего вида.