Логотип

Есть одно слово, которое было чрезмерно увеличено в научных статьях по одной причине: они нравится ChatGPT

Есть одно слово, которое было чрезмерно увеличено в научных статьях по одной причине: они нравится ChatGPT

То, что есть научные статьи, написанные ИИ, — это то, что было доказано ранее, вопрос в том, насколько это серьезно. Чтобы узнать масштабы этой практики, группа исследователей просмотрела миллионы тезисов статей, опубликованных на PubMed, и нашла кое-что интересное: есть слово, которое ИИ очень любит, и причина, по которой оно ему так нравится, довольно туманна.

Delve. Его перевод — «копать глубже», и его использование увеличилось в 28 раз в период с 2022 по 2024 год, что по совпадению совпадает с бумом ChatGPT и языковых моделей. Также цитируются другие слова, такие как «подчеркивание» (подчеркивание) или «демонстрация» (разоблачение), с увеличением частоты на x13,8 и x10,7 соответственно. Ни одно из них не является существительным или словом, связанным с содержанием, но больше связано со стилем письма и очень характерно для витиеватого языка, который обычно используют LLM.

Витиеватый язык. Означает ли это, что если мы увидим одно из этих слов в статье, оно было написано с использованием ИИ? Не обязательно, но это резкое увеличение. Исследователи сравнили увеличение количества слов «углубиться» с другими ключевыми словами, такими как, например, пандемия, пик которой пришелся на 2020 год, а спад начался в 2021 году. Увеличение частоты использования слова «углубляться» намного более выражено, чем у всех остальных.

Источник: Science

 

Это не случайно. В процессе создания чат-бота, такого как ChatGPT, есть этап, требующий вмешательства людей для точной настройки ответов; это так называемое обучение с подкреплением на основе обратной связи с человеком (сокращенно RLHF). Оказывается, большая часть рабочих, занимающихся этой переработкой, находится в африканских странах, таких как Нигерия. Угадайте, где эти слова довольно часто используются в формальном английском. Точно, в Нигерии.

Читать  Система персонализации Google связывает Gmail, «Фото» и поиск с Gemini

Африканский стиль. «Углубляться» — довольно распространенное слово в деловом английском языке в Африке, особенно в Нигерии, и оно не единственное. Есть также другие, такие как «leverage», «explore» или «tapestry», которые более распространены в африканском английском. Согласно 311institute, хотя человеческая обратная связь очень мала по сравнению с огромными объемами обучающих данных, она оказывает большое влияние, поскольку именно она определяет тон модели в ответе на нас.

Маркировка данных. Это ключевой шаг в обучении отличным языковым моделям, и за ним должны стоять люди. Проблема в том, что большинство занятых в нем работников — выходцы из бедных стран, таких как Нигерия, Кения, Индия и других. На всякий случай, если бесконечных рабочих дней и смехотворной заработной платы было мало, часто работникам приходилось пересматривать жестокие и очень откровенные изображения, и все это без какой-либо психологической поддержки.

Если вы нашли ошибку, пожалуйста, выделите фрагмент текста и нажмите Ctrl+Enter.

Редактор: AndreyEx

Рейтинг: 5 (1 голос)
Если статья понравилась, то поделитесь ей в социальных сетях:

Оставить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *

тринадцать + двадцать =

Это может быть вам интересно


Загрузка...

Спасибо!

Теперь редакторы в курсе.

Прокрутить страницу до начала