OpenAI объяснила причины «глюков» ChatGPT и других языковых ИИ

Исследователи OpenAI опубликовали работу, в которой представили математическое объяснение причины появления так называемых «глюков» у крупных языковых моделей. Под этим термином понимаются уверенные, но ложные ответы, которые генерирует ИИ.

Авторы доказывают, что проблема носит фундаментальный характер и сохраняется даже при использовании идеальных обучающих данных.

Поскольку языковые модели предсказывают ответы слово за словом, вероятность ошибок неизбежно накапливается. В результате общее число неточностей при генерации текста в два раза выше, чем при ответах на простые вопросы «да/нет».

Кроме того, вероятность ошибки растёт, если факт редко встречался в обучающем наборе. Так, при запросе о дате рождения одного из авторов статьи — Адама Калая — современные модели трижды дали разные, но одинаково неверные ответы.

Учёные также выявили проблему в системе оценки ИИ. Девять из десяти популярных бенчмарков, включая используемые Google и OpenAI, не различают ситуацию, когда модель отвечает «не знаю», и когда она выдаёт ошибочный факт. Это стимулирует алгоритмы «угадывать» вместо признания неопределённости.

Предложенное решение заключается во внедрении механизмов самооценки уверенности в ответах и корректировке систем тестирования.

Однако такой подход приведёт к заметному снижению числа уверенных ответов — до 30% запросов могут заканчиваться фразой «не знаю», что, по мнению исследователей, ухудшит пользовательский опыт.

Кроме того, такие модели требуют значительно больших вычислительных ресурсов, что увеличивает стоимость работы систем. Поэтому в массовых потребительских продуктах приоритет пока остаётся за быстрыми и «уверенными» ответами, даже если они содержат ошибки.

Авторы делают вывод: до тех пор, пока бизнес-модель и система оценки ИИ ориентированы на уверенность, а не точность, проблема «глюков» будет сохраняться.

Источник: ScienceAlert

+1
0
+1
0
+1
0
+1
0
+1
0
+1
0
+1
0
Читайте нас в Дзен Новости

Ваш комментарий:

Пожалуйста, введите ваш комментарий!
пожалуйста, введите ваше имя здесь
Are you human? Please solve:Captcha


Статьи по теме

Обзор российских новостных агрегаторов — 2026 год

Рынок новостных агрегаторов в России за последние годы заметно...

Какая проверка уникальности лучше и точнее: text.ru или content-watch.ru

Чей алгоритм проверки уникальности ближе к алгоритмам поисковиков yandex.ru...

Мелисса лекарственная — противовирусное средство, применение, сбор, обработка, бизнес-идея

Мелисса лекарственная (Melissa officinalis), с древних времён известная как...

Душица — польза и применение в народной и современной медицине

О Душице (орегано)Душица — одно из древнейших лечебных растений:...

Шалфей — польза и применение в народной и современной медицине

Шалфей лекарственный (Salvia officinalis) известен человеку тысячелетия: его ценили...

Новое на ГИПОРТ

Shot: Белая акула напала на сотрудника базы ВМС США во Флориде

Акула атаковала сотрудника военно-морской базы ВМС США NSA Panama...

Двери из массива для гостиной: статус и стиль — как не ошибиться

Гостиная — это сердце дома, лицо квартиры или коттеджа....

Китайская письменность: история, иероглифы и как пишут китайцы

Китайская письменность — это не «алфавит побольше». Это другой...

МЧС: пожар на газопроводе в Кизилюрте ликвидирован

Факельное горение на магистральном газопроводе в Кизилюртовском районе Дагестана...

При обстреле ВСУ жилого сектора Горностаевки погибла мирная жительница

В поселке городского типа Горностаевка Херсонской области в результате...

Крупнейшая верфь Индонезии начала переговоры с Россией о новых судах

Индонезийский судостроительный гигант PT PAL Indonesia рассматривает перспективы партнерства...

Дмитрий Пучков раскрыл истинные архетипы вождей СССР в анекдотах

Образы советских вождей в народном фольклоре кардинально отличались от...

Сенат Франции принял версию закона о расходах на оборону без ключевой статьи

Верхняя палата французского парламента, Сенат, одобрила новую редакцию законопроекта,...

Новое на Форуме