Вторник, 17 марта, 2026
0.2 C
Москва

OpenAI объяснила причины «глюков» ChatGPT и других языковых ИИ

Исследователи OpenAI опубликовали работу, в которой представили математическое объяснение причины появления так называемых «глюков» у крупных языковых моделей. Под этим термином понимаются уверенные, но ложные ответы, которые генерирует ИИ.

Авторы доказывают, что проблема носит фундаментальный характер и сохраняется даже при использовании идеальных обучающих данных.

Поскольку языковые модели предсказывают ответы слово за словом, вероятность ошибок неизбежно накапливается. В результате общее число неточностей при генерации текста в два раза выше, чем при ответах на простые вопросы «да/нет».

Кроме того, вероятность ошибки растёт, если факт редко встречался в обучающем наборе. Так, при запросе о дате рождения одного из авторов статьи — Адама Калая — современные модели трижды дали разные, но одинаково неверные ответы.

Учёные также выявили проблему в системе оценки ИИ. Девять из десяти популярных бенчмарков, включая используемые Google и OpenAI, не различают ситуацию, когда модель отвечает «не знаю», и когда она выдаёт ошибочный факт. Это стимулирует алгоритмы «угадывать» вместо признания неопределённости.

Предложенное решение заключается во внедрении механизмов самооценки уверенности в ответах и корректировке систем тестирования.

Однако такой подход приведёт к заметному снижению числа уверенных ответов — до 30% запросов могут заканчиваться фразой «не знаю», что, по мнению исследователей, ухудшит пользовательский опыт.

Кроме того, такие модели требуют значительно больших вычислительных ресурсов, что увеличивает стоимость работы систем. Поэтому в массовых потребительских продуктах приоритет пока остаётся за быстрыми и «уверенными» ответами, даже если они содержат ошибки.

Авторы делают вывод: до тех пор, пока бизнес-модель и система оценки ИИ ориентированы на уверенность, а не точность, проблема «глюков» будет сохраняться.

Источник: ScienceAlert

+1
0
+1
0
+1
0
+1
0
+1
0
+1
0
+1
0
Читайте нас в Дзен Новости

Ваш комментарий:

Пожалуйста, введите ваш комментарий!
пожалуйста, введите ваше имя здесь


Статьи по теме

Мелисса лекарственная — противовирусное средство, применение, сбор, обработка, бизнес-идея

Мелисса лекарственная (Melissa officinalis), с древних времён известная как...

Душица — польза и применение в народной и современной медицине

О Душице (орегано)Душица — одно из древнейших лечебных растений:...

Шалфей — польза и применение в народной и современной медицине

Шалфей лекарственный (Salvia officinalis) известен человеку тысячелетия: его ценили...

Как выбрать качественный зерновой кофе и правильно приготовить

В жизни каждого человека, который выпивает более 3 чашек...

Топ-3 бизнес-идей по продаже напитков

Если у вас появилась идея открыть кафе или бар,...

Новое на ГИПОРТ

Двух девушек из Калмыкии задержали в Москве в ходе антимигрантского рейда

В Москве полиция провела антимигрантский рейд на складе маркетплейса...

Как продвигать в интернете сайт завода или промышленного предприятия

Продвижение сайта промышленного предприятия (завода, фабрики, производственного цеха) кардинально...

Попавшие под винты речного трамвая в Москве являлись ветеранами гребного спорта

Трагический инцидент с мужчинами, занимавшимися греблей на спортивном судне...

Нейросеть Grok посчитала фальшивым видео с опровергающим свою смерть Нетаньяху

Нейросеть Grok посчитала фальшивкой видеозапись из кофейни, в котором...

Как замешать гипс для формы из силикона

Для литья гипса в силиконовую форму важно получить смесь...

В Ярославле педагог отсудила компенсацию за сгенерированное ИИ-видео

Родителям школьника из Ярославля было вынесено постановление суда о...

Остекление балконов и лоджий в Беларуси: теплый и холодный профиль

Что важно учитывать при остеклении балконов и лоджий в...

Франко-российский журналист Андриан Боке оказался объектом санкций ЕС

Европейский Союз намерен внести в свой санкционный перечень франко-российского...

Твердотельные реле Autonics: понятный гид по выбору

Что такое твердотельное реле и зачем оно нужно?Представьте обычный...

Новое на Форуме