OpenAI объяснила причины «глюков» ChatGPT и других языковых ИИ

Исследователи OpenAI опубликовали работу, в которой представили математическое объяснение причины появления так называемых «глюков» у крупных языковых моделей. Под этим термином понимаются уверенные, но ложные ответы, которые генерирует ИИ.

Авторы доказывают, что проблема носит фундаментальный характер и сохраняется даже при использовании идеальных обучающих данных.

Поскольку языковые модели предсказывают ответы слово за словом, вероятность ошибок неизбежно накапливается. В результате общее число неточностей при генерации текста в два раза выше, чем при ответах на простые вопросы «да/нет».

Кроме того, вероятность ошибки растёт, если факт редко встречался в обучающем наборе. Так, при запросе о дате рождения одного из авторов статьи — Адама Калая — современные модели трижды дали разные, но одинаково неверные ответы.

Учёные также выявили проблему в системе оценки ИИ. Девять из десяти популярных бенчмарков, включая используемые Google и OpenAI, не различают ситуацию, когда модель отвечает «не знаю», и когда она выдаёт ошибочный факт. Это стимулирует алгоритмы «угадывать» вместо признания неопределённости.

Предложенное решение заключается во внедрении механизмов самооценки уверенности в ответах и корректировке систем тестирования.

Однако такой подход приведёт к заметному снижению числа уверенных ответов — до 30% запросов могут заканчиваться фразой «не знаю», что, по мнению исследователей, ухудшит пользовательский опыт.

Кроме того, такие модели требуют значительно больших вычислительных ресурсов, что увеличивает стоимость работы систем. Поэтому в массовых потребительских продуктах приоритет пока остаётся за быстрыми и «уверенными» ответами, даже если они содержат ошибки.

Авторы делают вывод: до тех пор, пока бизнес-модель и система оценки ИИ ориентированы на уверенность, а не точность, проблема «глюков» будет сохраняться.

Источник: ScienceAlert

+1
0
+1
0
+1
0
+1
0
+1
0
+1
0
+1
0
Читайте нас в Дзен Новости

Ваш комментарий:

Пожалуйста, введите ваш комментарий!
пожалуйста, введите ваше имя здесь
Are you human? Please solve:Captcha


Статьи по теме

Обзор российских новостных агрегаторов — 2026 год

Рынок новостных агрегаторов в России за последние годы заметно...

Какая проверка уникальности лучше и точнее: text.ru или content-watch.ru

Чей алгоритм проверки уникальности ближе к алгоритмам поисковиков yandex.ru...

Мелисса лекарственная — противовирусное средство, применение, сбор, обработка, бизнес-идея

Мелисса лекарственная (Melissa officinalis), с древних времён известная как...

Душица — польза и применение в народной и современной медицине

О Душице (орегано)Душица — одно из древнейших лечебных растений:...

Шалфей — польза и применение в народной и современной медицине

Шалфей лекарственный (Salvia officinalis) известен человеку тысячелетия: его ценили...

Новое на ГИПОРТ

Пашинян заявил о необходимости уважать Россию как сверхдержаву

Премьер-министр Армении Никол Пашинян заявил об отсутствии планов по...

Ngs24: тела двух школьниц нашли в Красноярском крае с разницей в день

Стало известно, что двух школьниц без признаков жизни обнаружили...

ВЦИОМ: VK Видео впервые стало главным видеосервисом страны

VK Видео стало самой популярной платформой для просмотра длинных...

Яблонная медяница: меры борьбы и профилактика

Яблонная медяница (Cacopsylla mali, также известная как яблонная листоблошка)...

Минобороны: ВС РФ провели учения по ядерной боевой готовности

Вооруженные силы Российской Федерации (ВС РФ) провели комплекс тренировок...

TopWar: ночью ВС РФ нанесли удары по объектам в Одессе и Харькове

Минувшей ночью Вооруженные силы РФ нанесли серию скоординированных ударов...

Началась 2-я волна атаки украинских БПЛА на Невинномысск, идет воздушный бой

Украинские дроны вновь пытаются атаковать город Невинномысск в Ставрополье....

Два промышленных объекта загорелись под Нижним Новгородом из-за атаки БПЛА

В Кстовском районе Нижегородской области вспыхнули пожары на территории...

Минтранс: РЖД могут запустить пассажирские поезда в Китай

РЖД планируют запустить регулярные пассажирские поезда в Китай из...

В Петербурге жертва «схемы Долиной» ослепла на один глаз из-за судов за жилье

В Санкт-Петербурге 38-летняя доцент СПбГУ и научный сотрудник РАН...

Новое на Форуме