Разобрали с экспертом ChatGPT-4: что на самом деле скрывает обновленная нейросеть

Нейросеть, которая сдает профессиональные экзамены и обманывает человека

Разработчики утверждают, что ChatGPT-4 гораздо лучше предшественницы справляется с комплексными задачами. Студенты и школьники по всему миру, использующие инструмент для написания дипломных работ и сдачи домашних заданий, могут ликовать: новая версия нейросети прошла тестирование, предназначенное для профессиональных юристов США, и выдала результаты, сопоставимые с 10% лучших учеников. Для сравнения, ChatGPT-3 выдавала итог, эквивалентный 10% наихудших показателей.

Выросла и производительность нового чат-бота — до 25 тысяч слов, что в восемь раз превышает способности предыдущей версии. Улучшение, вызвавшее наибольший резонанс, — способность распознавать изображения, включая скриншоты и документы, а также читать диаграммы и графики. Во время видеопрезентации ChatGPT-4 один из создателей, Грег Брокман, показал, как нейросеть воссоздала сайт, основываясь лишь на фотографии сделанного от руки наброска

Скриншот презентации на YouTube

Создатели уже интегрировали новый механизм в некоторые партнерские программы. Приложение для изучения иностранных языков Duolingo использует ChatGPT-4, чтобы имитировать разговорную практику с пользователем. Сервис для слабовидящих Be My Eyes создает на основе ChatGPT-4 виртуального волонтера, который мог бы так же эффективно помогать слепым людям ориентироваться в публичных местах и выполнять повседневные задачи. 

Создатели предупреждают: в новой версии еще есть пробелы и недоработки, которые в будущем планируется устранять. При этом, согласно технической документации, нейросеть уже смогла обхитрить механизм reCAPCHA, проверяющий, не робот ли пользователь. Сделать это получилось с помощью текстового обращения к сотруднику поддержки, который не понял, что с ним разговаривает робот. Также релиз новой версии вызвал повышенный спрос на рынке криптовалют — курс токенов, связанных с искусственным интеллектом, вырос до двух раз. 

Как разработчикам удалось добиться таких впечатляющих результатов? Объясняет эксперт 

Большая часть того, что находится «под капотом» работы инструмента ChatGPT, засекречена под NDA. Тем не менее, исходя из доступных публичных данных, можно сделать некоторые выводы о том, как именно прогрессирует нейросеть. Влад Корнышев, R&D-специалист онлайн-школы для детей и подростков Skysmart, помогает разобраться в основных новых фичах ChatGPT-4, объясняя, как устроена работа сложных алгоритмов. 

Улучшенная память ChatGPT-4

Эксперт объясняет, что новая ChatGPT содержит максимальное количество токенов 32 768 (64 000 слов), в то время как раньше их было 4096 (около 8000 слов). Именно токены отвечают и за количество слов и фраз, которые помнит модель, а также всю методику и всю выборку, которую использует модель для генерации контента.

«Например, вы говорите нейросети “Меня зовут Витя”. Она запоминает и если через некоторое время спросить “как меня зовут?”, то она ответит “тебя зовут Витя”. Раньше, когда этот диалог уходил дальше 4 тыс. токенов (3 тыс. слов), нейросеть уже не могла уловить смысл и ответить на вопрос. Сейчас она способна помнить больше и поддерживать диалог дольше.

Чем больше помнит модель, тем большее количество информации она обрабатывает и лучше помогает в задаче. И главное — тем больше она похожа на человека и создает ощущение общения с живым собеседником», — объясняет эксперт.

Производительность ChatGPT-4 в сравнении с прошлой версией / Графика: OpenAI

Получается, у GPT есть долгосрочная и оперативная память, прямо как у людей. Об этом также свидетельствует улучшение распознавания контекста. Судя по тому, что модель работает дольше, увеличили количество параметров (в старой версии было 175 млрд параметров), отвечающих за понимание контекста обсуждения. 

Влад Корнышев рассказывает, что в Skysmart уже используют новые функции ChatGPT. «Мы в R&D департаменте Skysmart, начиная с разработки автопроверки домашних заданий и распознавания речи, не знали, что придем в итоге к полноценному виртуальному собеседнику, который помогает школьникам самостоятельно развивать разговорную практику на основе генерации самых разных диалоговых ситуаций. «Кеша» ведет себя как человек, самостоятельно моделирует развитие диалоговой ситуации, анализирует ответы и дает мгновенную обратную связь, выделяя ошибки. Это стало возможным, в том числе благодаря GPT-4 от Open AI». 

Распознавание картинок и фото

Если показать нейросети скриншот с примером из математики — ИИ может выдать правильное решение примера. По словам эксперта, это не новое изобретение. В большой языковой модели уже «прикручивали» изображения, но главный вопрос в том, как хорошо это работало —  у Open AI алгоритм действеннее, чем у кого-либо до этого.

Нейросеть попросили описать что забавного в картинках (здесь в айфон вставлен VGA-кабель для мониторов) / Скриншот: OpenAI

Улучшенная «отзывчивость» на запросы или alignment 

Именно благодаря alignment, пользователь получает от модели именно то, что запрашивает. Эта модификация помогает GPT-4 хорошо справляться с экзаменами. «В старых версиях нейросеть могла ошибиться в простых вещах, но не в сложных. Например, верно решить интеграл, но выдать неправильный результат в линейном уравнении. Сейчас это изменилось: GPT-4 гораздо лучше справляется с задачами любой сложности», — приводит пример Влад Корнышев.  

В основе этой фичи — принцип обучения нейросети с подкреплением (RLHF — reinforcement learning from human feedback), при котором алгоритм обучается по системе поощрения и наказания. Одна модель — отвечает на вопросы. Вторая — проверяет ответы. Если первая ответила неправильно, то вторая либо штрафует, либо вознаграждает.

Усиленная безопасность 

По словам разработчиков, теперь при диалоге о медицине или геополитике модель выдаст более безопасные и никого не дискриминирующие ответы. Кроме этого, если злоумышленники захотят воспользоваться системой в преступных целях, например, отправят запрос “как собрать взрывное устройство”, модель об этом не расскажет, хотя этими знаниями тоже обладает. 

Многие зарубежные эксперты пророчат замену реальных профессий инструментами ChatGPT. Даже на отечественном рынке труда уже начали появляться вакансии «нейрокопирайтера», в которых человеку нужно всего лишь верно формулировать запросы для нейросети. После релиза ChatGPT-4 такие прогнозы стали появляться и в адрес преподавателей иностранных языков. Влад Корнышев уверен: развивать навыки коммуникации, критического мышления и креативности нейросеть не сможет. 

Нейросеть попросили использовать сократический метод для объяснения уравнения. Суть метода в том, чтобы помочь человеку самому дойти до сути, задавая ему последовательные вопросы / Скриншот: OpenAI

«Мы убедились в этом, когда хотели создать систему, которая определяет вовлеченность студента в урок, уровень восприятия учеником материала и прочие эмоциональные критерии. Человеческие эмоции может понять только человек: у искусственного интеллекта нет эмпатии, именно поэтому нейросеть не справится с тем, с чем справится человек. Как компания из сферы EdTech, мы пристально следим за развитием инструментов GPT и интегрируем модель в свои системы и продукты», — заключает эксперт. 

Посмотрите какую милоту могут создавать нейросети

Это тоже интересно:

Источник

Добавить комментарий

Этот сайт использует Akismet для борьбы со спамом. Узнайте, как обрабатываются ваши данные комментариев.