YandexGPT

Материал из Википедии — свободной энциклопедии
Перейти к навигации Перейти к поиску
YandexGPT
Логотип программы YandexGPT
Тип Большая языковая модель
Разработчик Яндекс
Первый выпуск 17 мая 2023 года
Последняя версия 3 (28 марта 2024)
Состояние функционирует
Сайт yandex.ru/project/alice/…

YandexGPTнейросеть семейства GPT от компании «Яндекс», которая может создавать и перерабатывать тексты, предлагать новые идеи и учитывать контекст беседы с пользователем.

Для обучения YandexGPT используется датасет, включающий в себя информацию из книг, журналов, газет и других открытых источников из интернета[1]. Нейросеть может ошибаться в фактах и фантазировать, однако по мере обучения будет выдавать всё более точные ответы.

Где используется YandexGPT[править | править код]

YandexGPT — технология, которая используется в различных продуктах для решения разных задач. Нейросеть интегрирована в виртуального помощника «Алису» и доступна в приложениях «Яндекс» и «Яндекс Старт», в «Яндекс Браузере», «Яндекс Станциях», а также в умных телевизорах с «Алисой».

YandexGPT работает на главной странице «Яндекса», в «Поиске»[2], «Маркете», «Лавке»[3], «Практикуме», «Учебнике», «Авто.ру» и других сервисах компании. Компания даёт бизнесу доступ к API нейросети через Yandex Cloud и разрабатывает собственные В2В-решения на её основе.

С июля 2023 года 800 компаний приняли участие в закрытом тестировании YandexGPT[4]. ИТ‑разработчики, банки, ритейл и компании других отраслей могут использовать технологию в двух режимах: API и Playground (интерфейс в консоли Yandex Cloud для тестирования модели и проверки гипотез)[5].

Бизнесу доступны две версии модели: одна работает в асинхронном режиме и лучше справляется с решением сложных задач, а вторая подходит для создания быстрых ответов в режиме реального времени. В результате YandexGPT испытали в десятках сценариев: для контентных задач, техподдержки, создания чат‑ботов, виртуальных ассистентов и т.д.

История[править | править код]

В феврале 2023 года «Яндекс» сообщил, что разрабатывает собственную версию генеративной нейросети ChatGPT в рамках развития языковой модели из семейства YaLM (Yet another Language Model)[6]. Проект получил предварительное название YaLM 2.0, которое впоследствии поменяли на YandexGPT.

17 мая компания представила нейросеть под названием YandexGPT (YaGPT), добавив в своего виртуального ассистента «Алису» специальный навык, позволяющий взаимодействовать с новой языковой моделью[7].

5 июня 2023 года в пресс-службе «Яндекса» сообщили, что нейросеть научилась запоминать контекст беседы и задавать уточняющие вопросы[8].

15 июня 2023 года «Яндекс» добавил языковую модель YandexGPT в приложение для генерации изображений «Шедеврум»[9]. Благодаря этому его пользователи получили возможность создавать содержательные посты с текстом, заголовком и подходящей по смыслу иллюстрацией[10].

В июле 2023 года нейросеть YandexGPT стала доступна бизнесу для создания виртуальных ассистентов и чат-ботов, а также генерирования и структурирования текстовой информации.

27 июня в «Яндексе» сообщили, что нейросеть научилась тезисно пересказывать статьи из интернета. Функция работает с русскоязычными текстами и статьями из интернета объёмом до 30 тысяч знаков[11].

7 сентября 2023 года «Яндекс» представил на конференции Practical ML Conf новую версию языковой модели — YandexGPT 2[12]. По сравнению с предыдущей она способна решать больше видов задач, при этом качество её ответов улучшилось[13]. По утверждению разработчиков, YandexGPT 2 отвечает на запросы пользователей лучше первой версии нейросети в 67 % случаев[14].

14 сентября 2023 года «Яндекс» начал тестировать YandexGPT для создания быстрых ответов на запросы в «Поиске»[15]. Нейросеть в режиме реального времени находит несколько самых подходящих источников по запросу пользователя, делает краткую выжимку каждого из них, а затем выбирает наиболее полезный ответ из получившихся. Он отображается под поисковой строкой вместе со ссылкой на источник.

С 6 октября 2023 года YandexGPT может создавать краткие пересказы русскоязычных видеороликов в интернете[16]. Она обобщает видео длиной от двух минут до четырёх часов, в которых есть речь[17].

28 марта 2024 года Yandex запустил третье поколение нейросетей YandexGPT. Первая версия — YandexGPT 3 Pro предназначена для бизнеса и доступна пользователям Yandex Cloud[18]. По словам разработчиков, на тестах YandexGPT 3 Pro в среднем отвечает лучше, чем YandexGPT 2 в 67 % случаев, а при работе с простыми пользовательскими запросами её результаты оказались выше на 69 %[19].

Обучение Yandex GPT[править | править код]

Обучение проходит в несколько этапов:

1. Pretraining. Модель учит структуру языка и запоминает факты о мире. Ей подаются в обучение терабайты текста из интернета, книг и других общедоступных источников, отобранные с помощью поисковых моделей «Яндекса» и разбитые на небольшие фрагменты[20].

2. Fine-tuning. Эксперты оптимизируют миллиарды параметров модели, собирая большой датасет из сотен тысяч примеров максимально разнообразных задач с хорошими ответами.

Созданием качественных обучающих примеров занимаются AI-тренеры «Яндекса»[21]. Это эксперты широкого круга гуманитарных профессий: журналисты, педагоги, филологи, редакторы, социологи, психологи, филологи[22]. «Яндекс» стал первой в России компанией, которая начала нанимать и обучать таких специалистов.

3. Продуктовые доработки. Модели придают «человеческий характер», чтобы она могла отвечать на вопросы о себе и была более живой в общении[20].

Интересные факты[править | править код]

В октябре 2023 года YandexGPT 2 смогла сдать ЕГЭ по литературе на 55 баллов[23]. При этом минимальный порог, необходимый для поступления в вуз, — 40 баллов. Это первый случай в России, когда искусственный интеллект успешно справился с ЕГЭ, ответив не только на вопросы тестов, но и выполнив творческие задания[24].

Для обучения YandexGPT используются суперкомпьютеры «Яндекса»[25].

Примечания[править | править код]

  1. Нейросеть Яндекса YandexGPT: что это, возможности, как пользоваться. РБК Тренды. Дата обращения: 29 декабря 2023. Архивировано 4 июня 2023 года.
  2. «Яндекс» открыл доступ к тестированию быстрых ответов YandexGPT в «Поиске». Хабр (14 сентября 2023). Дата обращения: 29 декабря 2023. Архивировано 14 января 2024 года.
  3. YandexGPT поможет «Лавке» заполнять карточки товаров по фото этикеток. Хабр (12 сентября 2023). Дата обращения: 29 декабря 2023. Архивировано 14 января 2024 года.
  4. Кейсы с YandexGPT, data-оркестр или бессерверный пайплайн: выбираем самое интересное с Yandex Scale’23. Хабр (29 сентября 2023). Дата обращения: 29 декабря 2023. Архивировано 14 января 2024 года.
  5. «Яндекс» предоставил компаниям доступ к YandexGPT. Коммерсантъ (19 июня 2023). Дата обращения: 29 декабря 2023. Архивировано 29 июня 2023 года.
  6. Кодачигов, Валерий Найдется что: «Яндекс» запустит для поисковика сверхсовременную нейросеть. Известия (1 февраля 2023). Дата обращения: 29 декабря 2023. Архивировано 4 июня 2023 года.
  7. «Яндекс» добавил в «Алису» генеративную нейросеть YandexGPT. Forbes.ru (17 мая 2023). Дата обращения: 29 декабря 2023. Архивировано 4 июня 2023 года.
  8. "Нейросеть YandexGPT научилась запоминать контекст диалога". Ведомости. Архивировано из оригинала 10 июня 2023. Дата обращения: 29 декабря 2023.
  9. «Яндекс» добавил в «Шедеврум» нейросеть YandexGPT для генерации текста. 3DNews Daily Digital Digest. Дата обращения: 29 декабря 2023. Архивировано 14 января 2024 года.
  10. Яндекс встроил нейросеть YandexGPT в приложение Шедеврум. Российская газета (15 июня 2023). Дата обращения: 29 декабря 2023. Архивировано 17 июня 2023 года.
  11. YandexGPT теперь может кратко пересказать текст. Коммерсантъ (27 июня 2023). Дата обращения: 29 декабря 2023. Архивировано 27 июня 2023 года.
  12. "Яндекс" запустил YandexGPT 2. ТАСС. Дата обращения: 14 января 2024. Архивировано 14 января 2024 года.
  13. Вышла новая версия нейросети от Яндекс — YandexGPT 2. Компьютерра (8 сентября 2023). Дата обращения: 29 декабря 2023. Архивировано 13 октября 2023 года.
  14. «Алиса» получила нейросеть YandexGPT 2 — она отвечает на вопросы лучше старой в 67 % случаев. 3DNews Daily Digital Digest. Дата обращения: 29 декабря 2023. Архивировано 28 октября 2023 года.
  15. «Яндекс» начал тестировать быстрые ответы YandexGPT. Сноб (14 сентября 2023). Дата обращения: 14 января 2024. Архивировано 14 января 2024 года.
  16. В "Яндекс.Браузере" появилась функция пересказа видео. ТАСС (6 октября 2023). Дата обращения: 14 января 2024. Архивировано 14 января 2024 года.
  17. Нейросеть "Яндекса" научилась кратко пересказывать видеоролики. Российская газета (6 октября 2023). Дата обращения: 29 декабря 2023. Архивировано 6 января 2024 года.
  18. «Яндекс» представил третье поколение нейросетей YandexGPT. РБК (28 марта 2023). Дата обращения: 30 марта 2023.
  19. 3DNews Daily Digital Digest. Яндекс представил третье поколение нейросетей YandexGPT (28 марта 2024). Дата обращения: 11 апреля 2024.
  20. 1 2 YandexGPT в Алисе: как мы создаём языковую модель нового поколения. Хабр (5 июня 2023). Дата обращения: 29 декабря 2023. Архивировано 5 января 2024 года.
  21. СМИ: «Яндекс» начал нанимать гуманитариев для обучения своей нейросети YaLM 2.0. Хабр (19 апреля 2023). Дата обращения: 29 декабря 2023. Архивировано 14 января 2024 года.
  22. Нейросеть YandexGPT подключили к виртуальному помощнику "Алиса". Какое будущее ждет искусственный интеллект в России. Российская газета (18 мая 2023). Дата обращения: 29 декабря 2023. Архивировано 4 июня 2023 года.
  23. BFM.ru Нейросеть YandexGPT смогла сдать ЕГЭ по литературе. BFM.ru - деловой портал. Дата обращения: 29 декабря 2023. Архивировано 14 января 2024 года.
  24. Нейросеть Яндекса YandexGPT 2 смогла получить проходной балл ЕГЭ по литературе. Код Дурова (12 октября 2023). Дата обращения: 29 декабря 2023. Архивировано 14 января 2024 года.
  25. YandexGPT научилась создавать тексты в режиме реального времени. ТАСС. Дата обращения: 29 декабря 2023. Архивировано 14 января 2024 года.

Ссылки[править | править код]