GigaChat

Материал из Википедии — свободной энциклопедии
Перейти к навигации Перейти к поиску
GigaChat
Тип Большая языковая модель
Разработчик Сбер
Первый выпуск 24 апреля 2023 года
Состояние функционирует
Сайт developers.sber.ru/porta…

GigaChat — сервис на основе искусственного интеллекта, способный общаться с пользователями в режиме диалога, генерировать по запросу тексты и изображения и писать программный код. Данный чат-бот разработан Сбером и поддерживает русский и английский языки. GigaChat использует генеративный искусственный интеллект на базе больших языковых моделей.

Технологии[править | править код]

GigaChat основан на нейросетевом ансамбле NeONKA (NEural Omnimodal Network with Knowledge-Awareness), в который входят модели ruGPT-3.5 с 13 млрд параметров, Kandinsky 2.1, ruCLIP и FRED-T5. Для обучения NeONKA использовались книги и новости на русском и английском языках, разговорная речь, научные статьи и другие данные общим объемом 300 Гб. Обучение нейросетевой модели производится при помощи метода оценки ответов, которые затем учитываются в дальнейшем обучении.

Для генерации изображений GigaChat использует модель Kandinsky 2.1. В будущем в сервис планируется добавить работу со звуком и другими инструментами.

Обучение программному коду проводилось с помощью части открытого сета с кодом The Stack от коллаборации исследователей BigCode и различных задач по программированию[1].

История[править | править код]

В апреле 2023 года Сбер запустил закрытую бета-версию собственного чат-бота GigaChat, который в отличие от ChatGPT способен поддерживать мультимодальное взаимодействие и более грамотно общаться на русском языке[2].

В августе GigaChat был встроен в умные колонки Сбера SberBoom и SberBoom Mini[3].

В сентябре Сбер открыл публичный доступ к GigaChat в веб-версии по регистрации с помощью Сбер ID и в некоторых своих умных устройствах[4]. Вскоре GigaChat был запущен в Telegram[5] и стал доступен на всех умных устройствах Сбера и в мобильном приложении Салют на Android. Также Сбер выпустил программный интерфейс GigaChat API для доступа бизнеса к модели GigaChat[6]. В октябре чат-бот GigaChat стал доступен во ВКонтакте[7].

В ноябре Сбер объявил о разработке новой языковой модели на 29 млрд параметров, на которой будет основана следующая версия GigaChat[8].

В декабре для компаний и разработчиков вышли модели GigaChat Lite и GigaChat Pro для создания собственных приложений и оптимизации бизнес-процессов[9].

В январе 2024 года GigaChat обогнал версию ChatGPT-3.5 по качеству ответов на английском и русском по результатам экзамена MMLU (Massive Multitask Language Understanding). На тот момент количество пользователей GigaChat достигло более 2,5 млн человек[10].

В марте деловой журнал Arabian Business опубликовал результаты исследования агентства ChipAI по выявлению 10 лучших больших языковых моделей в мире, в котором GigaChat занял 4 место. В ходе слепых тестов аналитики оценили модели ИИ в решении таких задач, как языковой перевод, творческое письмо, генерация кода и анализ данных. GigaChat был признан лучшим в работе на русском языке и получил высокий балл за ответы на английском языке[11].

К середине марта 2024 года общая численность аудитории GigaChat и Kandinsky составила 18 млн пользователей[12].

Цензура[править | править код]

«Медузой» было замечено, что нейросеть GigaChat не готова разговарить об Украине, о вторжении России на Украину, статусе Крыма, ДНР и ЛНР. Также было замечено, что после трёх вопросов на эту тематику нейросеть будет работать только на сайте. Данную цензуру можно обойти, задав вопросы, косвенно относящиеся к тематике. Нейросеть также не готова разговаривать о Владимире Путине, Владимире Зеленском, Михаиле Саакашвили, Алексее Навальном, Илье Яшине, Юлии Навальной и рассказывать какие-либо сведения из их биографии[13]. Подвержена цензуре тема выборов президента России в 2008 году и памятников Степану Бандере[13].

Примечания[править | править код]

  1. Возможности GigaChat. ПАО СберБанк. — документация. Дата обращения: 17 мая 2024.
  2. «Сбер» запустил свой аналог ChatGPT. Forbes. — новость. Дата обращения: 17 мая 2024.
  3. Сбер встроил нейросеть GigaChat в умные колонки. ТАСС. — новость. Дата обращения: 17 мая 2024.
  4. "Сбер" открыл публичный доступ к нейросети GigaChat. РИА Новости. — новость. Дата обращения: 17 мая 2024.
  5. Российский аналог Chat GPT от Сбера официально появился в Telegram. Ferra. — новость. Дата обращения: 17 мая 2024.
  6. Искусственный интеллект Сбера GigaChat стал доступнее. Телекомпания НТВ. — новость. Дата обращения: 17 мая 2024.
  7. Чат-бот «Сбера» появился во ВКонтакте: как запустить. Hi-Tech Mail.ru. — новость. Дата обращения: 17 мая 2024.
  8. «Сбер» анонсировал внедрение новой языковой модели в сервис GigaChat. РБК. — новость. Дата обращения: 17 мая 2024.
  9. Бизнесу и разработчикам стал доступен самый мощный искусственный интеллект Сбербанка — GigaChat Pro. CNews. — новость. Дата обращения: 17 мая 2024.
  10. Созданная Сбером нейросеть обогнала ChatGPT по качеству ответов на английском. Газета.Ру. — новость. Дата обращения: 17 мая 2024.
  11. AI Benchmarking Guide 2024: Top 10 world products. Arabian Business. — news. Дата обращения: 17 мая 2024.
  12. Количество пользователей GigaChat и Kandinsky достигло 18 млн. Известия. — новость. Дата обращения: 17 мая 2024.
  13. 1 2 Дмитрия Медведева взбесило, что YandexGPT не хочет рассказывать про Бандеру Знал бы он, о чем еще умалчивают нейросети «Яндекса» и «Сбера» (иногда они даже забывают, что сам Медведев был президентом). Meduza. Дата обращения: 21 мая 2024.