В «Сбере» объяснили, зачем делают суверенный ИИ

«Суверенный» ИИ — единственный способ получить хорошую модель и снизить риск закрытия доступа. Обучение его с нуля намного дороже, но совсем отказаться от иностранных данных при обучении не получится — «это выстрел себе в ногу»

Михаил Гребенщиков / РБК

Фото: Михаил Гребенщиков / РБК

Входит в сюжеты
В этой статье

«Суверенный» искусственный интеллект (ИИ) — это единственный способ получить модель очень хорошего качества и остаться устойчивым, снизить риск внешних факторов вроде внезапного закрытия доступа, заявил старший вице-президент, руководитель блока «Развитие генеративного ИИ» Сбербанка Антон Фролов в интервью РБК.

В понимании «Сбера» суверенность — это контроль за самым сложным технологическим этапом. Компания изначально обучала свою языковую модель, которая лежит в основе «ГигаЧата», с нуля самостоятельно, не используя открытые архитектуры других игроков, хотя поддержки и развития такой модели нужно гораздо больше GPU (специализированный чип, предназначенный в том числе для ускорения задач ИИ), чем другим игрокам. «У создания ИИ есть несколько технологических шагов. Один из них — претрейн (pre-training, предобучение. — РБК), он самый ресурсоемкий. И если ты хочешь по-настоящему что-то свое делать, тебе критически важен контроль над этим этапом», — говорит Фролов. Если брать open-source модели (доступны для свободного использования, изменения и распространения) и пытаться их модифицировать, по его словам, при адаптации под свои нужды могут сломаться фундаментальные знания модели. Кроме того, в любой момент доступ к каким-то открытым моделям может закрыться или, например, станет недоступна новая версия модели.

При этом при обучении моделей «Сбера», в том числе на этапе претрейна, использовались как российские, так и зарубежные данные, рассказал Фролов. «Основная информация, которая вообще есть в мире, на английском языке. Не использовать данные на английском — это выстрел себе в ногу. Вопрос не в использовании таких данных, а в их дальнейшей очистке, фильтрации и во взвешивании российских данных. При обучении модели российским текстам культурным контекстам и локальным знаниям намеренно придается больший приоритет — чтобы модель отвечала на запросы через призму российской культуры и реалий», — рассказал Фролов, отметив, что суверенность — «это усиливать то, что относится к нашей национальной идентичности».

При этом представитель «Сбера» признал, что есть проблема нехватки российского массива данных. Из-за этого ИИ на запрос пользователя может выдавать ответы, которые базируются на западных данных, — например, при запросе нарисовать Винни-Пуха представит его похожим на героя мультфильма Disney, а не советского. «Суверенность в том числе нужна, чтобы какие-то культурные коды понимать. Россия обладает колоссальным культурным и научным наследием: архивы, библиотеки, исторические документы, которые десятилетиями существовали только на бумаге. Сейчас этот пласт активно оцифровывается отраслью и научным сообществом и российский массив данных последовательно расширяется», — говорит Фролов. По его словам, для развития любых нейросеток всегда «будет недостаточно данных» и, чем больше будет инициатив, которые помогут данные обогащать, тем лучше.

РБК попросил «ГигаЧат» и «Алису AI» последовательно нарисовать Винни-Пуха и вишневую «девятку», затем повторить попытку с Винни и нарисовать его в этой «девятке», а также отдельно советского Винни-Пуха. Результаты ниже.

\

В середине марта Минцифры представило законопроект «Об основах госрегулирования сфер применения технологий искусственного интеллекта», который впервые на законодательном уровне закрепляет правила разработки и использования ИИ в России. Документ предлагает ввести понятие суверенных и национальных моделей ИИ. К ним будут относить решения, которые разрабатывают отечественные специалисты на российских данных, а ключевые права принадлежат гражданам или юрлицам страны. Еще предлагается ввести статус доверенных моделей — тех, что прошли проверку ФСБ и ФСТЭК на безопасность, подтвердили качество по отраслевым стандартам и были внесены в специальный реестр. Последние могут разрешить использовать в госинформсистемах и на объектах критической информационной инфраструктуры (информационные системы и сети связи госорганов, энергетических, финансовых, медицинских, транспортных и ряда др. компаний).

Рассчитывает ли «Сбер» получить статус суверенной и национальной модели для своего ИИ, Фролов комментировать не стал.