В «Эксмо» рассказали, как используют ИИ для поиска запрещенного контента
Капьев: ИИ анализирует тексты на предмет запрещенного контента в три этапа

Евгений Капьев (Фото: Алексей Белкин / NEWS.ru / Global Look Press)
Искусственный интеллект, который использует издательство «Эксмо» для выявления запрещенного контента в книгах, работает в несколько этапов, сообщил глава издательства Евгений Капьев в ходе пресс-конференции, передает корреспондент РБК.
Вначале текст делят на фрагменты, чтобы алгоритмы могли корректно анализировать контекст.
«Когда мы покупаем права [на иностранную книгу. — РБК], мы проверку запускаем еще на языке оригинала. Потому что если там есть какие-то серьезные проблемы, то, соответственно, мы эту книгу даже не запускаем», — объяснил глава издательства.
После этого система начинает проверку содержимого и выявляет потенциально проблемные места по нескольким категориям — признакам экстремизма, упоминания наркотиков и сексуального контента.
На втором этапе искусственный интеллект исключает очевидные ложные срабатывания, а на третьем — классифицирует нарушение. По словам Капьева, для этого издание использует самые дорогие и продвинутые модели, которые обучены на действующих законах и судебной практике.
«И, соответственно, ключевой принцип системы — машина не принимает окончательное решение», — заключил он.
Ранее система проверки «Эксмо» по ошибке посчитала нарушителем писателя Дениса Драгунского из-за совпадения первых четырех букв его фамилии с английским словом drug («наркотик») — в марте вступили в силу изменения, предусматривающие уголовную и административную ответственность за распространение произведений литературы и искусства с упоминанием наркотиков.
Решение искусственного интеллекта потребовало тогда ручной корректировки.
Тогда Капьев пожаловался, что из-за введения запретов или обязательных маркировок специалисты должны провести проверку более 3 млн наименований книг, вышедших с 1990 года.
Оставайтесь на связи с РБК в MAX.

