Новости Февраль 7, 2025
Meta снова хочет «спасти мир» — на этот раз, собирая голосовые записи и тексты на разных языках. Компания запустила Language Technology Partner Program, цель которой — собрать десятки часов речевых данных, большие объемы письменных текстов и переведенные фразы на как можно большем количестве языков. Взамен участники получат возможность сотрудничать с Meta над обучением моделей распознавания и перевода речи. А потом, когда все будет готово, ИИ-модели обещают выложить в открытый доступ.
Среди первых участников — правительство Нунавута, северного региона Канады, где говорят на языке инуктут. Meta делает акцент на том, что хочет поддержать малоизученные и недооцененные языки. Всё это идет в унисон с миссией ЮНЕСКО, которая борется за сохранение языкового разнообразия.
Конечно, компания подает проект как чистую филантропию, но не будем наивными. Улучшение технологий распознавания и перевода речи — это прямая выгода для Meta AI и её цифровых продуктов. Чем больше языков знает ИИ, тем лучше работают голосовые ассистенты, автоматический перевод контента, озвучка Reels и другие сервисы компании.
Meta уже тестирует инструмент автоперевода голосов в Instagram Reels, который дублирует речь и синхронизирует губы. А значит, в будущем можно будет смотреть зарубежный контент с оригинальными голосами, но на родном языке.
Но есть нюанс: Meta не славится заботой о языковом разнообразии. Исследования показали, что Facebook пропускал 70% дезинформации на итальянском и испанском, в то время как на английском этот показатель был всего 29%. Плюс, утечки показали, что арабские посты часто ошибочно помечаются как разжигающие ненависть.
Компания обещает улучшить алгоритмы модерации и перевода, но пока это больше похоже на латание дыр, чем на системное решение.
Meta снова играет в благотворительность, но за кулисами — обычная выгода. Сбор речевых данных поможет компании сделать свой ИИ умнее и внедрить его еще глубже в наши устройства. Будет ли от этого реальная польза редким языкам? Возможно. Но в конечном счете Meta заботится о Meta, а не о многоязычном мире.