Мансийский язык стал доступен в «Яндекс.Переводчике»

Мансийский язык стал доступен в «Яндекс.Переводчике»

Мансийский язык стал доступен в «Яндекс.Переводчике»

В сервисе «Яндекс.Переводчик» появился мансийский язык. Это стало результатом совместной работы правительства Ханты-Мансийского автономного округа, Югорского научно-исследовательского института информационных технологий (ЮНИИИТ), носителей языка и компании «Яндекс».

В конце 2023 года было подписано соглашение между правительством Югры и компанией «Яндекс» о включении мансийского языка в цифровые сервисы. Переводчики — в основном непрофессиональные носители языка — переводили предложения с русского на мансийский и обратно, формируя корпус данных для машинного обучения. К 2025 году их общее число достигло 300 тысяч, что является значительным объёмом для малоресурсного языка, на котором говорят менее тысячи человек.

Часть корпуса — 140 тысяч пар предложений — была передана «Яндексу», где на их основе началось обучение нейросетей. Машинные переводы дополнительно проверялись и корректировались носителями-переводчиками, что позволило улучшить качество сервиса.

Параллельно ЮНИИИТ создает этнопортал родных языков, где уже размещён корпус мансийского языка, а также сервис по озвучиванию текстов. Проект будет развиваться дальше — как в части расширения цифрового корпуса мансийского языка, так и в оцифровке хантыйского языка разных диалектов.

Подпишись на Новости Югры | Читать нас в MAX

Источник: Telegram-канал "Новости Югры"

Топ

Лента новостей