Мансийский язык стал доступен в «Яндекс.Переводчике»
В сервисе «Яндекс.Переводчик» появился мансийский язык. Это стало результатом совместной работы правительства Ханты-Мансийского автономного округа, Югорского научно-исследовательского института информационных технологий (ЮНИИИТ), носителей языка и компании «Яндекс».
В конце 2023 года было подписано соглашение между правительством Югры и компанией «Яндекс» о включении мансийского языка в цифровые сервисы. Переводчики — в основном непрофессиональные носители языка — переводили предложения с русского на мансийский и обратно, формируя корпус данных для машинного обучения. К 2025 году их общее число достигло 300 тысяч, что является значительным объёмом для малоресурсного языка, на котором говорят менее тысячи человек.
Часть корпуса — 140 тысяч пар предложений — была передана «Яндексу», где на их основе началось обучение нейросетей. Машинные переводы дополнительно проверялись и корректировались носителями-переводчиками, что позволило улучшить качество сервиса.
Параллельно ЮНИИИТ создает этнопортал родных языков, где уже размещён корпус мансийского языка, а также сервис по озвучиванию текстов. Проект будет развиваться дальше — как в части расширения цифрового корпуса мансийского языка, так и в оцифровке хантыйского языка разных диалектов.









































