Мансийский язык стал доступен в «Яндекс.Переводчике»
Мансийский язык стал доступен в Яндекс.Переводчике
В сервисе Яндекс.Переводчик появился мансийский язык. Это стало результатом совместной работы правительства Ханты-Мансийского автономного округа, Югорского научно-исследовательского института информационных технологий (ЮНИИИТ), носителей языка и компании Яндекс.
В конце 2023 года было подписано соглашение между правительством Югры и компанией Яндекс о включении мансийского языка в цифровые сервисы. Переводчики в основном непрофессиональные носители языка переводили предложения с русского на мансийский и обратно, формируя корпус данных для машинного обучения. К 2025 году их общее число достигло 300 тысяч, что является значительным объёмом для малоресурсного языка, на котором говорят менее тысячи человек.
Часть корпуса 140 тысяч пар предложений была передана Яндексу, где на их основе началось обучение нейросетей. Машинные переводы дополнительно проверялись и корректировались носителями-переводчиками, что позволило улучшить качество сервиса.
Параллельно ЮНИИИТ создает этнопортал родных языков, где уже размещён корпус мансийского языка, а также сервис по озвучиванию текстов. Проект будет развиваться дальше как в части расширения цифрового корпуса мансийского языка, так и в оцифровке хантыйского языка разных диалектов.
Подпишись на Новости Югры | Читать нас в MAX