Корпус из 95 тыс предложений на ингушском подготовили специалисты для дальнейшей интеграции языка в платформу "Яндекс Переводчик", о чем сообщили в пресс-службе Республики Ингушетии.
Корпус состоит из парных предложений на русском и ингушском соответственно, в его составлении принимали участие разноплановые языковые специалисты и непосредственно носители. На данном этапе подготовленные материалы вычитываются и проверяются, после чего они будут переданы в "Яндекс". Финальным этапом станет добавление ингушского языка в интерфейс онлайн-переводчика.
Координатор проекта Ибрагим Курскиев, главный редактор журнала "Наши лица", отметил важность подобных инициатив для языков коренных малочисленных народов и их дальнейшей цифровой эволюции.
"Это важная работа, позволяющая создать основу для дальнейших технологий: систем синтеза и распознавания речи, электронных словарей, автоматической проверки орфографии. Цифровая среда сегодня диктует свои правила, и наш язык должен быть в ней полноценным участником"
– Ибрагим Курскиев
В дальнейшем планируется расширить корпус в десять раз, увеличив количество предложений до 1 млн, а также сформировать подразделы научной, исторической и терминологической баз данных на ингушском.