Российские учёные научили ИИ читать древние иероглифы
22.10.2025 | 18:00 |Междисциплинарная команда из Института искусственного интеллекта AIRI и НИУ ВШЭ создала передовую технологию для работы с одним из самых сложных древних языков. Задача распознавания иероглифов является чрезвычайно сложной, поскольку система должна интерпретировать не 30–40 стандартных букв, а сотни уникальных символов.
Для обучения ИИ-модели использовалась обширная база данных Thesaurus Linguae Aegyptiae — наиболее полное собрание древнеегипетских текстов с переводами.
Чтобы добиться высокой точности, учёные применили:
• Контекстуально-зависимые OCR-модели (оптическое распознавание символов).
• Диффузионные модели, которые генерировали реалистичные изображения для расширения обучающего набора.
Полученные результаты перевода, сначала оцененные автоматическими метриками, были впоследствии проверены и подтверждены профессиональными египтологами.
Разработчики отмечают, что проект направлен на разработку новых технологий распознавания рукописных текстов, что критически важно в условиях нехватки данных для создания и обогащения крупных языковых моделей.
В будущем подобные технологии могут быть интегрированы в мобильные приложения дополненной реальности. Это позволит посетителям музеев просто навести камеру смартфона на экспонаты с иероглифами и мгновенно получить перевод надписей. Кроме того, система значительно упростит процесс обучения для студентов-египтологов.
Доступ к системе уже открыт по запросу для заинтересованных специалистов, а первая научная работа по этой методике была представлена на международной конференции SIGGRAPH 2025.
ORIENT