Тайны архивов Ватикана

Итальянские ученые разработали метод машинного распознавания рукописных текстов и их перевода в цифровой вид. В своей работе исследователи использовали самообучающиеся нейронные сети. Искусственный интеллект показал свою эффективность в многочисленных тестах, и теперь ученым при помощи компьютерных систем предстоит расшифровать документы ватиканских архивов, которые были закрыты от посторонних глаз в течение нескольких веков.

Проект получил название In Codice Ratio, что на латыни означает «Код системы». Разработчики программы решили отталкиваться не от отдельных букв, а от последовательности вертикальных и горизонтальных символов, из которых складываются конкретные литеры. Для обучения нейронной сети участники проекта провели кропотливую работу по сопоставлению 22 букв средневекового латинского алфавита с возможным начертанием этих символов от руки. Данные были загружены в программу, после чего искусственный интеллект стал самостоятельно сопоставлять отсканированные изображения, разбивать слова на буквы и сохранять текст в электронном виде.

Еще одной сложностью для корректного сопоставления текста рукописи и оцифрованной версии документа стал своеобразный языковой барьер. Большинство исторических свидетельств, хранящихся в Ватикане, написано на латыни. Этот мертвый язык хорошо знаком лингвистам, но ранее почти не использовался для обучения нейронных сетей. Исследователям пришлось загрузить в систему наиболее характерные для латыни последовательности букв и слогов. Теперь искусственный интеллект не просто распознает знаки, но и самостоятельно пытается справиться с разночтением символов. Всякий раз программа обращается к своеобразному словарю и отсекает нехарактерные для латыни варианты последовательности букв или выбирает наиболее вероятную версию слова. В тестовых испытаниях разработчикам программы удалось добиться верной расшифровки 96% загруженных текстов.

Успешный запуск проекта «Код системы» привлек внимание историков со всего мира. Перевод документов из ватиканских архивов в электронный вид с использованием интеллектуальных систем распознавания текстов позволит получить доступ к ценным историческим свидетельствам большому количеству исследователей. Будучи одним из крупнейших в мире собраний рукописных документов, секретные архивы Ватикана содержат бумаги, способные изменить современные взгляды на важные исторические события.

 

22.05.2018









 
архив

подписка