Тайны архивов ВатиканаИтальянские ученые разработали метод машинного распознавания рукописных текстов и их перевода в цифровой вид. В своей работе исследователи использовали самообучающиеся нейронные сети. Искусственный интеллект показал свою эффективность в многочисленных тестах, и теперь ученым при помощи компьютерных систем предстоит расшифровать документы ватиканских архивов, которые были закрыты от посторонних глаз в течение нескольких веков. Проект получил название In Codice Ratio, что на латыни означает «Код системы». Разработчики программы решили отталкиваться не от отдельных букв, а от последовательности вертикальных и горизонтальных символов, из которых складываются конкретные литеры. Для обучения нейронной сети участники проекта провели кропотливую работу по сопоставлению 22 букв средневекового латинского алфавита с возможным начертанием этих символов от руки. Данные были загружены в программу, после чего искусственный интеллект стал самостоятельно сопоставлять отсканированные изображения, разбивать слова на буквы и сохранять текст в электронном виде. Еще одной сложностью для корректного сопоставления текста рукописи и оцифрованной версии документа стал своеобразный языковой барьер. Большинство исторических свидетельств, хранящихся в Ватикане, написано на латыни. Этот мертвый язык хорошо знаком лингвистам, но ранее почти не использовался для обучения нейронных сетей. Исследователям пришлось загрузить в систему наиболее характерные для латыни последовательности букв и слогов. Теперь искусственный интеллект не просто распознает знаки, но и самостоятельно пытается справиться с разночтением символов. Всякий раз программа обращается к своеобразному словарю и отсекает нехарактерные для латыни варианты последовательности букв или выбирает наиболее вероятную версию слова. В тестовых испытаниях разработчикам программы удалось добиться верной расшифровки 96% загруженных текстов. Успешный запуск проекта «Код системы» привлек внимание историков со всего мира. Перевод документов из ватиканских архивов в электронный вид с использованием интеллектуальных систем распознавания текстов позволит получить доступ к ценным историческим свидетельствам большому количеству исследователей. Будучи одним из крупнейших в мире собраний рукописных документов, секретные архивы Ватикана содержат бумаги, способные изменить современные взгляды на важные исторические события.
22.05.2018 |
популярные тэги
наука
интересно
новости
технологии
история
go
golang
программирование
it
искусственный интеллект
путешествия
природа
космос
ai
базы данных
медицина
science
анализ текстов
ии
text mining
робототехника
авто
музыка
роботы
интернет
нейронные сети
robots
space
вокруг света
postgresql
алгоритмы
гитара
животные
оружие
google
nosql
авиация
здоровье
техника
auto
|