Все крупные библиотеки мира давно занимаются переводом книг в цифровой формат, чтобы знания стали еще более доступными для широкой общественности. Некоторые библиотеки применяют автоматизированные системы сканирования, другие же и вовсе производят оцифровку «по старинке» с применением самых обычных сканеров. В любом случае это требует бережного обращения с книгами, а сам процесс занимает много времени из-за необходимости перелистывать страницы, к тому же существуют древние экземпляры, находящиеся в очень плохом состоянии для которых малейшие манипуляции могут быть фатальными. Но теперь создан особый сканер, способный сканировать закрытые книги, при этом их даже не придется перемещать с места.
За созданием высокотехнологичного устройства стоят специалисты Массачусетского технологического института (MIT). Их изобретение работает на основе проникающего излучения терагерцевого диапазона. Что же это такое? Терагерцевое излучение — вид электромагнитного излучения, спектр частот которого расположен между инфракрасным и сверхвысокочастотным диапазонами. По сути это проникающее излучение, наподобие рентгеновского, оно позволяет очень точно дифференцировать области чистой бумаги и области, покрытые чернилами за счет того, что различные химические вещества поглощают этот вид излучения по-разному. Полученные данные проходят через обработку с помощью ряда специальных алгоритмов, которые позволяют сделать изображение каждого символа настолько четким, насколько это возможно, кроме того, дополнительные меры постобработки позволяют восстановить оригинальные формы даже очень сильно искаженных символов.
Как говорят сами создатели,
«Существует большая разница в спектре поглощения терагерцевого излучения чистой бумагой и материалом чернил. Наша система самонастраивается на этот спектральный контраст, который изменяется и зависит в каждом случае от состава бумаги и используемых чернил. Это позволяет нам получить качественные изображения символов, которые достаточно хорошо распознаются традиционным способом оптического распознавания».
Терагерцевый источник создает вспышки излучения, которые отражаются назад каждым из воздушных слоев, находящихся между страницами книги, в итоге отраженные лучи фиксируются особой камерой. Данные с камеры анализируются компьютерной системой и выстраивают конечные последовательности символов на страницах, используя разницу по времени между моментом излучения импульса и временем регистрации отраженного сигнала.
Но, как всегда, есть и ложка дегтя: экспериментальный образец на данный момент может сканировать не более 10 страниц, а при более глубоком сканировании сигнал теряется и создается множество помех, что мешает адекватно выстроить последовательность страниц и порядок расположения символов на них. Но ученые из Массачусетского технологического института не отчаиваются и в будущем планируют улучшить глубину проникновения сканера с помощью увеличения разрешающей способности камеры и увеличения мощности источника терагерцевого излучения.
Ну и напоследок ребята из MIT приготовили вам демонстрационное видео своей новой технологии: