CuneiForm — это программа для оптического распознавания текста
документов в редактируемый вид. Результаты работы программы можно
редактировать в офисных программах и текстовых редакторах и сохранять в
популярных форматах, проводить по ним полнотекстовый поиск.
CuneiForm является предшественницей систем промышленного
распознавания и понимания документов. Многие технологические ноу-хау,
результаты научных исследований, положенные в основу CuneiForm, успешно
применяются и совершенствуются по сей день в коммерческих продуктах
Cognitive Technologies:
Cognitive Technologies сделала CuneiForm бесплатной программой и
открыла для сообщества OpenSource ее исходные тексты. Новый открытый
проект, в котором может принять учавстие любой желающий, получил
название OpenOCR.
Для координации работы над проектом действует сайт OpenOCR.org c русскоязычным форумом. На этом же сайте осуществляется и поддержка пользователей.
Отзывы и пожелания, новые и интересные вопросы (которые не
обсуждались на форуме) по CuneiForm (OpenOCR) вы можете прислать нам по
электронной почте cuneiform_info@cognitive.ru. Мы не гарантируем ответы на все письма, но на наиболее интересные ответим и/или учтём при размещении информации по программе.
При распознавании с помощью CuneiForm сохраняется структура документа и его форматирование.
Программа распознает таблицы любой структуры и сложности, в том числе и без отображения линий табличной сетки.
Распознаются любые печатные шрифты: книги, газеты, журналы,
распечатки с лазерных и матричных принтеров, тексты с пишущих машинок и
т.п.
Алгоритмы оптического распознавания (OCR, Optical Character
Recognition), встроенные в программу позволяют распознавать текст с
матричного принтера, плохих ксерокопий и факсов.
Распознавание документов более чем на 20 языках: на русском,
английском, немецком, французском, испанском, итальянском, шведском,
украинском и других.
Для повышения качества распознавания в программе используется
словарная проверка. При этом стандартный словарь можно расширить за счет
импорта новых слов из текстовых файлов.
CuneiForm является бесплатной программой и доступна для скачивания и использования всем желающим.
Скачать OCR CuneiForm V.12 (ZIP, 33,3 МБ)
Скачать Cognitive OpenOCR (CuneiForm), русская версия (EXE, 32,1 МБ)
Скачать Cognitive OpenOCR (CuneiForm), english version (EXE, 31,9 МБ)
Скачать исходный код программы OCR Cuneiform (ZIP, 34,4 МБ)
Скачать исходный код интерфейса OCR Cuneiform (ZIP, 7,33 МБ)
Скачать документацию на библиотеки ядра распознавания (ZIP, 228 КБ)