Форум » Книгочей » Распознавание ЦС текста » Ответить

Распознавание ЦС текста

bsv8845: Кто нибудь имеет практический опыт распознавания церковнословянских текстов, поделитесь впечатлениями, есть ли смысл обучать FineReader?

Ответов - 2

cocpucm: Я лет 8-9 назад пытался распознавать дораскольное издание (у меня были очень качественные сканы), но потерпел неудачу: ФайнРидер определял ряд диакритики как самостоятельную строку. Не знаю, быть может, более свежие версии и свободны от этого бага. Точно знаю, что чада РПЦ МП примерно в то же время смогли распознать единоверческую перепечатку летней части Пролога, да и никонианские издания 19-20 вв. распознаются довольно успешно Поищите в сети, точно должна быть информация

bsv8845: Да там всё вертится вокруг одной схемы с псевдоалфавитом и последующим "парсингом". Надо значит попробовать, может и получится. Если хотя бы 70 % будет успешно распознано уже приличная экономия времени.



полная версия страницы