Оболочка YAGF предоставляет графический интерфейс для консольных программ распознавания текстовCuneiform
иTesseract
на платформе Linux. Кроме того, YAGF позволяет управлять сканированием изображений, импортом страниц из документов PDF, их предварительной обработкой и собственно распознаванием из единого центра. Программа YAGF также упрощает последовательное распознавание большого числа отсканированных страниц.
Ради эксперимента попробую обратиться к читателям, возможно, у вас созрели свои вопросы к участнику беседы — комментарии открыты, не стесняйтесь высказываться.
Это сообщение «повисит» в блоге некоторое время, а вскоре будет заменено на само интервью.
http://www.linux.org.ru/forum/talks/6708136
ОтветитьУдалитьВ чём, по Вашему мнению, заключаются основные преимущества графических оболочек перед консольными, и в чём - недостатки?
ОтветитьУдалитьВ каких случаях, на Ваш взгляд, возникают сложности использования shell и, как правило, у кого?
Спасибо!
1.Планируется ли поддержка DjVu (хотя бы импорта изображений, как сейчас из PDF)?
ОтветитьУдалить2.Планируется ли возможность не просто распотрошить файл PDF [и DjVu], а наложить текст на изображение в этих файлах с правильным выравниванием? То есть сделать текстовый слой под изображением (и/или вместо изображения) в PDF или OCR-слой в DjVu, если этот формат будет поддерживаться?
3.Если планируется фича из предыдущего вопроса, можно ли будет вручную откорректировать текст и его расположение прямо в YAGF?
Спасибо за комментарии!
ОтветитьУдалитьВаши вопросы очень помогут в подготовке интервью.
Ребята, читайте интервью. Опубликовал недавно.
ОтветитьУдалить