Минула беззаботная пора лета и я решил вновь продолжить серию интервью с русскоязычными сторонниками open source. На днях связался с Андреем Боровским, автором YAGF.
Оболочка YAGF предоставляет графический интерфейс для консольных программ распознавания текстовCuneiform
иTesseract
на платформе Linux. Кроме того, YAGF позволяет управлять сканированием изображений, импортом страниц из документов PDF, их предварительной обработкой и собственно распознаванием из единого центра. Программа YAGF также упрощает последовательное распознавание большого числа отсканированных страниц.
Ради эксперимента попробую обратиться к читателям, возможно, у вас созрели свои вопросы к участнику беседы — комментарии открыты, не стесняйтесь высказываться.
Это сообщение «повисит» в блоге некоторое время, а вскоре будет заменено на само интервью.
5 комментариев: ответить
http://www.linux.org.ru/forum/talks/6708136
В чём, по Вашему мнению, заключаются основные преимущества графических оболочек перед консольными, и в чём - недостатки?
В каких случаях, на Ваш взгляд, возникают сложности использования shell и, как правило, у кого?
Спасибо!
1.Планируется ли поддержка DjVu (хотя бы импорта изображений, как сейчас из PDF)?
2.Планируется ли возможность не просто распотрошить файл PDF [и DjVu], а наложить текст на изображение в этих файлах с правильным выравниванием? То есть сделать текстовый слой под изображением (и/или вместо изображения) в PDF или OCR-слой в DjVu, если этот формат будет поддерживаться?
3.Если планируется фича из предыдущего вопроса, можно ли будет вручную откорректировать текст и его расположение прямо в YAGF?
Спасибо за комментарии!
Ваши вопросы очень помогут в подготовке интервью.
Ребята, читайте интервью. Опубликовал недавно.