?

Log in

No account? Create an account
fractal

Иван Сторожев


Previous Entry Share Next Entry
fractal

Вопросы тем, кто скачивает мои DJVU

Прошу ответить, мне это важно для работы.
Почти в каждую книжку я вставляю raw OCR и TOC.

Raw OCR — это распознанный, но совершенно не вычитанный текст книги. Я его внедряю в DJVU как текстовый слой. Он увеличивает размер файла, примерно на 10-30%. Позволяет делать копипаст. Кроме того некоторые локальные и серверные поисковики, например Архивариус, умеет индексировать текстовый слой. От меня усилий требует немного, но время обработки увеличивает существенно, т.к. распознавание — это процесс довольно медленный.

TOC — это оглавление, позволяющее переходить на соответствующие разделы книги одним кликом. Видно в правой панели WinDJVU или djview. Размер файла увеличивает мизерно.

Создание и того, и другого занимает у меня время, причем TOC даже больше, поскольку оглавление надо вычитывать, прежде, чем внедрять в файл.
А теперь вопрос. Кому-то эти фишки действительно нужны? Или лучше я буду делать книги быстрее и больше, но без этих фич?

Просьба ответить раздельно по Raw OCR и TOC.



  • 1
ivanov_petrov January 31st, 2012
точно не помню, кажется, я несколько раз скачивал предлагаемые книги.
Опять же не помню, пользовался ли именно при их чтении текстовым слоем. Но мне кажется, эти инструменты существенно улучшают файл. Часто можно и без них, но вот захочется скопировать цитату - и очень приятно, когда есть такая возможность. С оглавлением те же рассуждения. Мне кажется, если разница не в разы, не стоит делать больше, но картиночных книг.

  • 1