?

Log in

No account? Create an account
fractal

Иван Сторожев


Previous Entry Share Next Entry
fractal

Вопросы тем, кто скачивает мои DJVU

Прошу ответить, мне это важно для работы.
Почти в каждую книжку я вставляю raw OCR и TOC.

Raw OCR — это распознанный, но совершенно не вычитанный текст книги. Я его внедряю в DJVU как текстовый слой. Он увеличивает размер файла, примерно на 10-30%. Позволяет делать копипаст. Кроме того некоторые локальные и серверные поисковики, например Архивариус, умеет индексировать текстовый слой. От меня усилий требует немного, но время обработки увеличивает существенно, т.к. распознавание — это процесс довольно медленный.

TOC — это оглавление, позволяющее переходить на соответствующие разделы книги одним кликом. Видно в правой панели WinDJVU или djview. Размер файла увеличивает мизерно.

Создание и того, и другого занимает у меня время, причем TOC даже больше, поскольку оглавление надо вычитывать, прежде, чем внедрять в файл.
А теперь вопрос. Кому-то эти фишки действительно нужны? Или лучше я буду делать книги быстрее и больше, но без этих фич?

Просьба ответить раздельно по Raw OCR и TOC.



  • 1
vas_s_al February 11th, 2012
Я считаю, что OCR ОЧЕНЬ нужен.
Он значительно облегчает работу по поиску и копированию.
Особенно поиск!
Прочёл книжку, что-то понравилось, страницу не запомнил - как найти?
Кроме того, слой текста можно экспортировать в .тхт файл и читать его на любой электронной книжке, которая Дежавю не понимает. Там, конечно, очепятки, но если речь не идёт о формулах и математике, всё вполне читабельно (я так сейчас Корнфорта читаю).

TOC, на мой взгляд, не особо нужен.
Можно просто открыть лист с оглавлением.


  • 1