Оцифровка книг в формат DjVu в Linux: конвертирование
Содержание:
1. Шаг первый: подготовка сканера;
2. Шаг второй: сканирование;
3. Шаг третий: обработка;
4.Шаг четвертый: конвертирование (Вы читаете данный раздел).
Теперь приступим к переводу полученных TIFF-файлов в DjVu. Для начала переведем TIFF в один из форматов, понимаемых DjVu-кодером. Для старых книг с пожелтевшей от времени бумагой лучше подходит PPM. Мы не будем заниматься очисткой страниц, их обелением, вычленением текста на фоне и тому подобным. Всё, что нам надо в рамках этой статьи, - перевести книгу как есть в электронный вид. И вот поскольку нам не надо переводить картинки в двухцветный режим (без дополнительных телодвижений такая работа будет вознаграждена совершенно неразборчивым изображением), в качестве выходного формата подойдет PPM. Переводим TIFF-файлы в него командой:
И напишем небольшой скрипт, который надо будет запускать в том же каталоге, где и сканированные изображения. Чтобы его запустить, достаточно записать его в файл и поставить на него атрибут «исполняемый» (или запускать этот файл командой sh). Итак, код:
Пояснение к скрипту: в цикле for мы обрабатываем все файлы с расширением ppm, для каждого из которых вызываем DjVu-кодер c44, который в качестве первого параметра принимает ppm-файл, а вторым параметром мы задаем выходное имя файла - оно будет тем же, что исходное, только с добавлением «djvu» к расширению. Например: было book-0001.ppm, станет -book-0001.ppmdjvu. После выполнения цикла мы получаем набор одиночных файлов формата djvu, просто с непривычным расширением. Теперь надо свести их в один файл, под именем book. djvu. Для этого и служит последняя строка скрипта.
Готово!
Описанный выше алгоритм оставляет широкое поле для опытов по улучшению качества и уменьшению размера электронной книги. Буду рад вашим отзывам, как сделать лучше.
Итак, договоры, предоставленные вашими российскими партнерами в формате DJVU, оцифрованы и подписаны, и теперь пришло самое время начать поиск транспортной компании (http://1000dorog.su/) которая сможет наладить между вами стабильное грузовое сообщение. Я рекомендую Вам остановить свой выбор на компании "1000 ДОРОГ", которая зарекомендовала себя как опытный и надежный грузоперевозчик!
1. Шаг первый: подготовка сканера;
2. Шаг второй: сканирование;
3. Шаг третий: обработка;
4.
Теперь приступим к переводу полученных TIFF-файлов в DjVu. Для начала переведем TIFF в один из форматов, понимаемых DjVu-кодером. Для старых книг с пожелтевшей от времени бумагой лучше подходит PPM. Мы не будем заниматься очисткой страниц, их обелением, вычленением текста на фоне и тому подобным. Всё, что нам надо в рамках этой статьи, - перевести книгу как есть в электронный вид. И вот поскольку нам не надо переводить картинки в двухцветный режим (без дополнительных телодвижений такая работа будет вознаграждена совершенно неразборчивым изображением), в качестве выходного формата подойдет PPM. Переводим TIFF-файлы в него командой:
$ mogrify -format ppm *.tiff
И напишем небольшой скрипт, который надо будет запускать в том же каталоге, где и сканированные изображения. Чтобы его запустить, достаточно записать его в файл и поставить на него атрибут «исполняемый» (или запускать этот файл командой sh). Итак, код:
for i in *.ppm; do
c44 $i 'basename $i'djvu
done
djvm -c book.djvu *.ppmdjvu
c44 $i 'basename $i'djvu
done
djvm -c book.djvu *.ppmdjvu
Пояснение к скрипту: в цикле for мы обрабатываем все файлы с расширением ppm, для каждого из которых вызываем DjVu-кодер c44, который в качестве первого параметра принимает ppm-файл, а вторым параметром мы задаем выходное имя файла - оно будет тем же, что исходное, только с добавлением «djvu» к расширению. Например: было book-0001.ppm, станет -book-0001.ppmdjvu. После выполнения цикла мы получаем набор одиночных файлов формата djvu, просто с непривычным расширением. Теперь надо свести их в один файл, под именем book. djvu. Для этого и служит последняя строка скрипта.
Готово!
Вместо заключения
Описанный выше алгоритм оставляет широкое поле для опытов по улучшению качества и уменьшению размера электронной книги. Буду рад вашим отзывам, как сделать лучше.
Итак, договоры, предоставленные вашими российскими партнерами в формате DJVU, оцифрованы и подписаны, и теперь пришло самое время начать поиск транспортной компании (http://1000dorog.su/) которая сможет наладить между вами стабильное грузовое сообщение. Я рекомендую Вам остановить свой выбор на компании "1000 ДОРОГ", которая зарекомендовала себя как опытный и надежный грузоперевозчик!