Документация Scan Tailor
Материал из Bryansk Linux Users Group.
Версия 0.9.1 beta (build 20090121)
Содержание |
Введение
Scan Tailor (tailor по-английски - портной) – это интерактивный инструмент для пост-обработки сканированных страниц (сканы). Он делает такие операции как разрезание страниц, компенсация наклона, добавление/удаление полей, и другие. Вы даете ему необработанные сканы, а в результате получаете страницы, готовые для печати или сборки в PDF или DJVU файл.
Сканирование, оптическое распознавание символов, а также сборка многостраничных документов не входят в задачи проекта.
Scan Tailor написан на C++ с использованием Qt и выпускается под лицензией GPL версия 3.
Сайт программы: http://scantailor.sourceforge.net.
Внимание! Проект находится в разработке и пока не готов к реальному использованию. Тем не менее, вы можете оценить прогресс, которого мы добились, посмотрев скриншоты или скачав последнюю сборку. Обновление: последняя сборка уже может выполнять реальную работу!
В процессе развития программы будет обновляться и документация по ней.
Системные требования
Операционная система: MS Windows, GNU/Linux.
Для Linux и FreeBSD должны быть установлена библиотека Qt версии не ниже 4.2.1(проверить!).
Первый запуск
Для ОС MS Windows:
Программа работает без установки. Надо распаковать архив и запустить файл scantailor.exe.
Для ОС GNU/Linux:
Если Вы установили Scan Tailor, то в главном меню (KDE/Gnome) должен был появиться ярлык Scan Tailor. Щелкните на нём для запуска Scan Tailor.
Scan Tailor можно также запустить из консоли дав команду:
$ scantailor
При первом запуске появится окно, в котором Вы можете выбрать "Новый проект" или "Открыть проект":
"Новый проект" - создает новый проект.
"Открыть проект" - открывает проект. Проекты программы Scan Tailor имеют резрешение "ScanTailor".
При создании нового проекта появится окно "Файлы проекта":
"Директория ввода" – папка, где находятся исходные сканы.
"Директория вывода" – папка, куда будут сохранены обработанные сканы.
"Файлы не в проекте" – список файлов, находящихся в папке, указанной в "Директории ввода". Можно выбрать файлы для обработки вручную. Нажатием на кнопку "Выбрать все" будут выбраны все сканы.
"Файлы в проекте" – список файлов, включенный в проект для обработки. Для удаления всех файлов можно также воспользоваться кнопкой "Выбрать все".
Кнопки "вправо" и "влево" между "Файлы не в проекте" и "Файлы в проекте" соответственно добавляют в проект и удаляют из проекта выбранные сканы.
Главное окно Scan Tailor
- список этапов обработки сканов.
- параметры обработки для каждого этапа.
- центральная зона. Это основное рабочее поле, здесь выполняется работа на сканами.
- лента предпросмотра. Предпросмотр сканов в уменьшенном виде удобен для первоначальной оценки результатов, а также быстрого перехода к нужному скану.
Меню программы
Меню "Файл":
Файл->Сохранить проект – сохраняет проект (Ctrl+S);
Файл->Сохранить проект как ... – сохраняет текущее состояние проекта под новым именем.
Меню "Обработка":
Обработка->Запустить пакетную обработку – запуск обработки всех сканов в проекте на том этапе (вид обработки), который активен в текущий момент;
Обработка->Остановить пакетную обработку – принудительная остановка пакетной обработки.
Меню "Инструменты":
Инструменты->Режим отладки – предназначен только для разработчиков. В центральной зоне появляются несколько вкладок для детального контроля процесса обработки.
Этапы обработки
Добавив сканы в проект, их можно обработать в несколько этапов:
Исправление ориентации
Настраиваются следующие параметры:
Поворот – повернуть скан. Зелёная стрелка показывает текущую настройку команды "поворот".
Область применения:
Применить к ... – область применения изменённых вручную параметров. Если изменения не вносились, то текущие параметры применяются для всех сканов.
Только к этой странице (уже применено) – изменение применяется только к текущей странице (используется по-умолчанию).
Ко всем страницам в диапазоне – изменение применяется к указанному диапазону. По-умолчанию предлагается применить ко всем сканам.
К каждой второй странице диапазона – изменение применяется к текущему скану и через один после него. Этот режим полезен для настройки ко всем четные/нечетным страницам.
Разрезка страниц
На этом этапе сказывается тип скана: 1 страница или разворот. А также можно выбрать для обработки только одну из страниц разворота.
Настраиваются следующие параметры:
Тип разреза – выбор способа разрезки скана в зависимости от его содержания. Кнопками выбирается один из трех вариантов: 1 страница (целиком); половина разворота; разворот.
Кнопка Изменить – в окне Разрезание страниц настраиваются:
- Тип разреза: автоматически/вручную;
- Область применения: Только эта страница/Все страницы.
Разделительная линия – выбор режима автоматически/вручную.
В случае, если выбран 2-й тип разреза (половина разворота), эта настройка будет иметь вид:
Вручную здесь можно указать какую из половинок разворота следует обрабатывать. Зеленая стрелка показывает текущую настройку.
В зависимости от типа разреза в центральной зоне скан будет выглядеть следующим образом:
Вертикальная синяя линия указывает линию разреза. Залитая цветным фоном зона является зоной обработки, "полезной зоной", а белая (см. центральный рисунок) - необрабатываемой зоной.
Компенсация наклона
Компенсируется наклон страниц, появляющийся при неправильном расположении книги в сканере, в том числе присканировании разворотов толстых книг. (проверить!)
Компенсация выполняется для всей страницы целиком. И не может выправить "кривые хвосты", часто возникающие ближе к середине разворота книги при сканировании.
Если автоматическая компенсация наклона неудовлетворительна, можно вручную указать значение угла поворота, "играя им". Направление поворота определяется знаком у величины наклона: "+" – против часовой стрелке; "-" – по часовой стрелки.
Полезная область
Определяется область с "полезным" содержанием (залито цветом). Эта область в дальнейшем будет определять будущие размеры обработанных сканов. Всё, что не попало в эту область будет удалено. (проверить!)
Для корректировки области нужно перетаскивать её границы мышью.
При корректировке границ полезной области, будет активна кнопка "Вручную".
Макет страницы
К полезной области "наращиваются" поля с заданными значениями.
Для корректировки области нужно перетаскивать мышью и внутренние, и внешние сплошные границы. При этом меняться будет только величина полей. Полезная область остается неизменной. Настраиваются следующие параметры:
Поля – настраиваются поля для будущих страниц по ряду параметров. В частности:
- Единица измерения:
- Величина полей: сверху, снизу, слева, справа.
- Замок – его состояние определяет будут ли противоположные поля одинаковыми
или разными
. В первом случае при изменении одного из полей второе будет изменяться синхронно. Во втором - назначать величину всехполей можно индивидуально.
- Применить к ... – описание см. выше.
Выравнивание – настраивается способ выравнивания полезной области:
- Выровнять с другими страницами – определяет будут ли все страницы в проекте иметь одинаковые размеры. Выключение этого параметра приведет к независимому определению размеров всех страниц.
- 9 кнопок позволяют визуально задать способ выравнивания полезной области к полям будущей страницы.
- Применить к ... – описание см. выше.
Самая широкая страница – ссылка на страницу, имеющую самую большую "индивидуальную" ширину.
Самая высокая страница – ссылка на страницу, имеющую самую большую "индивидуальную" высоту.
Последние два параметра определяют размеры всех страниц при условии включенной галки на Выровнять с другими страницами.
Вывод
Создается результирующая страница. Результат отображается в Центральной зоне программы. Также создается готовый файл для текущей страницы.
Для страниц, которые ещё не обработаны на последнем этапе или тех, для которых были внесены изменения в найстройках, в окне ленты предпросмотра появляется знак вопроса:
После обработки скана знак вопроса исчезнет. Настраиваются следующие параметры:
Разрешение вывода (DPI) – кнопокой "Изменить" можно вручную указать разрешение для выходных файлов:
Режим – выбирается режим вывода готовых страниц:
В зависимости от выбранного режима меняются дополнительные параметры настройки вывода.
Черно-белый режим:
Разрешение вывода (DPI) – кнопокой "Изменить" можно вручную указать разрешение для выходных файлов.
Двухтоновый режим будет удален по причине непопулярности.
Цветной / Серый режим:
Смешанный режим:
Смешанный режим применяется для проектов, в которых присутствуют сканы с полутоновыми картинками (в градациях серого или цветные). При этом вся страница бинаризуется как в режиме Черно-белый, а автоматичсеки найденные полутоновые картинки без изменений накладываются на черно-белый результирующий рисунок. В этом режиме также используется выравнивание освещения, причем оно делается даже для цветных картинок.
Для получения результирующий файлов для всего проекта запускаем Пакетную обработку: Обработка->Запустить пакетную обработку. В папку для вывода, настроенную при создании проекта, будут сохранены результаты обработки.
Выходные форматы:
Вывод осуществляется в формат TIFF. В режиме Черно-белый - со сжатием G4Fax; для цветных/серых и смешанных - со сжатием LZW.
Описание работы в программе Scan Tailor
Последовательность действий (кратко):
- При необходимости, вручную поправить ориентацию страниц на стадии "Исправление ориентации".
- Переходим на этап "Полезная область" и там Запусаем пакетную обработку: Обработка->Запустить пакетную обработку. Эта стадия на данный момент самая проблемная - на ней большинство ошибок и возникает.
- Правим ошибки этапа "Полезная область" просмотром всех страниц вручную. Горячие клавиши для перехода по страницам: Page Up и Page Down.
- На Макете страницы ссылками Самая широкая страница / Самая широкая страница переходим на соответствующие им страницы и проверяем поля. Бывает что что-то пропускаешь. Исправляем и снова проверяем ту же функцию пока всё не исправим.
- На этапе Вывод выставляем свои параметры → Применить к → Ко всем страницам. Запускаем Пакетную обработку.
Советы по п.3:
Попутно с проверкой правильности определения полезной области можно переходить по другим этапам, корректируя настройки. Затем возвращаемся для этап "Полезная область" и переходим на следующий скан. В частности, индивидуально можно настраивать:
- если программа ошиблась с определением скана правый-левый, на вкладке "Разрезка страниц" делаем исправление;
- на "Макет страницы" меняем выравнивание с "общий по центру" на "вверх" или "вниз". Встречается оформление книг, где лучше сохранить именно такое "оригинальное" выравнивание.
Полезные ссылки
- Тема на форуме Ru-Board - основной топик обсуждения. Здесь можно скачать и последние рабочие бета-версии программы.
- Тема на форуме Натахаус
C пожеланиями и замечаниями по документации обращаться к автору программы - axehand@gmail.com.























