Методические указания

к лабораторной работе

Компьютерная графика

Часть 7

Система сканирования Fine Reader 4.0

 

 

1 Цель работы

Изучение основных принципов сканирования данных.

 

 

2 Задачи работы

Освоить приемы работы с программой сканирования Fine Reader 4.0.

 

 

3 Содержание работы

  3.1 Запустить программу Fine Reader 4.0.

  3.2 Отсканировать тексты из приложения А:

– текст обычный

– текст с рисунком

– текст, разбитый на несколько колонок

– сведения в табличном виде

3.3  Отсегментировать и распознать отсканированные данные.

3.4  Проверить орфографию распознанных данных.

3.5  Скопировать и сохранить данные в ТР Word.

3.6 Аналогичным образом отсканировать текст с рисунком; текст, разбитый на несколько колонок; сведения в табличном виде, затем  проверить орфографию и сохранить результаты сканирования в отдельном пакете и  оформить    отчет.

 

 

4 Требования к отчету

Отчет по работе должен содержать

- название, цель работы, порядок выполнения;

- ответы на контрольные вопросы по указанию преподавателя.

 

 

5  Библиография

5.1 Специальная информатика: Учебное пособие/ Симонович С.В., Евсеев Г., Алеексеев А. - М.: АСТ-ПРЕСС, 2000.- 480 с.

5.2 Информатика. Базовый курс. Учебник для ВУЗов/ Под редакцией Симонович С.В.- СПб.: «Питер».- 2000.- 640 с.

5.3 Информатика: Практикум по технологии работы на компьютере/ Под ред. Макаровой Н.В.- М.: Финансы и статистика. –1997. –С 308-313.

5.4 Информатика: Учебник / под редакцией Макаровой Н.В. – М.: Финансы и статистика – 1997.- 768 с.

 

 

6 Теоретические  положения

6.1 Система оптического распознавания FineReader 4.0

Чтобы отсканировать текст, картинку или фотографию потребуются программное обеспечение (ПО) - графический редактор и сканер, который нужно включить до запуска программы. Применение сканера возможно также для ввода в компьютер  различных карт и чертежей.

– Сканер- это устройство, предназначенное для ввода информации в компьютер, которое позволяет получить «цифровую» (электронную) копию различных изображений. Процесс создания электронной копии напоминает процесс фотографирования изображения бумажного документа. 

Все операции, необходимые в ходе преобразования бумажного документа в электронную форму могут быть выполнены с помощью программы FineReader 4.0.

Принцип действия программы FineReader 4.0 следующий: сканируется любой текст, затем картинка текста преобразуется в "обычный электронный текст", такой, как если бы вы его напечатали с клавиатуры. Пользователю остается только сохранить текст на диске или скопировать его через буфер обмена в любой текстовый редактор.

Программа FineReader 4.0 предназначена для распознавания текстов на русском, английском, немецком, украинском, французском и многих других языках, может распознавать смешанные двуязычные тексты.

С помощью программы FineReader 4.0 можно выполнять пакетную обработку многострочных документов, а также программу можно “обучать” для повышения качества распознавания неудачно напечатанных текстов или сложных шрифтов, она позволяет редактировать распознанный текст, проверять его орфографию и сохранять результаты в текстовом редакторе  MS Word, MS Excel.

Программа позволяет объединять сканирование и распознавание в одну операцию.

FineReader 4.0 автоматически распознает разные участки текста: текст как таковой, картинку (рисунок), таблицу  и так называемые "нераспознаваемые" блоки в тексте.

Запустить программу можно через кнопку Пуск/ Программы/ ABBYY Fine Reader/ ABBYY Fine Reader 4.0 Handprint.

 

 

6.2 Главное окно программы FineReader 4.0

Вся работа в программе FineReader 4.0 ведется в пакетном режиме.

– Пакет - это папка, в которой хранятся изображения и рабочие файлы программы. Каждое отсканированное изображение записывается как отдельная страница пакета.

Экран программы FineReader 4.0 (рисунок 1) включает в себя строку меню, панели инструментов, окна Пакет, Текст, Изображение.

Окно Пакет отражает страницы пакета.

Окно Текст – распознанный текст активной страницы окна Пакет.

Окно Изображение – графическое изображение (картинку) активной страницы окна Пакет.

 

Рисунок 1 Вид окна программы  Fine Reader 4.0

 

 

В левой рабочей  области располагается окно Пакет, содержащее список графических документов, которые должны быть преобразованы в текст. Эти графические файлы рассматриваются как части одного документа. Результаты их обработки в дальнейшем объединяются в текстовый файл. Форма значка, отмечающего исходные файлы, указывает, было ли произведено распознавание.

Окно «Крупный план» содержит фрагмент графического документа в увеличенном виде. С ее помощью можно оценить качество распознавания. Эту панель используют также при «обучении» программы в ходе распознавания текста. В окне «Крупный план» по умолчанию показывается черно-белое изображение независимо от того, какое именно (цветное, серое или черно-белое) изображение открывали. 

Остальную часть рабочей области занимают окна документов (окно «Изображение», окно «Текст»). Здесь располагается окно графического документа, подлежащего распознаванию, а также окно текстового документа, полученного после распознавания.

В верхней части окна приложения под строкой меню располагаются панели инструментов. На приведенном рисунке включено отображение всех панелей, которые могут использоваться в программе  Fine Reader.

Панель инструментов Стандартная содержит кнопки для открытия документов и для операций с буфером обмена. Прочие кнопки этой панели служат для изменения представления документа.

Панель Scan&Read содержит кнопки, соответствующие всем этапам превращения бумажного документа в электронный текст. Первая кнопка позволяет выполнить такое преобразование в рамках единой операции. Остальные кнопки соответствуют отдельным этапам работы и содержат раскрывающиеся меню, служащие для управления соответствующих операций.

Панель Распознавание позволяет указать язык документа и вид шрифта. Последнее требуется делать только в тех случаях, когда документ имеет недостаточное качество печати.

Панель Инструменты используют при работе с исходным изображением. В частности, она позволяет управлять сегментацией документа (разбиением страницы на блоки текста). С помощью элементов управления этой панели задают последовательность фрагментов текста в итоговом документе.

Элементы управления панели Форматирование используют для изменения представления готового текста или при его редактировании.

Внизу окна расположена информационная панель (еще ее называют строкой состояния), где можно получить сведения о состоянии системы и производимых ею операциях, а также краткую справку о выбираемых пунктах меню и кнопках.

 

 

6.3 Работа с программой Fine Reader 4.0 и порядок распознавания документов

Основные операции обработки бумажного документа в программе Fine Reader 4.0 выполняются с помощью панели инструментов Scan&Read

На панели инструментов программы находятся соответствующие кнопки “Сканировать “, “ Сегментировать “, “ Распознать “, “ Проверить “, “ Сохранить “. Можно выполнять указанные операции и через меню Scan&Read в строке команд.

Процесс обработки документа состоит из следующих шагов:

– канирование документа;

– сегментация документа;

– распознавание документа;

– редактирование и проверка результата;

– сохранение документа.

Первый этап работысканирование. На этом этапе используют сканер. Чтобы начать сканирование, нужно включить сканер, положить оригинал документа (обычно левой стороной вниз, если только вы не используете ручной сканер) и щелкнуть кнопку   “Сканировать “ или в раскрывающемся списке подкоманд  данной кнопки использовать пункт Сканировать (рисунок 2): 

Рисунок 2  Вид кнопки “Сканировать”

 

 

Программа способна работать со сканером как непосредственно, так и через драйвер TWAIN. При непосредственном взаимодействии со сканером возможность сканирования цветных изображений не используется, так как предполагается, что текст в любом случае является одноцветным.

Программа использует для сканирования устройство, которое задано по умолчанию. Для того, чтобы выбрать такое устройство или изменить его настройку, нужно выбрать пункт Опции…в раскрывающемся списке кнопки “ Сканировать “ – откроется диалоговое окно Опции (рисунок 3).

Если к компьютеру подключено несколько сканеров или был подключен после установки программы Fine Reader 4.0, следует щелкнуть на кнопке Выбрать сканер. В этом случае проведет поиск подключенных к компьютеру сканеров и позволит выбрать нужный.

 

Рисунок 3 Вид диалогового окна Опции на вкладке Сканирование

 

Для изменения настроек сканера используют кнопку Настройка сканера.

Когда сканер выбран, активизируются два флажка в нижней части диалогового окна. Если установить флажок Показывать диалог TWAIN- драйвера, то сканирование производится через протокол  TWAIN с отображением специального диалогового окна (рисунок 4):

 

Рисунок 4 Диалоговое окно драйвера TWAIN для сканера

 

 

-Диалоговое окно интерфейса TWAIN может выглядеть по-разному – его вид определяется драйвером сканера. В нем с помощью пункта Scan Mode можно задать различные режимы сканирования:

Black&White (черно-белый) – предназначен для сканирования текстов и контурных рисунков.

Gray (серый) – 256 оттенков серого цвета, используют данный режим для сканирования черно-белых фотографий или для черно-белых принтеров.

Color (цветной) – для получения цветных картинок и фотографий.

Использовать протокол TWAIN имеет смысл только в том случае, когда работа напрямую невозможна или дает некачественные результаты.

-Кнопка "Scan" (сканировать, начать) запускает основной процесс сканирования, в результате которого мы видим на экране ПК получившуюся фотографию. Остается сохранить ее на диске для дальнейшего использования.

-Кнопка " Prescan " предназначена для пробного (предварительного) сканирования. Позволяет увидеть положение картинки и задать с помощью специального "пунктирного" прямоугольника (рамки) область сканирования.

Флажок Показывать опции перед началом сканирования из диалогового окна Опции (рисунок 3) применяют только в том случае, когда бумажные страницы документа существенно отличаются друг от друга по качеству (разные страницы печатались в разное время и разными средствами). В этом случае перед сканированием каждой страницы открывается диалоговое окно настройки сканера, чтобы пользователь мог отрегулировать качество процесса.

Сам процесс сканирования происходит в автоматическом режиме. Если требуется обработать много страниц, то лучше сначала все их отсканировать, а затем приступать к распознаванию. Это связано с тем, что сканирование требует присутствия пользователя из-за необходимости управления сканером (например, для смены страниц), а процесс распознавания может происходить в автоматическом режиме.

Когда процесс сканирования завершается, появляется окно с изображением текста.

Второй этап работысегментация текста. Дело в том, что в бумажном документе, например на странице книги или журнала, текст не всегда располагается в фиксированном порядке. Он может размещаться в нескольких колонках (столбцах), содержать иллюстрации (и подписи к ним), другие элементы форматирования. Дополнительные врезки и данные, представленные в таблицах, также могут запутать естественный порядок текста. Поэтому, прежде чем включать текст в документ, его разбивают на блоки, содержащие цельные фрагменты. Блоки распознают последовательно. Полученный текст включается в документ в порядке нумерации блоков.

¨Сегментация – разбиение документа на блоки.

Ручную установку блоков (рамка с помощью левой кнопки мыши) можно применить, если нужно распознать  только часть текста.

Для создания блока непрямоугольной формы или  для изменения последовательности блоков используют кнопки, выведенные на панели (рисунок 5) инструментов «Инструменты»:

Рисунок 5 Вид кнопок на панели «Инструменты»

 

Все кнопки этой панели используются именно на этапе сегментации и позволяют:

- создать блок (кнопка 1 – Создать блок);

- объединить два блока в один (кнопка 2 – Добавить часть блока);

- удалить фрагмент блока (кнопка 3 – Удалить часть блока);

- изменить положение блоков (кнопка 4 – Переместить блоки);

- изменить порядок нумерации блоков (кнопка 5 – Перенумеровать блоки);

- удалить блоки (кнопка 6 – Удалить блок);

- изменить разбиение таблицы на ячейки (кнопки 7).

Разные типы блоков обрабатываются программой по-разному. Программа Fine Reader 4.0 поддерживает следующие типы блоков (рисунок 6).

Рисунок 6 Вид контекстно-зависимого меню при работе с блоками

 

- текстовый (Текст) – на этапе распознавания преобразуется в текст;

- табличный (Таблица) – представляет собой набор ячеек, каждая из которых преобразуется в текст по отдельности;

- изображение (Картинка) – включается в документ без изменений как графическая иллюстрация, если формат сохранения преобразованного документа допускает вставные объекты;

- лишний (Нераспознаваемый) – игнорируется;

- содержащий штрих-код (Штрих-код) – распознается как штрих-код.

Для автоматической сегментации текста используют кнопку “Сегментировать” или ее раскрывающийся список подкоманд (рисунок 7):

 

 

 

Рисунок 7 Вид кнопки “Сегментировать”

 

При автоматической сегментации определение границ блока определяется автоматически. При этом учитываются поля документа, просветы между колонками, рамки.

 

Третий этап работы программы – непосредственно распознавание. Этот этап обычно не требует вмешательства пользователя, за исключением тех случаев, когда распознавание сопровождается «обучением».

Для большинства случаев сразу нужно нажать на кнопку инструмента  Распознать “ и подтвердить автоматическое определение блоков (рисунок 8):

 

 

 

Рисунок 8 Вид кнопки “Распознать “

 

Процесс распознавания будет "иллюстрироваться" закраской участков текста.

Точность распознавания FineReader 4.0  около 92- 97 %, так как при печати книг и газет на бумаге иногда не прилипает  или осыпается краска. Это будет хорошо видно в окне “Крупный план” с увеличенным масштабом.

Результаты распознавания будут отражены в окне  “ Текст ”.

На четвертом этапе, средствами программы в полученном тексте, можно провести проверку грамматики с помощью соответствующей кнопки “Проверить” на панели инструментов или пунктом Проверить из раскрывающегося списка подкоманд (рисунок9):

 

 

 

Рисунок 9 Вид кнопки “Проверить”

 

В результате появится следующее окно диалога (рисунок 10):

Рисунок 10 Вид окна диалога проверка орфографии

 

 

Распознанный текст отображается в отдельном окне “ Текст ”, в виде форматированного текстового документа. Он «теряет связь» с исходным изображением и может редактироваться и форматироваться независимого от него. Программа выделяет цветом те символы, которые она рассматривает как неоднозначно опознанные. Это упрощает поиск ошибок.

Пятый этап: по щелчку на кнопке “Сохранить“ на панели инструментов Scan&Read (рисунок 11) запускается  Мастер сохранения результатов (рисунок 12). Он позволяет сохранить распознанный текст или передать его в другую программу (например, MS Word) с помощью выбора соответствующего пункта из раскрывающегося списка подкоманд:

 

 

 

Рисунок 11 Вид кнопки “Сохранить“

 

 

Рисунок 12 Вид окна Мастера сохранения результатов

 

7 Методические рекомендации

7.1 Выполнение настройки системы Fine Reader 4.0

При настройке обычно требуется  выполнить следующие действия:

1 Установить язык распознавания и тип текста.

Язык распознавания и тип текста являются главными параметрами распознавания.

Язык текста. При распознавании текста на том или ином языке выбрать нужный язык из списка на панели Распознавание из окна Опции/Распознавание (рисунок 13).

 

Если Вы не видите нужного языка в списке, то выберите значение Другой... и в открывшемся списке найдите нужный язык или выберите несколько языков, слова которых встречаются в распознаваемом тексте.

 

Рисунок 13 Вид окна Опции на вкладке Распознавание

 

 

Языки распознавания в программе FineReader 4.0  имеют словарную поддержку.

Тип печати текста (Авто, Матричный принтер, Пишущая машинка)и тип текста определяется в системе автоматически.

Однако если Вы распознаете тексты, напечатанные на пишущей машинке или матричном принтере в черновом режиме, то для того, чтобы повысить надежность и скорость распознавания, выберите соответствующее значение в списке на панели инструментов.

 

Внимание!

Если распознавать тексты, напечатанные на пишущей машинке или матричном принтере, то при возвращении к типографскому тексту нужно снова выбрать значение Авто.

2 Указать сканер, с которым будете работать.

1)                Из меню Сервис выбрать пункт Опции...(рисунок 3)

2)                В диалоге Опции выбрать закладку Сканирование.

3)                В группе Сканер в строке Текущий должен быть указан сканер.

4)                Если изменить значение в строке Текущий, то нужно нажать кнопку Выбрать сканер...

 

3 Установить характер расположения текста на странице

Программа FineReader 4.0 автоматически определяет раскладку текста на странице. Для книг, газет, факсов, отчетов и т.п. подходит положение Автоматическое определение. И только в редких  случаях, например, при распознавании оглавлений и листингов программ, нужно специально указывать программе, что текст напечатан в одну колонку.

1)                Из меню Сервис выбрать пункт Опции...

2)                В диалоге Опции выбрать закладку Сегментация.

3)                В группе Число колонок выбрать пункт Одна колонка (для текста, напечатанного в одну колонку с большими промежутками между словами) или Автоматическое определение (рисунок 14)

 

 Рисунок 14 Вид окна Опции на вкладке Сегментация

 

 

4 Установить автоматический подбор ориентации страницы при сегментации и распознавании (рисунок 14):

1)    В меню Сервис выбрать пункт Опции...

2)    В диалоге Опции выбрать закладку Сегментация.

3)    Отметить пункт Подбирать ориентацию страницы.

Этот пункт следует отмечать, если в одном пакете распознаются страницы разной ориентации.

 

5 Определитесь показывать или не показывать изображение при сегментации и распознавании.

Сегментация и распознавание происходят быстрее, если обрабатываемое изображение не показывается.

Чтобы указать, показывать или не показывать изображение при сегментации и распознавании требуется (рисунок 15):

1)                В меню Сервис выбрать пункт Опции...

2)                В диалоге Опции выбрать закладку Установки.

3)                В группе Показывать отметить или, соответственно, снять отметку с пункта Изображение при распознавании и сегментации.

 

Рисунок 15 Вид окна Опции на вкладке Установки

 

 

6 Установить цвет для рамок блоков и неуверенно распознанных символов (рисунок 15):

1)                Из меню Сервис выбрать пункт Опции...

2)                В диалоге Опции выбрать закладку Установки.

3)                В группе Цвета из верхнего списка выбрать объект, а затем - в нижнем списке - установить для него цвет.

7 Установить уровень выделения ошибок.

В программе FineReader 4.0 есть несколько уровней выделения ошибок:

Минимальный - когда цветом отмечаются нераспознанные символы и символы, распознанные с очень большой степенью неуверенности.

Стандартный - когда цветом отмечаются нераспознанные символы, символы, распознанные с очень большой степенью неуверенности и слова, которых нет в словаре языка распознавания.

Максимальный - когда помимо нераспознанных символов и не словарных слов цветом отмечаются символы, распознанные с любой (даже небольшой) степенью неуверенности.

Процедура установления уровня выделения ошибок (рисунок 13):

1)                Из меню Сервис выбрать пункт Опции...

2)                В диалоге Опции выбрать закладку Распознавание.

          3)       Выбрать нужный уровень из списка Уровень выделения ошибок.

 

 

7.2 Выполнение сканирования одной страницы текста

Распознаваемое изображение должно иметь стандартную ориентацию: текст должен читаться сверху вниз и строки должны быть параллельны нижнему краю экрана. Поэтому при сканировании нужно указать программе, чтобы она автоматически подбирала ориентацию страницы.

Если ориентация не подбирается автоматически, повернуть изображение можно вручную. Для этого:

1)           выделить нужные изображения.

 

2)           нажать кнопку , чтобы повернуть изображения влево на 90 градусов.

3)            нажать кнопку , чтобы повернуть изображения вправо на 90 градусов.

 

Повернуть изображение можно также из меню Изображение (рисунок 16). Для этого требуется выбрать пункт Повернуть на 180 градусов, чтобы перевернуть изображение вверх ногами.

Рисунок 16 Вид меню команды Изображение

 

Замечание. Таким же образом можно повернуть только активное открытое изображение.

Сканирование текста выполняется поэтапно.

 

Этап 1. Запустить сканирование.

Нажать кнопку  

При выполнения сканирования можно добавлять отсканированные страницы в пакет, по умолчанию создаваемый при запуске программы, или можно открыть другой пакет  (нажать кнопку Открыть на панели инструментов и записать отсканированные страницы в него).

Если отмечен пункт Открывать последний пакет (меню Сервис, пункт Опции... закладка Установки), то при загрузке программа будет открывать последний пакет, с которым уже работали.

Можно также запустить сканирование с распознаванием.

Для этого нужно нажать стрелку справа от кнопки Scan&Read и из локального меню выбрать пункт Сканировать и распознать. Система отсканирует изображение, выделит на нем блоки, а затем распознает его.

 

 

Этап 2. Сегментировать изображения выделенных страниц.

Режим работы кнопок 2-Сегментировать и 3-Распознать зависит от того, какое окно активно, а также есть ли в окне Пакет выделенные страницы. Если активно окно Изображение, действие этих двух кнопок распространяется на открытую страницу.

Если в окне Пакет выделена хотя бы одна страница, то по умолчанию обрабатываются выделенные страницы. Выделить нужные страницы можно с помощью мыши.

Режим кнопки можно изменить, нажав на стрелку справа от кнопки и выбрав нужную команду, из открывшегося меню.

Режимы сегментирования:

¨Сегментировать все изображения без блоков.

Нажать стрелку справа от кнопки 2-Сегментировать и из открывшегося меню выбрать пункт Сегментировать все страницы без блоков. Затем нажать кнопку 2-Сегментировать.

¨Автоматическая сегментация активного изображения.

Нажать кнопку        

 

¨Ручная сегментация страницы.

Для этого требуется выполнить следующие действия:

1) активизировать открытое изображение.

2) по умолчанию выбран инструмент  (рисунок 5)

3) установить курсор мыши в угол предполагаемого блока.

4) нажать мышью и, не отпуская кнопки, потянуть в противоположный по диагонали угол.

Текст заключается в рамку. По умолчанию это текстовый блок.

Важно чтобы границы блоков не пересекались, иначе содержимое их пересечения распознается повторно.

При сегментировании изображения можно изменить тип блока путем вызова контекстного меню.

 

 

Этап 3.Распознавание текста.

 

Режимы распознавания:

¨Распознать выделенные страницы.

1) выделить нужные страницы в окне Пакета.

2) нажать кнопку       

 

¨Распознать все нераспознанные страницы.

Нажать стрелку справа от кнопки 3-Распознать и из открывшегося меню выбрать пункт Распознать все нераспознанные страницы (рисунок 8). Программа выделит блоки (если они еще не выделены) и распознает изображения.

Если на странице много нераспознанных слов возможно неверно подобрана яркость сканирования.

Если сканирование производится  впервые нужно установить яркость автоматически для того, чтобы посмотреть, как должно выглядеть правильно отсканированное изображение.

 Советы по подбору яркости вручную.

1) Если неправильно указан язык распознаваемого текста.

Язык распознаваемого текста определяется теми словами, какие языки в нем встречаются. Если в тексте встречаются, например, английские и русские слова, то язык текста следует определять как Русско-английский.

2) Если указан неправильный тип текста.

Система определяет тип распознаваемого текста автоматически. Однако, если  распознаются тексты, напечатанные на пишущей машинке или матричном принтере в черновом режиме, то для повышения скорости и надежности распознавания, это следует специально отметить. Необходимо, однако, снова установить «Авто», если сканируются тексты, напечатанные не на пишущей машинке и не на матричном принтере.

 

Этап 4. Проверить орфографию.

Нажать кнопку  или клавишу (F7).

Чтобы вернуться к документу после того, как проверка закончена, нажать кнопку Закрыть в диалоге Проверка (рисунок 10).

Программа Fine Reader 4.0 позволяет отредактировать отсканированный текст. Меню Правка содержит пункты: Отменить, Восстановить, Вырезать, Копировать, Удалить, Выделить все, Тип блока, Найти, Заменить, Шрифт, Форматирование, Язык.

Рассмотрим команды редактора системы Fine Reader 4.0.

Выделить текст.

Чтобы выделить слово два раза нажать на нем мышью.

Чтобы выделить фрагмент текста:

1) нажать мышью в том месте, с которого начинается выделение, и потянуть ее                в конец выбранного фрагмента.

2) отпустить кнопку мыши.

Чтобы выделить все содержимое окна Текст в меню Правка выбрать пункт: Выделить все (CTRL+A).

Копирование и перемещение выделенного текста.

1) выделить текст.

2) нажать кнопку . Выделенный текст копируется в Буфер.

3) установить курсор на то место в тексте, куда нужно перенести содержимое Буфера.

 

4) нажать кнопку . Содержимое Буфера копируется в текст.

Если не копировать, а переместить выделенный фрагмент, то вместо кнопки     нажать   

¨В буфере содержится только та информация, которая была помещена туда в результате последней операции копирования или перемещения. Когда помещается в Буфер новая информация, предыдущая исчезает.

¨Для копирования или перемещения выделенного фрагмента можно воспользоваться мышью.

Удалить текст:

1) выделить текст

2) нажать клавишу DEL.

Выделенный текст исчезает.

Отменить произведенное действие.

Нажать кнопку Восстановить отмененное действие:

Установить язык для выделенного фрагмента:

1) из меню Правка выбрать пункт Язык... (CTRL+L).

2) в открывшемся списке выбрать нужный язык.

Установить шрифт для выделенного текста.  Из списка Шрифт на панели Форматирование выбрать нужный шрифт.

Изменить начертание шрифта. Шрифтовые эффекты (Полужирный, Наклонный, Подчеркивание, Перечеркивание, Верхний индекс, Нижний индекс).

Форматирование абзаца.

Для текущего абзаца можно установить следующие опции:

- Выравнивание (по правому, левому краю, по центру, по обоим краям)

- Отступы (справа, слева, сверху, снизу)

- Красная строка

- Межстрочное расстояние

Чтобы установить форматирование абзаца:

1) из меню Правка выбрать пункт Формат….

2) в диалоге Формат выбрать закладку Абзац.

3) установить нужные опции и нажать ОК.

¨Выравнивание можно производить с помощью следующих кнопок на панели «Форматирование»:

.

Отступ слева можно регулировать с помощью следующих кнопок на панели «Форматирование»:

.

 

 

7.3 Сохранение результатов распознавания

Прежде чем сохранять результаты распознавания в том или ином формате, указать, сохранять или не сохранять форматирование, разделение на строки и т.п.

Чтобы установить опции экспорта для того или иного формата (рисунок 17) нужно:

 

Рисунок 17 Вид окна Опции на вкладке Форматирование

 

1) Из меню Сервис выбрать пункт Опции...

2) В диалоге Опции на вкладке Форматирование нажать кнопку Форматы...

3) В открывшемся диалоге (рисунок 18) выбрать страницу, соответствующую нужному формату.

4) Установить нужные опции.

 

Рисунок 18 Вид окна диалога Форматы

 

7.3.1 Поддерживаемые текстовые форматы

Fine Reader 4.0 сохраняет результаты распознавания в следующих форматах: .ТХТ, .RTF, .DOC, .HTML, .CSV, .DBF, .XLS, .PDF.

¨ При сохранении в формате .RTF или .DOC Fine Reader 4.0 автоматически создает текстовые стили, которые называются FR1, FR2 и т.д.

¨ Если сохраняется пакет для дальнейшей работы, результаты распознавания каждой страницы записываются в отдельный файл в расширением .FRF (Fine Reader Format).

Перед тем, как сохранять результаты распознавания в том или ином формате, нужно проверить, все ли нужные опции сохранения выставлены. Чтобы вернуться к документу после того как проверка закончена, нажать кнопку Закрыть в диалоге Проверка.

7.3.2 Передача распознанного текста в приложение

Можно передать результаты распознавания в одно из следующих приложений: MS Word, MS Excel, Corel WordPerfect, Lotus Word Pro или PROMT.

Для этого:

1. Активизировать окно пакета (нажмите в нем мышью) и нажать стрелку справа от кнопки 5-Сохранить (рисунок 11)

2. В открывшемся меню выбрать пункт  Передать в Word, Передать в Excel и т.п.

Примечание 1.

1. Если передавать в другое приложение не все страницы, а только некоторые, то необходимо выделить нужные страницы в окне Пакет.

2. Нажать на стрелку справа от кнопки 5-Сохранить и выбрать пункт Мастер сохранения результатов. В открывшемся меню (рисунок 12) выбрать нужное приложение и отметить пункт Сохранять только выделенные страницы. По нажатию Готово в этом диалоге результаты распознавания передаются в выбранное приложение.

Сохранить результаты распознавания в файл:

1) если  сохранять не все страницы пакета, то необходимо выделить нужные в окне Пакет.

2) нажать стрелку справа от кнопки 5-Сохранить и в открывшемся меню выбрать пункт Сохранить в файл (рисунок 12).

3) в открывшемся диалоге Сохранение (рисунок 19) выбрать диск, каталог и указать имя и расширение файла в который нужно экспортировать распознанный текст.

 

Рисунок 19 Вид окна диалога Сохранение

 

Установить переключатель Какие страницы сохранять в положение: Все распознанные или Только выделенные.

4) чтобы записывать каждую страницу в отдельный файл нужно отметить пункт Каждую страницу в отдельный файл. Имена, которые эти файлы получат, будут состоять из заданного имени и порядкового номера (1, 2 и т.д.).

5) нажать кнопку Сохранить.

 

7.3.3 Экспортирование результатов распознавания

 Нажать на стрелку справа от кнопки 5-Сохранить и выбрать пункт Скопировать в буфер обмена (рисунок 11).

Для выделенных страниц:

1) если передавать в буфер не все страницы, а только некоторые, то необходимо выделить нужные страницы в окне Пакет.

2) нажать на стрелку справа от кнопки 5-Сохранить и выбрать пункт Мастер сохранения результатов.

3) в открывшемся диалоге выбрать значение Передать в буфер и установить переключатель в положение Сохранить только выделенные страницы. По нажатию кнопки Готово в этом диалоге результаты распознавания передаются в буфер.

Отправить по электронной почте:

1) нажать стрелку справа от кнопки 5-Сохранить.

2) в появившемся меню выбрать пункт Отправить почтой...

Для выделенных страниц:

1) выделить нужные страницы в окне Пакет.

2) нажать стрелку справа от кнопки 5-Сохранить.

3) из открывшегося меню выбрать пункт Мастер сохранения результатов.

4) из предложенного списка выбрать пункт Отправить по почте.

5) установить переключатель в положение Сохранить только выделенные страницы.

 

Сохранить копию изображения страницы:

1) выделить страницу в пакете или открыть изображение страницы.

2) из меню Файл выбрать пункт Сохранить копию изображения...

3) в открывшемся диалоговом окне Сохранить как выбрать диск, папку и формат, задать имя сохраняемому файлу. Нажать кнопку Сохранить.

 

 

7.4 Сканирование изображений (рисунков)

Fine Reader 4.0 открывает файлы следующих форматов: .BMP, .PCX, .DCX, .JPEG, .TIFF, .PNG на которых формируются различные рисунки.

Открыть изображение:

1) нажать кнопку Открыть.

2) выбрать диск и папку, где находятся нужные файлы.

3) в открывшемся окне диалога (рисунок 20), в списке тип файлов выбрать строку Изображения...

4) выбрать нужные файлы и нажать кнопку Открыть.

Выбранные файлы копируются в текущий пакет.

5) можно указать пункт Перемещать файлы в пакет, чтобы выбранные изображения не копировались, а перемещались в пакет, тогда при загрузке в текущий пакет выбранные файлы будут копироваться туда, где находится  пакет и удаляться оттуда, откуда их открыли.

 

Рисунок 20 Вид окна диалога Открытия файла

 

Как получить информацию об открытом изображении?

1)Нажать правой кнопкой на изображение и в контекстно-зависимом меню выбрать пункт Свойства...(рисунок 21)

 

Рисунок 21 Вид контекстно- зависимого меню открытого изображения

 

2)В открывшемся диалоге (рисунок 22) выбрать закладку Изображение.

Об открытом изображении можно узнать:

• Ширину и высоту (в точках)

• Вертикальное и горизонтальное разрешение (в точках на дюйм. dpi)

• Тип изображения (черно-белое, серое или цветное)

Рисунок 22 Вид окна «Свойства блока и изображения»

 

Основные выполняемые Fine Reader 4.0 операции над изображением:

¨Инвертировать изображение:

1) выделить нужные изображения.

2) из меню Изображение выбрать пункт Инвертировать

Таким же образом можно инвертировать активное открытое изображение.

¨Очистить изображение:

1) выделить нужные изображения с помощью мыши.

2) нажать кнопку    на панели «Стандартная».

Таким же образом можно очистить активное открытое изображение.

 

 

 

8. Контрольные вопросы

1.   Перечислите основные элементы окна программы Fine Reader 4.0.

2.   Из каких основных этапов состоит процесс сканирования?

3.   Какой стороной нужно помещать  “оригинал” в сканер?

4.   Какие типы распознаваемых блоков вы знаете?

5.   Как распознать только часть текста сканируемого документа?

6. Назначение и сфера применения программ OCR.

7. Что такое “разрешение”, в каких единицах оно измеряется?

8. Какие типы сканеров Вы знаете?

9. Можно ли распознать фотографию текста, записанную в виде файла?

10. С каким разрешением лучше сканировать большую фотографию, которую в дальнейшем нужно показать на экране компьютера?

 

 

 

Приложение А

 

“Если подарить человеку одну рыбу — он будет сыт один день, если подарить две рыбы — он будет сыт два дня, если же научить его ловить рыбу — он будет сыт всю жизнь”

Японская пословица

В условиях коренных изменений, происходящих в настоящее время в нашем обществе и системе высшего образования, резко возрастает роль и значение самостоятельной работы студентов в вузе. Проблема организации самостоятельной работы студентов существовала всегда и давно волнует преподавателей высшей школы, ибо глубокие прочные знания и устойчивые умения могут быть приобретены студентами только в результате самостоятельной работы. Нельзя сказать, что преподаватель только сообщает студентам определенную сумму знаний по различным курсам, а далее они сами сумеют взять из полученного ими все необходимое. Знать — это значит уметь применять знания, которые должны быть активными, развивающимися, говорил еще В.А.Сухомлинский. При таком подходе знания студентов не являются конечной целью, а служат лишь средством для их дальнейшего развития.

Проблема интенсификации учебного процесса за счет уменьшения рутинной работы студентов неоднократно ставилась нами в различных публикациях. В данной работе мы рассмотрим лишь одно из направлений возможной оптимизации самостоятельной работы студентов, а именно организацию информационной подготовки студентов в библиотеке вуза.

Самостоятельная работа студента может быть двух видов: организуемая преподавателем и самостоятельная работа без непосредственного контроля преподавателя (подготовка к практическим занятиям, зачетам, написание рефератов, курсовых, дипломных работ и др.). И та и другая предполагают использование ресурсов библиотек для получения дополнительных сведений по изучаемым курсам. Часто руководство самостоятельной работой студентов сводится лишь к тому, что преподаватели дают студенту лишь тему для дальнейшей их самостоятельной работы. И выбор оптимального получения информации зависит непосредственно от студента. От умения ориентироваться в информационном пространстве современной библиотеки с ее информационными ресурсами, представленными как в традиционном виде, так и на современных электронных носителях зависит эффективность его самостоятельной работы, а также количество времени, затрачиваемое на поиск необходимой информации.

 

 

 

 

Потрясающая Грейс

 

 

Всегда проще попросить прощения потом, чем просить разрешения вначале.

Малютка Грейс

Когда я поближе познакомился с историей жизни контр-адмирала ВМФ США, “матери компьютера”, “бабушки КОБОЛа”, “королевы программного обеспечения”, несравненной Грейс Брюстер Мюррей Хоппер, мне оставалось лишь удивляться тому, что никто из наших внимательных читателей до сих пор не потребовал от меня подробнейшего жизнеописания этой потрясающей женщины. Вне всяких сомнений сия особа заслуживает здоровенного нерушимого изваяния на компьютерном Олимпе, рядом с которым, как средство борьбы с чрезмерной пафосностью, будет соседствовать малюсенький монументик вредоносному насекомому, ибо, согласно легенде, именно старушка Грейс засушила первого компьютерного жука (более известного под ковбойской кличкой - Bug).

Грейс закончила колледж в 1928 году. В дипломе значилось “бакалавр“. в декабре 1943 приняла военную присягу. Она не попала на фронт. После ускоренных кратких курсов в военно-морской академии новоиспечённый младший лейтенант Грейс Мюррей Хоппер была прикомандирована к Интендантскому управлению ВМФ, а первым местом её службы стало Бюро артиллерийских вычислительных проектов при Гарвардском университете. Грейс была принята на работу в качестве первого программиста знаменитой электромеханической вычислительной машины Марк I (свыше ста кубометров сверкающего металла). Эта штука являла собой чудо инженерной мысли, производившее до трёх арифметических действий в секунду и имевшее целых 72 байта оперативки. Профессор (лейтенант) Грейс Хоппер попала в команду профессора (старшего лейтенанта) Говарда Эйкена. Всё складывалось как нельзя лучше, её ждали, в ней нуждались, она была на своём месте.

 

Поколение

Особенности

Быстродей-
ствие (операций в секунду)

Программное обеспечение

Примеры

Первое поколение, после 1946 года

Применение вакууно-ламповой технологии, использование систем памяти на ртутных линиях задержки, магнитных барабанах, электронно-лучевых трубках (трубках Вильямса).

10-20 тыс.

Машинные языки

ENIAC (США)
МЭСМ (СССР)

Второе поколение, после 1955 года

Замена электронных ламп как основных компонентов компьютера на транзисторы. Компьютеры стали более надежными, быстродействие их повысилось, потребление энергии уменьшилось

100-500 тыс.

Алгоритмические языки, диспетчерские системы, пакетный режим

IBM 701 (США)
БЭСМ-6, БЭСМ-4, Минск-22, Минск-32 (СССР)

Третье поколение, после 1964 года

Компьютеры проектировались на основе интегральных схем малой степени интеграции  и средней степени интеграции . В конце 60-х появились мини-компьютеры. В 1971 году появился первый микропроцессор.

порядка 1 млн.

Операционные системы, режим разделения времени

IBM 360 (США)
ЕС 1030, 1060 (СССР)

Четвертое поколение, после 1975 года

Использование при создании компьютеров больших и сверхбольших интегральных схем .
Началом данного поколения считают 1975 год - фирма Amdahl Corp. выпустила шесть компьютеров AMDAHL 470 V/6, в которых были применены БИС в качестве элементной базы.
Стали использоваться быстродействующие системы памяти на интегральных схемах - МОП ЗУПВ емкостью в несколько мегабайт. В случае выключения машины данные, содержащиеся в МОП ЗУПВ, сохраняются путем автоматического переноса на диск. В середине 70-х появились первые персональные компьютеры.

десятки и сотни млн.

Базы и банки данных

Супер- компьютеры (многопроцес-
сорная архитектура и использование принципа параллелизма), ПЭВМ

 

 

 

 


e-mail: kafiitbgau@narod.ru

Все права защищены. 
Никакая часть данной методической разработки не может быть воспроизведена в какой бы то ни было форме без письменного разрешения владельца авторских прав

Оформление
LaryART

В начало методички


Hosted by uCoz