Смоленская областная  юношеская библиотека. Оптическое распознавание символов

Многие из вас зачастую задаются вопросом: «что такое оптическое распознавание символов?». На самом деле этот термин скрывает достаточно много нюансов и тонкостей, которые мы разберем в данной статье.

Оптическое распознавание символов – представляет собой механический, либо электронный перевод печатного, машинописного или рукописного текста в определенную последовательность кодов, которая используется для представления посредством текстового редактора. Подобная технология распознавания зачастую используются для того чтобы переконвертировать книги или определенные документы в электронный вид, а также для публикации текста на веб-страницах, либо для автоматизации систем учета в бизнес-сфере. Главная особенность оптического распознавания текста заключена в том, что используя ее можно не только редактировать текст, но еще и производить поиск определенного слова или ключевой фразы, сохранять его в более компактной форме, а также распечатывать и представлять, не теряя при этом его качества. К тому же, можно производить анализ текста, форматирование, либо с легкостью преобразовать его в речь. Кстати, последний термин носит название «синтез речи».

 

Смоленская областная  юношеская библиотека. Оптическое распознавание символов

Стоит отметить, что системы оптического распознавания для работы с определенными шрифтами требуют калибровки. Кстати, ранее для программирования требовалось изображение каждого символа, так как программа одновременно могла работать только с одним шрифтом. В последнее время особой популярностью пользуются «интеллектуальные» системы, которые наиболее точно распознают сразу несколько шрифтов. Необходимо отметить, что определенные системы также способны восстанавливать исходное форматирование текста, в том числе и изображения с колонками. В последствии распознанные копии хранятся в специально организованных электронных архивах бумажных книг, один из которых можно посмотреть тут.

Смоленская областная  юношеская библиотека. Оптическое распознавание символов

Немного истории.

История оптического распознавания берет свое начало в далеком 1929 году, когда впервые был получен патент на данную технологию. С годами патентовались более новые методы. Уже в 1953 году на свет появились первые машины, служащие для оптического распознавания символов.

Разработка машины, которая бы смогла распознавать текст, написанный любым шрифтом, началась в 1974 году. Работа над продуктом была завершена спустя два года.

Необходимо отметить, что первой коммерчески успешной программой, способной распознать кириллицу стала «AutoR», которая была выпущена российской компанией «ОКРУС». Программа начала реализовываться в 1992 году.

Современные технологии оптического распознавания символов.

Смоленская областная  юношеская библиотека. Оптическое распознавание символов

Сегодня точное распознавание латинских символов в печатном виде может быть реализовано в том случае, если доступны изображения высокой четкости. Это позволяет распознавать символы с точностью до 99 процентов. Максимально точный результат может быть достигнут посредством корректировки человеком.

Активные исследования относительно проблем с распознаванием печатного и стандартного рукописного текста, а также нескольких других типов сегодня продолжают вестись.

Существует он-лайн и офф-лайн методы распознавания символов. Последний связан со статической формой представления текстов, а он-лайн способен учитывать движение во время письма. Так, например, при он-лайн методе можно с легкостью определить, с какой стороны пишется строка.

Смоленская областная  юношеская библиотека. Оптическое распознавание символов

В последнее время также пользуются популярностью методы распознавания текстов «на лету». Их главная особенность заключена в том, что всегда известен порядок, скорость и направление отдельных участков линий ввода. К тому же, пользователи смогут использовать только определенные формы письма. При этом в программном распознавании эти методы практиковаться не могут, поэтому вопрос распознавания рукописного «печатного» текста все еще актуален.

Смоленская областная  юношеская библиотека. Оптическое распознавание символов

В последнее время также активно исследуется проблема распознавания рукописного текста. Высоких показателей пока добиться не удалось. Именно поэтому, для решения более масштабных проблем в данной сфере, как правило, используются интеллектуальные системы (искусственные нейронные сети, например).

 

Добавить комментарий

Защитный код
Обновить

Сектор по работе с молодежью
Версия для слабовидящих
Забыли пароль? Регистрация                
Главная Главная Статьи Интересное чтение Оптическое распознавание символов
     

Интернет-опрос

Для чего Вы читаете?
 

Случайное изображение

Новое на сайте

Случайное мероприятие

«От Петра до наших дней». История гимна в России

1 и 7 ноября к Дню народного единства для студентов Смоленского строительного колледжа была проведена музыкальная беседа об истории Российского гимна.

Подробнее ...

Рекламные материалы

Похожие материалы


Независимая оценка качества оказываемых услуг











Портал Культура.рф Портал РусРегИнформ Персональные данные дети Памятные даты военной истории России Яндекс.Метрика
Просмотр данного раздела разрешён в любом возрасте
#fc3424 #5835a1 #1975f2 #119ea9 #0fe971 #051663