» » » Виды текста в электронной книге

Виды текста в электронной книге

10 ноября 2014   Инфо » Хай-Тек, гаджеты   

Уже много лет электронные книги методично вытесняют из оборота книги бумажные, и многие оценили преимущества мобильного чтения литературы. Однако не все задумываются, как именно текст из бумажной книги попадает в электронную начинку. Существуют две технологии размещения текста на электронном носителе: в распознанном и нераспознанном виде. С первого взгляда оба типа текста практически неразличимы. Внешне буквы и там, и там одинаковы, просматриваемы, в обоих случаях текст может быть скопирован, в обоих типах могут содержаться картинки, формулы, таблицы и другие элементы оформления текста. На хороших электронных книгах различий, кажется, нет. Однако это не так.

Нераспознанный вид книги чаще всего представляет собой отсканированные страницы реального бумажного источника. Такие страницы легко узнать: при увеличении масштаба страницы буквы растягиваются, то есть становятся видны пиксели. Такие страницы представляют собой простую картинку, фотографию. Редактирование такого текста напрямую невозможно, пользователь не имеет шанса дописать или изменить отображаемую информацию. Однако внести заметки поверх отсканированного возможно. Такая электронная книга показывает все, что было видно на бумажном носителе - вплоть до самой маленькой буквы, формулы, особенно, если качество скана или фотографии отличное. Нераспознанный текст подходит тем книгам, в которых очень много сложных элементов, например, формул и рисунков.

Нераспознанный текст для электронной книги, однако, имеет недостатки. Во-первых, значительный размер, во-вторых, малая возможность форматирования, в-третьих, низкое качество скана сделает текст нечитаемым, будет заметен цветовой шум и тени.

Распознанный текст (технология OCR) обладает следующими преимуществами: малый вес, легкость редактирования, доступность поиска по тексту и расстановка закладок, записей и маркеров, а также возможное прослушивание распознанного текста. Для создания распознанного текста для электронных книг необходимо приобрести специальное программное обеспечение, умеющее работать с технологией OCR. В качестве основы текста берется также фотография или скан страницы, после чего она прогоняется через приложение. Фотографии хорошего качества позволяют получить правильный текст почти за секунду.