» » Код букви і картинки. Як виглядає книга очима ЕОМ?

Код букви і картинки. Як виглядає книга очима ЕОМ?

Фото - Код букви і картинки. Як виглядає книга очима ЕОМ?

Для більшого розуміння переваг використання електронних книг пропоную, дуже приблизно, описати саму суть відмінностей мальованого тексту і розпізнаного. Як я це розумію, але, так би мовити, очима ЕОМ.

Розпізнаний або набраний на комп'ютері текст являє собою векторний формат. Грубо кажучи, це лінії, як на графіку, описаному якої-небудь формулою. Але саме в даному випадку, напевно, доцільніше назвати його кодом, т.к. самі картинки ліній у вигляді крихітних малюнків записані окремо і їх роль не істотна, адже при кожній новій букві, виходячи з її коду, відображається один і той же малюнок. Тобто, для того щоб відобразити всі літери «а» в тексті, комп'ютер використовує один маленький малюнок самої літери «а». Один для всіх букв (якщо її формат однаковий).

А сама буква записана у вигляді дуже короткого коду у вигляді нуля і одиниць. Наприклад, буква «а» в такому коді буде являти собою ось таку послідовність сигналів: «11010000» в кодуванні ISO 8859-5. Одиниця, як відомо, це присутність сигналу, а «0» - його відсутність. Виходить, щоб комп'ютер зрозумів одну букву, йому достатньо 8 сигналів.

Тепер розберемо растрові (точки) картинки. Тут уже, для того щоб відобразити саме картинку тієї ж букви «а», знадобиться цілий масив крапочок. Якщо зображення чорно-біле - то розташованих в певній черговості чорних і білих точок, які і будуть «малюнком» літери. Причому на кожну намальовану точку потрібні ті ж 8 сигналів. Але вже не на всю букву, а тільки на одну точку. Природно, однією чорною точкою намалювати букву «а» не вийде. А яку мінімальну кількість точок потрібно для промальовування букви, уявіть самі (100 бітів замість 8). Але те, що не одна і не дві чи три, це очевидно. Тому й картинки так багато важать.

До того ж, на відміну від коду, в якому комп'ютер як би знає, що це та чи інша буква, у випадку з картинкою йому абсолютно все одно, що намальовано. Тобто оперувати буквою як буквою він вже не може, а просто сліпо копіює зображення, переносячи кожну точку. Якщо в першому випадку всі букви в тексті як би однакові, то в другому доводиться постійно малювати і кожну нову літеру. Навіть якщо вона ідентична попередньої - «а», і малювати все навколо букв. Виходить, якщо в звичайному тексті (набраному в ворде) зустрічається, наприклад, 2000 букв «а», то малюнок самої літери використовується тільки один (постійно повторюється і не займає місце). До речі, кількість букв в такому тексті можна побачити в статистиці.

А от якщо аналогічний текст - мальований (не розпізнали), то все 2000 букв «а» будуть вимальовуватися знову і знову і для кожної з них як би буде 2000 картинок замість 1. Вони самі по собі займають набагато більше місця, і крім як відобразити їх на екрані, сходу з ними нічого не зробиш (ні пошуку по тексту, ні статистики, ні прослушки). Для ЕОМ це просто набір чорних і білих точок, а не певний код символів. Він може відобразити на екрані будь-яку картинку. Але картинка може бути сліпо відбитими точками різного кольору яким конкретним знаком на екрані, який відрізняється і розуміється комп'ютером.

Ось тому з картинками тексту і працювати повноцінно неможливо, і місця займають вони в десятки разів більше. Через що, по можливості (якщо книга збережена як картинка), я її перекладаю в текст. Після чого текст можна і послухати, і закладки зручно зробити, і щось виділити, і т.д.

Але не всі книги вдається коректно перевести в текст. Оскільки навіть найкращі програми для розпізнавання тексту, на жаль, напевно, ще довго будуть вимагати коригування. Багато текстів містять картинки, формули, які важко розпізнати. Тому доводиться зберігати текст разом із зображенням.

Звичайно, можна було просто розпізнати зображення тексту і зберегти його, залишивши і картинку, але працювати з такими двома документами незручно. Зручно, коли в одному документі можна і прочитати щось, зробивши закладку або прослухавши і в ньому ж на тій же сторінці подивитися картинку.

Тепер коротенько за форматами.

Формат - це, образно кажучи, спосіб збереження тексту або картинки у вигляді якого-небудь файлу. Способів зберегти є маса, тому форматів і програм, які працюють з даними файлами, також багато.

Для збереження в одному файлі тексту і картинки використовують в основному два формати - djvu та pdf. Це найпоширеніші.

Багатьом полюбився формат djvu. Але я його вкрай не рекомендую використовувати для збереження книг. Так, звичайно, заманливо, що фото (яким найчастіше є djvu) має маленький розмір. Багато ліпші мені в руки книги в даному форматі - просто зіпсоване час і безглуздо витрачений працю. Тому що, в основному, зображення в даному форматі назавжди втрачає свою якість і букви іноді не видно, а іноді їх неможливо розпізнати.

Звичайно, даний формат бурхливо розвивається і вже допускає можливість додавання і посилань, і розпізнаного тексту. А багато користувачів вже навчилися робити відмінні книги в цьому форматі. Книги, в яких в хорошій якості збережено зображення, збережений розпізнаний текст і навіть можуть матися гіперпосилання.

Проте я поки не зустрічав програми для даного формату, яка могла б з легкістю додавати примітки, позначки і багато іншого. Як, наприклад, PDF-Viwer або Foxit Reader для аналогічного формату - pdf. Тому все ж зберігати книги у формат djvu не рекомендую, тому можливості таких файлів на даний момент все ще на дуже низькому рівні і працювати з ним складніше. Хоча місця книги в форматі djvu займають трошки менше, ніж у pdf.

Крім djvu та pdf, книги, не мають великої кількості картинок і з добре розпізнаним текстом, краще просто зберігати у форматі вордівських документів (як звичайний текст у ворде). Це найбільш зручний формат для редагування і прослуховування тексту. При експорті з файнрідера часто вдається автоматично встановити гіперпосилання із змісту в текст. Тобто програма сама розставляє посилання, і, натиснувши на зміст, можна перейти на відповідний розділ в тексті.

Найчастіше розпізнані книги мені доводиться зберігати навіть у трьох різних документах: 1 - pdf - Акробат рідер- 2 - docx - ворд- 3 - txt - звичайний текстовий документ, відкривається блокнотом. Третій формат займає дріб'язковий розмір і дуже зручний для прослуховування книг на смартфоні. Хоча його недоліком є повна відсутність картинок і якого-небудь форматування.

Сподіваюся, моя стаття піде на користь суспільству. І книг в поганому пережатием якості з перекошеними, не розпізнали сторінками, засунутими разом з розворотом в djvu, буде зустрічатися все менше. В Інтернеті є маса статей, як правильно розпізнати і зберегти книгу файнрідером або ClearScan в формат pdf (текст під зображенням з додаванням гіперпосилань у змісті) або в ворд. Тому на даних моментах зупинятися поки не буду. Хоча варто зазначити, що навіть найкраща на сьогоднішній день програма розпізнавання текстів не завжди справляється, приміром, зі складними хімічними формулами і громіздкими таблицями. Через що і доводиться зберігати поверх текстів спочатку скановані картинки. Проте дана програма відмінно розпізнає прості тексти, які можна зберегти в ворд. Заощадивши надалі і час, і місце на диску.

Загалом, працювати ще є над чим. Книги, в будь-якому випадку, для повноцінної роботи потрібно розпізнавати, навіть якщо вони погано розпізнаються і розпізнаний текст має багато помилок.