Текстовые конвертеры

Текстовые конвертеры

В свое время каждый из программистов-разработчиков, создающих очередной формат документов, мечтал о том, что именно его реализация станет промышленным или бизнес-стандартом передачи документов. В течение десятилетий все эти попытки вылились в то, что стало напоминать Вавилонскую башню форматов: вроде бы вот он – документ – а открыть его нечем. А если открыть чем придется, то велика вероятность полюбоваться вместо текста на «кракозябры».

Удивительно, но текстовые документы, при их простоте, умудрились за это время разбросать по стольким форматам, что единого конвертера из одного формата в другой попросту не существует. Оказывается, это очень сложно – учитывать все нюансы внутренних форматов. К примеру, чтобы освободить текстовый документ в формате HTML от тегов, придется поломать голову (например, привлечь к этому делу WinWord). Остальные варианты таковы: искать соответствующую программу в Сети или создавать самому. Самому, конечно, интереснее, но нужно не только быть программистом, но и иметь много свободного времени на такие забавы.

И, между прочим, даже изрядно пропиаренные программы иногда пасуют на сложных документах. Так, например, обстоит дело с книжным форматом FB2 – уж очень трудно его превратить во что-то другое без потери данных.

Вся эта возня с текстовыми конвертерами бывает необходима, если приходится иметь дело с многочисленными адресатами. Не так давно была и дополнительная проблема, связанная с Сетью – русские тексты каждый кодировал как только мог: в ходу были кодировки cp866, cp1251, cp1252, utf-8, mime, koi-8… С кодировками путались даже встроенные редакторы Windows, а для писем приходилось использовать автоматические конвертеры. Когда же документы стали сложнее (PDF, DJVU, DOC), проблема конвертирования еще более обострилась. В самом деле, если создавать собственную библиотеку, то хотелось бы, чтобы все книги в ней были одного формата.

К сожалению, подобно Вию, показать пальцем на готовую программу и сказать «вот она!» не получится, поэтому при конвертировании текста приходится постоянно обращаться к поисковым системам с вопросами вроде «FB2TXT», «DOC2PDF», «DJVU2PDF» и так далее. В любом случае утилита, зачастую бесплатная, будет найдена в течение минуты, но не факт, что она будет работать хорошо. Заглянув на один из профильных сайтов, мы обнаружили, что там выложено 29 (!) текстовых конвертеров, причем большая их часть совпадает по функциональности. Быть может, универсальный текстовый конвертер напишете именно вы?