= Сообщение: 4826 из 47123 ================================ RU.FIDONET.TODAY = От : Mithgol the Webmaster 2:50/88 30 Oct 16 19:33:20 Кому : Nil Alexandrov 30 Oct 16 19:33:20 Тема : Проблема многобайтовых кодировок как проблема курицы и яйца в Фидо FGHI : area://RU.FIDONET.TODAY?msgid=2:50/88+5816211b На : area://RU.FIDONET.TODAY?msgid=2:5015/46+581227a4 = Кодировка сообщения определена как: CP866 ================================== ============================================================================== Так было 19:12 27 Oct 16 написано от Nil Alexandrov к Mithgol the Webmaster:
MtW>> С этого момента поподробнее. Которые новые стандарты буксуют MtW>> и в чём именно выражается пробуксовывание их? (Вопрос не риторический MtW>> и не служит сарказмом.)
NA> Мультибайтовые кодировки. Какое состояние дел на сегодня?
Многие классические редакторы почты Фидонета (такие, как GoldED+, например) были спроектированы как восьмибитные приложения. Они ожидают, что каждый символ фидонетовского сообщения кодируется одним байтом. Следовательно, они никогда не будут поддерживать кодировки Unicode UTF-8 или UTF-16.
Эта ситуация является проблемою типа "курица или яйцо". Сообщения в кодировке UTF-8 не появляются в Фидонете, так как ни одним из популярных читальников они никогда не будут прочитаны. С другой стороны, отсутствие таковых сообщений означает, что у разработчиков популярных читальников нет нужды развивать свой софт, а у их пользователей нет нужды обновлять свои читальники или выбирать какие-либо новые (поддерживающие Unicode) читальники.
Для преодоления этой проблемы я предложил простой метод, который позволяет подстрокам Unicode появляться (в кодированном и экранированном виде) внутри восьмибитных строк.
Метод кодирования основан на формате UTF-7 (RFC 2152).
Метод экранирования вдохновлён ссылками на символы HTML (HTML 4.01, подраздел 5.3.1, подраздел 5.3.2).
Реализацией этого метода достигается следующая ситуация:
*) Пользователи новых (поддерживающих Unicode) приложений Фидонета могут читать