= Сообщение: 592 из 2735 ==================================== RU.FTN.DEVELOP = От : Serguei E. Leontiev 2:5020/400 16 Jan 15 04:01:54 Кому : Mithgol the Webmaster 16 Jan 15 04:01:54 Тема : Re: Черновик стандарта фидонетовских подстрок Unicode (русская версия) FGHI : area://RU.FTN.DEVELOP?msgid=<1187498777@ddt.demos.su>+769041b0 На : area://RU.FTN.DEVELOP?msgid=2:50/88+54b2ddfb = Кодировка сообщения определена как: CP866 ================================== Ответ: area://RU.FTN.DEVELOP?msgid=2:50/88+54c8f445 ============================================================================== From: "Serguei E. Leontiev" <leo@sai.msu.ru> Subject: Re: Черновик стандарта фидонетовских подстрок Unicode (русская версия)
Привет Сергей,
От 11 января 2015 г., 23:32:16 в fido7.ru.ftn.develop ты писал: MW> /&\+[A-Za-z01-9+\/]+;/ в обычном тексте я был намерен MW> пренебречь как редкостною. Поэтому расширение существующих MW> кладжей или использование нового не требуется.
Указание используемого способа кодирования, ИМХО, хороший тон. Поэтому кажется разумным рекомендовать, при использовании обсуждаемого кодирования вставлять клудж, например @UEF со значением 1.0 (Unicode Extension Format, версия 1.0).
MW>>> расширение обратно совместимым. Если это расширение в MW>>> дальнейшем обретёт в Фидонете изрядную популярность, да MW>>> и сам Фидонет также, то тогда нельзя исключать MW>>> возможность обратного заимствования из этого стандарта MW>>> в язык HTML для компактной записи последовательностей MW>>> символов Unicode в HTML. SEL>> Такое обратное заимствование представляется крайне SEL>> маловероятным, т.к. в HTML уже есть, как возможность SEL>> использования UTF-8, что заметно компактнее UTF-7 и т.п., SEL>> так и возможность использования отдельных символов Unicode SEL>> для контекста с устаревшими кодировками (это хоть и не так SEL>> компактно, зато всюду уже поддерживается и используется). MW> Хорошо, я признаю незначимость этой надежды в нынешнем MW> рассуждении.
Или определить дополнительный параметр 'unicode-extension-format' для типа text/plain <https://tools.ietf.org/html/rfc3676> выпустив соответствующее RFC в дополнение к RFC 3676.
Действительно, например, для русского более чем на 90% текста, но с символами "угловые кавычки" (нет в CP866 и KOI8-R), "номер" (нет в KOI8-R), "рубль" (нет CP866/KOI8-R/Windows-1251) и т.п. кодировки: KOI8-R+unicode-extension-format, CP866+unicode-extension-format, Windows-1251+unicode-extension-format будут заметно компактнее, чем UTF-8.
-- Успехов, Сергей Леонтьев. E-mail: lse@CryptoPro.ru