= Сообщение: 577 из 2735 ==================================== RU.FTN.DEVELOP = От : Serguei E. Leontiev 2:5020/400 26 Dec 14 15:43:31 Кому : FGHI Robot 26 Dec 14 15:43:31 Тема : Re: Черновик стандарта фидонетовских подстрок Unicode (русская версия) FGHI : area://RU.FTN.DEVELOP?msgid=<1187498401@ddt.demos.su>+41fb0162 На : area://RU.FTN.DEVELOP?msgid=2:50/88+54769e52 = Кодировка сообщения определена как: CP866 ================================== Ответ: area://RU.FTN.DEVELOP?msgid=2:50/88+549e6dbf ============================================================================== From: "Serguei E. Leontiev" <leo@sai.msu.ru> Subject: Re: Черновик стандарта фидонетовских подстрок Unicode (русская версия)
Привет Fghi,
От 27 ноября 2014 г., 6:45:16 в fido7.ru.ftn.develop ты писал: FR> Остальные подстроки ("подстроки Unicode") преобразуются в FR> формат UTF-7 (RFC 2152). Hапример, строка, состоящая из FR> символов Unicode U+9802, U+5C16, U+5C0D, U+6C7A, U+4E4B, FR> U+7A7F, U+8932, U+5B50, U+7BC7, представляется в виде FR> следующей строки: FR> +mAJcFlwNbHpOS3p/iTJbUHvH- FR> FR> Однако же принятый в UTF-7 метод экранирования (плюс перед FR> такой строкою и минус после) не достаточен для Фидонета. FR> Поэтому минус ДОЛЖЕH быть заменён на точку с запятою, а перед FR> плюсом ДОЛЖЕH быть поставлен амперсанд. Hапример, строка,
Такое определение: как в RFC 2152, но не так, а по другому. Трудно, как для понимания, так и для реализации.
Предлагается изложить в следующей редакции:
При применении в Фидонет закодированные в UTF-7 последовательности символов предваряются знаком амперсанд и завершаются символом точкой с запятой.
FR> состоящая из символов Unicode U+9802, U+5C16, U+5C0D, U+6C7A, FR> U+4E4B, U+7A7F, U+8932, U+5B50, U+7BC7, представляется в виде FR> следующей строки: FR> &+mAJcFlwNbHpOS3p/iTJbUHvH;
&+mAJcFlwNbHpOS3p/iTJbUHvH-;
FR> Для поиска этих кодированных форм может быть полезным FR> нижеследующее PECL (Perl-совместимое регулярное выражение): FR> FR> /&\+[A-Za-z01-9+\/]+;/ /&\+[A-Za-z01-9+\/]+-;/
FR> Для их декодирования ДОЛЖЕH использоваться некоторый FR> RFC2152-совместимый декодер UTF-7. (Как объясняется в FR> предыдущем разделе, фидонетовские подстроки Unicode FR> используют кодировку UTF-7 с другою экранировкою. Если FR> декодер ожидает RFC2152-совместимую экранировку, то амперсанд FR> ДОЛЖЕH быть убран и точка с запятою ДОЛЖHА быть заменена на FR> минус перед тем, как подстрока передаётся декодеру.)