Добро пожаловать, Гость. Пожалуйста авторизуйтесь здесь.
FGHIGate на GaNJa NeTWoRK ST@Ti0N - Просмотр сообщения в эхоконференции R50.SYSOP
Введите FGHI ссылку:


Присутствуют сообщения из эхоконференции R50.SYSOP с датами от 13 Jul 13 00:00:02 до 13 Jul 13 00:00:02, всего сообщений: 14923
Ответить на сообщение К списку сообщений Предыдущее сообщение Следующее сообщение
= Сообщение: 6926 из 14923 ======================================= R50.SYSOP =
От   : Sergey Sokoloff                  2:50/88            19 May 17 01:45:56
Кому : Oleg Levkin                                         19 May 17 01:45:56
Тема : Курица и яйцо. Рассуждение о пользе фидонетовских подстрок Unicode
FGHI : area://R50.SYSOP?msgid=2:50/88+591e2442
На   : area://R50.SYSOP?msgid=2:5053/56@fidonet+591cb994
= Кодировка сообщения определена как: CP866 ==================================
==============================================================================
    ════╤╤═════     Те, кому собой проклясть я мог привычный им уют,
  //│/│ ││ │/│/     Имя ``Mithgol the Webmaster'' зря во ``From'' не признают.

Так было 23:51 17 May 17 написано от Oleg Levkin к Sergey Dorofeev:

SS>>> Вообще видно, но букву Н ── н&+BGM-;тъ. &+2D3eAQ-;

SD>> Если уж на то пошло, то хорошо бы какой-то тэг использовать, чтобы было
SD>> понятно, что в сообщении такая ядрёнамать используется.

OL>  Ага... Мутить FSP на ^aCHRS: MultiMixed 4, тогда заживём...

А вот этого как раз делать ни в коем случае и не надо, потому что на эти грабли фидонетовское сообщество успело наступить в FSP-1030 с изобретением того CHRS, который ^aCHRS: UTF-8 4. И эти грабли больно ударили фидонетовское сообщество прямо в лоб (в особенности пользователей кириллицы, о чём я отдельно напишу ещё в последних абзацах; но основная проблема не в этом, а в попытке внедрения нового CHRS для сравнительно новой и невосьмибитной кодировки сообщений).

Какую форму имеют эти грабли? ── они имеют форму проблемы курицы и яйца: курице неоткуда народиться на свет, пока нет яиц, а яйца некому снести, пока нет курицы.

Сообщения в кодировке UTF-8 никем не сочиняются в Фидонете, так как для них тут нет читателей: ни одною из программ-читальников, сейчас популярных, они никогда не будут прочитаны. С другой стороны, вызванное этим явное отсутствие таковых сообщений означает, что у разработчиков популярных читальников вовсе нет нужды (ни большой, ни малой!) развивать свой софт, да и у их пользователей нет повода обновлять свои читальники или выбрать какие-либо новые (поддерживающие Unicode) читальники по мере их появления.

Вместо этих граблей я предложил (и реализовал) простой метод, который позволяет подстрокам Unicode появляться (в кодированном и экранированном виде) внутри обыкновенных прежних (восьмибитных) писем, снабжённых привычными CHRS-кладжами.

Реализацией этого метода достигается следующая ситуация:

во-первых, пользователи новых (поддерживающих Unicode) приложений Фидонета отныне могут читать (и записывать) подстроки Unicode внутри восьмибитных сообщений;

во-вторых, пользователи старых (восьмибитных) приложений Фидонета (таких, как GoldED, например) могут без всякого труда читать восьмибитные части сообщения. (Подстроки Unicode остаются неразборчивыми, но для восьмибитного приложения именно это вполне естественно, и причиняет лишь не очень большое неудобство, и послужит как необходимое побуждение к апгрейду.)

Таким образом, можно не наступать на грабли, исчезает проблема курицы и яйца.

Кроме того, в отличие от перехода на UTF-8, тут остаётся возможность продолжить написание заглавий сообщений в основном в некоторых старых (восьмибитных) кодировках (здесь 'в основном' означает 'для тех символов, которые поддерживают эти кодировки'). И эта возможность полезна для некоторых письменностей (таких, как кириллическая или греческая), у которых большинство символов требуют по 8 битов в их восьмибитных кодировках, но целых 16 битов в UTF-8 (а также в UTF-16; впрочем, я упоминаю это просто к слову, потому что у поддержки UTF-16 гораздо больше проблем в Фидонете) и, следовательно, ограничения длины заглавия сообщений (наложенные стандартами пакетов Фидонета, а также и устройством некоторых баз сообщений), которые обыкновенно задаются в байтах, становятся вдвое хуже (по числу символов) для заглавий в Unicode, чем в восьмибитных кодировках.

Проще говоря, сейчас заглавие сообщения может вмещать 66 русских букв (72 байта FTS-0001 для пакета или FSP-1037 для сквишёвого хранилища, минус нуль-окончание строки, минус четыре байта для втыкающих префикс "Re:" с последующим пробелом, минус ещё байт на всякий случай), а в UTF-8 там помещалось бы только 33 буквы. Удобно? ── нифигушеньки не удобно и не надо. Тогда как в случае моей разработки эта проблема отменяется: не надо придумывать новый формат пакета и новый формат хранилища, и новые тоссеры (а также ещё и трекеры, мейлеры, боты-постеры etc.), и преодолевать фанатическое сопротивление старых узлов с их уважаемыми сисопами тоже не надо для устранения той проблемы, которую кодировка UTF-8 принесла бы.

Это последнее преимущество ── вишенка на тортике, которая никому так не нужна, как сам тортик, но с нею как-то приятнее. Вот если бы моя вышеприведённая идея (фидонетовские подстроки Unicode) не устраняла грабли (проблему курицы и яйца), то устранение ещё и проблемы укорачивания заголовков само по себе не могло бы никого порадовать, а так оно приносит ощущение двойной выгоды.


Mithgol the Webmaster. ═[Mithgol.Ru]═[FGHI]═[Ru.Mozilla]═[Team А я меняю subj]

--- Знаешь ли ты, Oleg, что "вёшенки" пишутся через "ё"?
* Origin: Но я лишь голос вопиющего в пустыне ── ``RTFM, LMD!!!'' (2:50/88)

К главной странице гейта
Powered by NoSFeRaTU`s FGHIGate
Открытие страницы: 0.214895 секунды