= Сообщение: 603 из 2735 ==================================== RU.FTN.DEVELOP = От : Mithgol the Webmaster 2:50/88 29 Jan 15 16:02:42 Кому : Serguei E. Leontiev 29 Jan 15 16:02:42 Тема : Черновик стандарта фидонетовских подстрок Unicode (русская версия) FGHI : area://RU.FTN.DEVELOP?msgid=2:50/88+54ca305b На : area://RU.FTN.DEVELOP?msgid=<1187498778@ddt.demos.su>+2a2a8daf = Кодировка сообщения определена как: CP866 ================================== Ответ: area://RU.FTN.DEVELOP?msgid=<1187499101@ddt.demos.su>+85594f5d ============================================================================== Так было 04:02 16 Jan 15 написано от Serguei E. Leontiev к Mithgol the Webmaster:
SEL>>> Последовательность "&+" конечно неплоха, но ты слегка SEL>>> преувеличиваешь её достоинства, в частности SEL>>> в SU.HARDW.CHAINIK она встретилась в 2013 году в некоторой SEL>>> формуле. А ещё она встречалась в электронных схемах SEL>>> и псевдографике. Так же она допустима в так называемой SEL>>> "safe" форме URL, хотя и достаточно редко используется SEL>>> на практике.
MtW>> Хорошо. А как насчёт появления последовательностей, регулярному MtW>> выражению /&\+[A-Za-z01-9+\/]+;/ соответствующих?
SEL> Вероятно имелось ввиду регулярное выражение /&\+[A-Za-z0-9+/]+;/
Они эквивалентны, насколько я понимаю, так как \/ означает то же, что и / (внутри квадратных скобок), да и 01-9 соответствует 0-9 всецело.
SEL> Прошу прощения, опечатка, в том числе найдено командой: SEL> $ egrep -r '(^|^[^M].*)&\+[A-Za-z0-9+/]+;' fido7
Да, правда, там '&++;' без кавычек встречается.
MtW>> Есть ли для них семантика, обеспечивающая в каком-либо случае MtW>> закономерное появление?
SEL> Hапример, символы '&', '+' и ';', согласно "Uniform Resource Locators SEL> (URL)" <https://tools.ietf.org/html/rfc1738>, входят в рекомендованный SEL> набор символов для URL.
SEL> Второй пример, корректный код на С/С++: SEL> int main() SEL> { SEL> int a, b, c;
SEL> a = 1; SEL> b = 2; SEL> c = a&+b; SEL> }
SEL> Кроме того, обязательное использование символа завершения ';' SEL> противоречит твоему пожеланию "...в Фидонете часто количество символов SEL> ограничено...". Для уменьшения количества символов, значительно SEL> экономнее использовать символ ограничителя только в случае, если SEL> следующий символ является символом base64 или символом ограничителя, SEL> аналогично тому, как это сделано в UTF-7.
SEL> При таком компактном кодировании, регулярное выражение станет мягче: SEL> /&\+[A-Za-z01-9+\/]{3,};?/
SEL> В тоже время поиск по образцам: SEL> $ egrep -r '&}[A-Za-z0-9+/]{3,};?' fido7 SEL> и SEL> $ egrep -r '&\|[A-Za-z0-9+/]{3,};?' fido7
SEL> обнаруживает совпадения только в заголовках "X-Face: " (1 раз и 3 раза).
При виде того, как в какой-то псевдографике в не столь даже давнем письме (всего-то 2010 года и даже с FGHI URL в одном из заголовков форварда) всё же появляется последовательность, регулярному выражению /&\+[A-Za-z0-9+/]+;/ соответствующая, я начинаю деятельно отказываться от идеи непременного уменьшения количества экранирующих символов.
Теперь я думаю, что имеет смысл не только делать хвост (точку с запятою) непременным, но и добавить ещё один символ к экранированию хвоста и тем невозбранно достигнуть желаемого.
Я прежде вписал в стандарт, что минус (хвост UTF-7) должен выкусываться (заменяться точкою с запятою), а теперь перепишу это так, что этот хвост UTF-7 должен оставаться (а точка с запятою будет следовать за ним). Вероятно, этого будет достаточно.
Вот соответствующие правки в тексте черновика стандарта фидонетовских подстрок Unicode и в открытом свободном исходном коде эталонной реализации стандарта:
Фидонет будет великим и гипертекстовым! [Ru.Mozilla] http://Mithgol.Ru/ Mithgol the Webmaster. [Братство Нод] [Team А я меняю subj]
... Тупо, зато эхотаг. (Вадим Чесноков, в SU.SF&F.Fandom) --- Now playing: http://hentaichan.ru/games/ * Origin: Край родной долготерпенья, // Край ты русского народа! (2:50/88)