Добро пожаловать, Гость. Пожалуйста авторизуйтесь здесь.
FGHIGate на GaNJa NeTWoRK ST@Ti0N - Просмотр сообщения в эхоконференции RU.FTN.DEVELOP
Введите FGHI ссылку:


Присутствуют сообщения из эхоконференции RU.FTN.DEVELOP с датами от 12 Jul 13 20:52:30 до 25 Jun 24 23:52:42, всего сообщений: 2542
Ответить на сообщение К списку сообщений Предыдущее сообщение Следующее сообщение
= Сообщение: 603 из 2542 ==================================== RU.FTN.DEVELOP =
От   : Mithgol the Webmaster            2:50/88            29 Jan 15 16:02:42
Кому : Serguei E. Leontiev                                 29 Jan 15 16:02:42
Тема : Черновик стандарта фидонетовских подстрок Unicode (русская версия)
FGHI : area://RU.FTN.DEVELOP?msgid=2:50/88+54ca305b
На   : area://RU.FTN.DEVELOP?msgid=<1187498778@ddt.demos.su>+2a2a8daf
= Кодировка сообщения определена как: CP866 ==================================
Ответ: area://RU.FTN.DEVELOP?msgid=<1187499101@ddt.demos.su>+85594f5d
==============================================================================
Так было 04:02 16 Jan 15 написано от Serguei E. Leontiev к Mithgol the Webmaster:

SEL>>> Последовательность "&+" конечно неплоха, но ты слегка
SEL>>> преувеличиваешь её достоинства, в частности
SEL>>> в SU.HARDW.CHAINIK она встретилась в 2013 году в некоторой
SEL>>> формуле. А ещё она встречалась в электронных схемах
SEL>>> и псевдографике. Так же она допустима в так называемой
SEL>>> "safe" форме URL, хотя и достаточно редко используется
SEL>>> на практике.

MtW>> Хорошо. А как насчёт появления последовательностей, регулярному
MtW>> выражению /&\+[A-Za-z01-9+\/]+;/ соответствующих?

SEL> Вероятно имелось ввиду регулярное выражение /&\+[A-Za-z0-9+/]+;/

Они эквивалентны, насколько я понимаю, так как \/ означает то же, что и /
(внутри квадратных скобок), да и 01-9 соответствует 0-9 всецело.

MtW>> Встречались ли они сами собою?

SEL> Всё равно встречались, хотя и реже. Hапример:
SEL> https://groups.google.com/forum/#!msg/fido7.ru.pictures.psevdo.graf/
SEL> eGiBvHKY1m8/QP6pJU8HTJ8J

SEL> Hайдено командой: `egrep -r '(^|^[^M].*)&\+[A-Za-z0-9+/]{3,};?' fido7'

SEL> Прошу прощения, опечатка, в том числе найдено командой:
SEL> $ egrep -r '(^|^[^M].*)&\+[A-Za-z0-9+/]+;' fido7

Да, правда, там '&++;' без кавычек встречается.

MtW>> Есть ли для них семантика, обеспечивающая в каком-либо случае
MtW>> закономерное появление?

SEL> Hапример, символы '&', '+' и ';', согласно "Uniform Resource Locators
SEL> (URL)" <https://tools.ietf.org/html/rfc1738>, входят в рекомендованный
SEL> набор символов для URL.

SEL> Второй пример, корректный код на С/С++:
SEL> int main()
SEL> {
SEL>     int a, b, c;

SEL>     a = 1;
SEL>     b = 2;
SEL>     c = a&+b;
SEL> }

SEL> Кроме того, обязательное использование символа завершения ';'
SEL> противоречит твоему пожеланию "...в Фидонете часто количество символов
SEL> ограничено...". Для уменьшения количества символов, значительно
SEL> экономнее использовать символ ограничителя только в случае, если
SEL> следующий символ является символом base64 или символом ограничителя,
SEL> аналогично тому, как это сделано в UTF-7.

SEL> При таком компактном кодировании, регулярное выражение станет мягче:
SEL> /&\+[A-Za-z01-9+\/]{3,};?/

SEL> В тоже время поиск по образцам:
SEL> $ egrep -r '&}[A-Za-z0-9+/]{3,};?' fido7
SEL> и
SEL> $ egrep -r '&\|[A-Za-z0-9+/]{3,};?' fido7

SEL> обнаруживает совпадения только в заголовках "X-Face: " (1 раз и 3 раза).

При виде того, как в какой-то псевдографике в не столь даже давнем письме
(всего-то 2010 года и даже с FGHI URL в одном из заголовков форварда) всё же
появляется последовательность, регулярному выражению /&\+[A-Za-z0-9+/]+;/
соответствующая, я начинаю деятельно отказываться от идеи непременного
уменьшения количества экранирующих символов.

Теперь я думаю, что имеет смысл не только делать хвост (точку с запятою)
непременным, но и добавить ещё один символ к экранированию хвоста и тем
невозбранно достигнуть желаемого.

Я прежде вписал в стандарт, что минус (хвост UTF-7) должен выкусываться
(заменяться точкою с запятою), а теперь перепишу это так, что этот хвост UTF-7
должен оставаться (а точка с запятою будет следовать за ним). Вероятно,
этого будет достаточно.

Вот соответствующие правки в тексте черновика стандарта фидонетовских подстрок
Unicode и в открытом свободном исходном коде эталонной реализации стандарта:

https://github.com/Mithgol/fiunis/commit/3641484661dc59225e3535872dbb53d660fac


Фидонет будет великим и гипертекстовым!    [Ru.Mozilla]     http://Mithgol.Ru/
Mithgol the Webmaster.                    [Братство Нод] [Team А я меняю subj]

... Тупо, зато эхотаг.                      (Вадим Чесноков, в SU.SF&F.Fandom)
--- Now playing:                                   http://hentaichan.ru/games/
* Origin: Край родной долготерпенья,  //   Край ты русского народа! (2:50/88)

К главной странице гейта
Powered by NoSFeRaTU`s FGHIGate
Открытие страницы: 0.107900 секунды