Сообщения в Полуневдимые эхи

Re: Полуневдимые эхи

Ответ на сообщение
u/e тут тоже есть :)
ahamai to shaos (2024-10-25 17:21:26) [ссылка]

Re: Полуневдимые эхи

Ответ на сообщение
ahamai> Зачем столько запросов? Это и лишняя нагрузка на сервер, и лишний трафик (хедеры, все дела).
Напиши конкретный алгоритм, я не понял твоё предложение.
Начинаю я с -16:1 - я там выше написал что лимит это параметр. В описании алгоритма я для понятности задал его в 1, но в быту мы начинаем не с 1. И обычно, если сообщений < 16 новых это единственный запрос. Если нет, будет -32:1, потом -64:1....

hugeping to ahamai (2024-10-25 17:47:45) [ссылка]

Re: Полуневдимые эхи

Ответ на сообщение
ну 16 норм, но потом бы я шаги увеличивал, там 64, потом 256 потом все сообщения. или вообще 16 если чё-то не хватает то забирать все. думаю, такие триггеры будут редко срабатывать.

стоп. -16:1 - это взять один хэш? а почему не -16:16? или я что-то не понял.
ahamai to hugeping (2024-10-25 18:14:02) [ссылка]

Re: Полуневдимые эхи

Ответ на сообщение
Мне нравится идея, что у каждого свой суверенный блеклист :)
shaos to ahamai (2024-10-25 18:26:21) [ссылка]

Re: Полуневдимые эхи

Ответ на сообщение
> Мне нравится идея, что у каждого свой суверенный блеклист :)
ну сейчас - да, и в принципе это норм
ahamai to shaos (2024-10-25 18:33:03) [ссылка]

Re: Полуневдимые эхи

Ответ на сообщение
AL>> Это было в ii.
revoltech> А почему документация описывает это как IDEC-расширение?
Потому что документация описывает IDEC.
AL>> Внимание! Вопрос: какая у тебя OS и какое окружение? Пользуешься веб-браузером?
revoltech> К сожалению, пользуюсь. К вопросу об ОС и окружении — Alpine Linux, X/Fluxbox.
Слишком много оверхеда.
+++ Лично я вижу в этом перст судьбы – шли по лесу и встретили программиста.
Andrew Lobanov to revoltech (2024-10-25 20:06:20) [ссылка]

Re: Полуневдимые эхи

Ответ на сообщение
AL> Потому что документация описывает IDEC.
Возникает вопрос: её здесь вообще кто-нибудь ещё читал?

Первый же абзац в https://github.com/idec-net/new-docs/blob/master/extensions.md:
> Здесь описаны расширения протокола, являющиеся основным отличием IDEC от ii. Многие из них реализовывать совсем необязательно.
И далее чуть ниже пункт «Список эхоконференций», описывающий GET /list.txt.

То есть документация называет GET /list.txt одним из основных отличий IDEC от ii. А мне тут рассказывают, что «это было в ii». Ну так документацию тогда поправьте, если это было в ii, а не эксклюзив IDEC.

Я вот вместе с кодобазой tii начал вести свой ii-doc.txt, где описываю только реализованные в tii части протокола. И с пометкой IDEC extension у меня там только GET /x/features и один из вариантов /u/e, который со слайсами.
AL> Слишком много оверхеда.
Слишком много сарказма. Если уж позиционируем протокол как альтернативу щитвебу и если уж спецификация не обязывает именно к HTTP(S)-транспорту (опять гитхаб процитировать?), то вполне логично принимать и предложения по более легковесным протоколам вместо упора в жирный HTTP(S).
revoltech to Andrew Lobanov (2024-10-26 05:48:43) [ссылка]

Re: Полуневдимые эхи

Ответ на сообщение
ahamai> ну 16 норм, но потом бы я шаги увеличивал, там 64, потом 256 потом все сообщения. или вообще 16 если чё-то не хватает то забирать все. думаю, такие триггеры будут редко срабатывать.
Сделал у себя с шагом кратности 12 (потом 24, 48 и т.д.), чтобы в самом распространённом случае можно было даже с tgi и подобных за один запрос стянуть.
ahamai> стоп. -16:1 - это взять один хэш? а почему не -16:16? или я что-то не понял.
Ну в том алгоритме главная идея состоит в экономии трафика, полагаю. Сначала пробный запрос с -16:1, а потом, если в базе есть сообщение, то можно и -16:16.
revoltech to ahamai (2024-10-26 06:03:40) [ссылка]

Re: Полуневдимые эхи

Ответ на сообщение
revoltech> жирный HTTP
Почему жирный-то? Почти натуральный plaintext. Куда меньше?
tuple to revoltech (2024-10-26 09:39:47) [ссылка]

Re: Полуневдимые эхи

Ответ на сообщение
tuple> Почему жирный-то? Почти натуральный plaintext. Куда меньше?
Потому что статусы и заголовки, например. См. как в гофере или нексе сделано: строка запроса — ответ, всё.

Пример запроса по Nex: echo /u/e/idec.talks | nc station.domain 1900

Ничего, кроме нетката, телнета или подобного, в основе не требуется.

Отвечаю заранее на вопрос «а как же постить»? Как в NPS — на другой порт:

cat < /u/point
[auth_string]
[base64_message]
.
EOF

Вот тут уж действительно меньше некуда.

P.S. Что-то не смог запостить на sprinternet, переслал на tgi.
revoltech to tuple (2024-10-26 11:06:44) [ссылка]

Re: Полуневдимые эхи

Ответ на сообщение
tuple> Почему жирный-то? Почти натуральный plaintext. Куда меньше?
Потому что статусы и заголовки, например. См. как в гофере или нексе сделано: строка запроса — ответ, всё.

Пример запроса по Nex: echo /u/e/idec.talks | nc station.domain 1900

Ничего, кроме нетката, телнета или подобного, в основе не требуется.

Отвечаю заранее на вопрос «а как же постить»? Как в NPS — на другой порт:

cat < /u/point
[auth_string]
[base64_message]
.
EOF

Вот тут уж действительно меньше некуда.
revoltech to tuple (2024-10-26 11:09:01) [ссылка]

Re: Полуневдимые эхи

Ответ на сообщение
Меньше это Gopher или Nex овер телнет :)
shaos to tuple (2024-10-26 11:46:51) [ссылка]

Re: Полуневдимые эхи

Ответ на сообщение
shaos> Меньше это Gopher или Nex овер телнет :)
Да не обязательно овер телнет, но да, суть в том, чтобы не относящихся непосредственно к ii метаданных меньше гонять. Здесь и так сообщения в base64 оборачиваются, что уже 4/3 от полезной нагрузки...
revoltech to shaos (2024-10-26 11:56:20) [ссылка]

Re: Полуневдимые эхи

Ответ на сообщение
shaos>> Меньше это Gopher или Nex овер телнет :)
revoltech> Да не обязательно овер телнет, но да, суть в том, чтобы не относящихся непосредственно к ii метаданных меньше гонять. Здесь и так сообщения в base64 оборачиваются, что уже 4/3 от полезной нагрузки...
Го дропнем base64
+++ Никто не знает, как правильно. Так зачем же выдумывать правила?
doesnm to revoltech (2024-10-26 14:35:40) [ссылка]

Re: Полуневдимые эхи

Ответ на сообщение
> Пример запроса по Nex: echo /u/e/idec.talks | nc station.domain 1900
остаётся вопрос в том, как узнать, докачалось ли всё или оборвалось. всё равно нужен con-len или какие-то флаги. кстати я изначально хотел добавить, чтобы любой бандл начинался и заканчивался конкретным тегом, чтобы проверять валидность бандла. но банально забыл. но вроде с http ничё так получилось, от этого не страдаем. а новой технологии придётся показывать себя на практике - ждём реализации :)
ahamai to revoltech (2024-10-26 14:46:55) [ссылка]

Re: Полуневдимые эхи

Ответ на сообщение
doesnm> Го дропнем base64
Для /u/m не получится без глубинного перелопачивания самого формата бандла, а вот для /u/point, в принципе, легко.

Кто-нибудь скажет, какие проблемы решает base64 именно при постинге, каких не решает тот же самый x-www-form-urlencoded, в который сообщение по итогу всё равно заворачивается?
revoltech to doesnm (2024-10-26 15:19:39) [ссылка]

Re: Полуневдимые эхи

Ответ на сообщение
> Кто-нибудь скажет, какие проблемы решает base64 именно при постинге, каких не решает тот же самый x-www-form-urlencoded, в который сообщение по итогу всё равно заворачивается?
я сам давно об этом думал, и в следующих реализациях этого не было, был единый постинг хоть через веб-интерфейс, хоть через пойнта. но изначально можно было запостить сразу несколько сообщений, для чего это и было, а потом я решил, что не можно. в общем, это исторически сложилось. тем более, изначально в станции был только GET, поэтому сообщения больше 6 кб запостить было нельзя :)
ahamai to revoltech (2024-10-26 15:27:15) [ссылка]

Re: Полуневдимые эхи

Ответ на сообщение
ahamai> остаётся вопрос в том, как узнать, докачалось ли всё или оборвалось.
Для сообщений: посчитать хэш, преобразовать в айдишник по алгоритму и сравнить с тем айдишником, который в начале строки в бандле.

Для эх: сравнить количество айдишников с тем, которое мы запрашиваем, и удостовериться в том, что все скачанные айдишники имеют 20 символов.
revoltech to ahamai (2024-10-26 15:30:41) [ссылка]

Re: Полуневдимые эхи

Ответ на сообщение
> Для сообщений: посчитать хэш, преобразовать в айдишник по алгоритму и сравнить с тем айдишником, который в начале строки в бандле.
> Для эх: сравнить количество айдишников с тем, которое мы запрашиваем, и удостовериться в том, что все скачанные айдишники имеют 20 символов.
ну тогда это оверхед в коде. когда я делал, сравнить мне было не с чем, просто сделал на ровном месте, но по http оно работает ровно так, как было сделано в первой версии (хотя я много что забыл, но всё равно как-то работает). поэтому мой вариант естественно не оптимален и не идеален, и если кто-то сделает гораздо красивее, я с радостью перейду на этот формат.
ahamai to revoltech (2024-10-26 15:46:24) [ссылка]

Re: Полуневдимые эхи

Ответ на сообщение
ahamai> ну тогда это оверхед в коде. когда я делал, сравнить мне было не с чем, просто сделал на ровном месте, но по http оно работает ровно так, как было сделано в первой версии (хотя я много что забыл, но всё равно как-то работает). поэтому мой вариант естественно не оптимален и не идеален, и если кто-то сделает гораздо красивее, я с радостью перейду на этот формат.
Ну вот, кстати, я начал просто отслеживать хэши сообщений вместе с айдишниками, и после перефетча (со всего, кроме spline-online) из 17614 сообщений 14067 оказались с корректными айдишниками (сравнивал по функции LOWER() в базе, так что нюансы с A-z не важны), а вот 3547 сообщений имеют айдишники, которые вообще описанному в доках хэшу не соответствуют. Вопрос: был/имеется ещё какой-то алгоритм хэширования или что за фигня там происходит? А потом коллизиям удивляются.

Статистика сообщений с левыми ID по эхам (не считая spline):
sqlite> SELECT DISTINCT `echoname`, COUNT(`id`) FROM `msg` WHERE LOWER(`msgid`) != LOWER(`content_id`) GROUP BY `echoname`;
blcat.local|1
develop.16|17
game.rogue.14|39
idec.talks|322
idec.test|13
ii.stat|7
linux.14|341
lit.14|4
lor-opennet.17|1
lor.gold|31
music.14|34
ping.local|4
pipe.2032|1123
plan.9|2
python.15|8
retro.talks|27
ru.humor.14|35
spnet.stats|1
std.club|1241
std.favorites|2
std.game|139
std.hugeping|68
std.hugeping.micro|2
std.prog|36
std.rein|1
std.tech|47
zx.spectrum|1
revoltech to ahamai (2024-10-26 17:16:33) [ссылка]

Re: Полуневдимые эхи

Ответ на сообщение
Я три недели назад уже всё посчитал ii://TfXUY2nZ1vmjAsQhgfsK

Многие узлы допускают редактирование сообщений без изменения хеша и возможно какие-то изначально неправильно хеш реализовывали (т.к. в спеке небыло эталонных сообщений для сверки как это обычно принято) и потом некоторые ботоэхи с какого-то момента стали сломанные: ii://6kCluOlO0AG8aOvgvRPr

Основные stakeholders (текущий мейнтейнер стандарта с одной стороны и первоначальный создатель с другой) в один голос говорят, что сам алгоритм не важен - главное чтобы msgid был уникальным, поэтому я и отпочковал от ii/IDEC свой strengthened вариант iii т.к. мне для будущих экспериментов важно, чтобы хэш сходился всегда :)

ii://iii.nizya

А вообще было бы сильно прикольнее, если бы история хеширования в ii пошла по другому пути ;)

ii://vTYmGKHeCyvLZ3BV2NoP

Потому что как оказалось сам Создатель упоминал такой способ в комментах на лоре на этапе создания технологии ;)

[линк с пруфом пока не могут отыскать]
shaos to revoltech (2024-10-26 19:53:43) [ссылка]

Re: Полуневдимые эхи

Ответ на сообщение
не - base64 нужен т.к. позволяет ii транспорту работать в том числе и по последовательным 7-битным каналам - через COM порт там или прямо в тексте е-мейлов без mime кодирования (которое также в текст по сути)...
shaos to doesnm (2024-10-26 19:57:05) [ссылка]

Re: Полуневдимые эхи

Ответ на сообщение
ну оборвалось и оборвалось - в следующий раз дозаберётся, не?
shaos to ahamai (2024-10-26 19:58:07) [ссылка]

Re: Полуневдимые эхи

Ответ на сообщение
Я для себя хочу попробовать новый вызов /u/n с ascii85+ вместо base64 - будет покомпактнее чуток
shaos to revoltech (2024-10-26 19:59:24) [ссылка]

Re: Полуневдимые эхи

Ответ на сообщение
> вот 3547 сообщений имеют айдишники, которые вообще описанному в доках хэшу не соответствуют. Вопрос: был/имеется ещё какой-то алгоритм хэширования или что за фигня там происходит? А потом коллизиям удивляются.
во всяких босфорах и улиссах длина хэша была где 8, где 12 символов, поэтому для гейтования в ii до 20 добавлялось что-то типа "bosforbosfor" (а в гейтованых месагах вроде где-то полный хэш был, не помню уже, как это всё между сетями летало, но летало успешно.
ahamai to revoltech (2024-10-26 21:34:41) [ссылка]

Re: Полуневдимые эхи

Ответ на сообщение
как отличить "конец передачи" от "оборвалось", чтобы не запарсить что не то. хотя, конечно, сейчас просто упадёт декодер с base64 из-за неккоректного ююка, но теоретически может и нет. я не знаю, я просто размышляю.
ahamai to shaos (2024-10-26 21:35:58) [ссылка]

Re: Полуневдимые эхи

Ответ на сообщение
вообще, в отношениях станция-станция не важно, как они обмениваются - можно хоть в общий git сливать, а индекс эхи перегенирировать по timestamp, это всё равно будет "обмен в духе ii", разве что вклинивающиеся старые сообщения не так ii-шно, но в принципе так можно.
ahamai to shaos (2024-10-26 21:46:37) [ссылка]

Re: Полуневдимые эхи

Ответ на сообщение
О - нашёл!!!

https://www.linux.org.ru/forum/talks/10258332?cid=10258568
> return base64.urlsafe_b64encode( hashlib.sha256(s).digest() ).replace('-',").replace('_',")[:20]
> мощно я задвинул? внушает? :)
> feofil (06.03.14 09:41:46 PST) автор топика
Мне интересно в какой момент в реплейсах появились 'A' и 'z'? ;)

Если верить гиту, то 1 апреля 2014 года (в момент создания репы):

a45cdfa3 (user 2014-04-01 19:19:03 +1100 16) def hsh(s):
a45cdfa3 (user 2014-04-01 19:19:03 +1100 17) return base64.urlsafe_b64encode( hashlib.sha256(s).digest() ).replace('-','A').replace('_','z')[:20]

Но я знаю, что первый релиз ii был в начале мерта 2014 года...
shaos to shaos (2024-10-27 03:48:53) [ссылка]

Re: Полуневдимые эхи

Ответ на сообщение
в старой "болталке с девочками" hc.51 почти все хеши вида 7lwguohJulissiiuliss и mPJSJAI3ulissiiuliss а в других местах видимо просто отредактированные сообщения без изменения msgid...
shaos to ahamai (2024-10-27 03:52:20) [ссылка]

Re: Полуневдимые эхи

Ответ на сообщение
вот поэтому и нужны железобетонные хеши в качестве msgid - если хеш не сошёлся, то мессага битая или подменянная - т.е. одновременно проверяем и целостоность данных, и подлинность, причём не добавляя никаких лишних сущностей!
shaos to ahamai (2024-10-27 03:55:20) [ссылка]