DP>> Clickhouse тут больше подходит - редкие вставки батчами, при этом DP>> никаких update - все r/o. Есть поддержка в ORM.
NA> Правильно гутаришь. Яндекс молодцы, отдают в опенсорц.
Там и разработчики все уехали в США, оттуда теперь пишут. Может и ты с ними когда-то пересечешься :)
NA> такой большой, и все они дорогие, а хочется джунов нанимать. И NA> запилили они фрейворк https://github.com/userver-framework/userver NA> ваще сорви бошку, но требуется, чтобы в комманде были на код-рьвью NA> хорошие сеньйоры. </offtopic>
Hе, плюсы - это точно не мое. Есть у меня один оупен-сорс продукт на плюсах в хозяйстве, но разработчик умер в КОВИД :( И не понятно, что с ним делать..
DP>> У меня сейчас JNode живет на SQL кластере. В теории можно было DP>> иметь несколько морд.
NA> Прикольно, первый шаг к клаудам.
У меня свой клауд :) Это все поднято еще и между странами, на ARM компах, которые стоят в местах моего обитания. Как раз три ноды.
DP>> Hо JNode надо выбросить, ее нет смысла допиливать.
NA> Потому что для кофеварок написано? Или опять, весь софт говно? А какой
Потому что написано на древней джаве, надо на свежие версии портировать, ORM либу выкидывать или как-то тюнить, ибо с SQL там проблемы с производительностью - не в обиду автору, но не продумал он эту часть. Или я просто привык к хорошему, чтобы люди понимали, что будет, если размер твоей базы вырос на пару-тройку порядков.
NA> фидософт норм прям?
Смотря какие у тебя критерии! Вард считает, что D'Bridge :) Я пока никак не считаю, стенд собираю.
DP>> Словоформ то нет! manticore надо. Благо с clickhouse легко DP>> женится.
NA> Что это? Я думал, есть ли готовый stemming (быстро), или lemmatization
Это такая модная замена Elasticsearch.
NA> (медленно) для русского с учётом этих всех замен р->p, H->H, может ещё NA> какие-то были замены. Я могу их через Levenshtein distance просчитать NA> по униграмам.
А много ли сейчас кто меняет эти буквы? А в старых текстах проще заменить как положено чтобы было. Благо есть инструменты..