Подумалось: а ведь если взять, допустим, записи @rur за месяц, по ним ведь можно подсчитать MAU всего русскоязычного Федиверса, ведь так? Никто еще не пробовал сделать такое?
@johan
Я кодить не умею от слова совсем! Максимум: простенький скрипт по шпаргалке могу накосяпорить.
У меня лингвистические проблемы по части общения с машиной.
@johan @Dmitry это миф и заблуждение, что он вообще хоть что-то значимое показывал. огромная часть инстанцев федивёрса никогда не предоставляла этой информации статистики и никогда не будет её предоставлять из принципа находясь в тени такого рода любителей.
оно никому не нужно, никто не заинтересован, кроме любителей попиарить свой сервис или свои инстанцы.
@johan @Dmitry А если они не прячутся, а банально дистанцируются от таких как ты и подобных тебе?
Diaspora не поддерживает ActivityPub, но доступна из Frendica & Hubzilla и этой троице инстанцев как-то абсолютно похуй, что же происходит при этом в клонах твиттера. Особенно на волнах миграции толп долбаёбов с патлатыми хомячками-смузихлёбами — похеру как они там трясут навощенными бородами с усами или кого куда ими мокают.
@grumb @Dmitry Да именно так, скорее всего, и видят. Неотъемлемое право. В слове «прячутся» особой эмоциональной окраски нет, можно заменить «сознательно не участвуют в тусовке», допустим.
Соответственно, в статистике будут только ее портить ;-)
Даже в рамках «тусовки» (любой) полно закрытых френдз-онли аккаунтов, которые уже точно не «прячутся», а именно «сознательно дистанцируются».
Соответственно, если хочется выяснить именно MAU — то в эту категорию ни те, ни эти просто не попадают, т.к. в тусовке о них ничего неизвестно.
@johan да всё так, только зачем?
подумай дважды, какую группу лиц ты выявишь анализируя @rur
А это надо у автора спрашивать, насколько я понимаю, бот выцепляет русскоязычные записи из публичной ленты лорша? #НоЭтоНеТочно
отрицаешь принципы кластерного анализа данных и совершаешь систематическую ошибку выжившего.
Тебе по ходу не понравилось, что я приравнял подмножество пользователей, которые кому-то известны в тусовке и на них потенциально можно подписаться к «всему русскоязычному федиверсу»? ;-)
@johan @Dmitry Что ты не понимаешь какую часть постов в федиверсе собирает @rur. Даже среди клонов твиттера видит далеко не все. Далее, тебе придётся пройтись не только по /0 постам, но и всем комментам в треды. Чтобы не отсеять пользователей, кто любит комментировать, но при этом сами мало пишут /0.
Далее, часть комментов в этих тредах будет локальной по отношению к инстанцу, не федерируемые. Т.е. один и тот же тред выглядит по разному в плане комментов для аккаунтов с разных инстанцев.
А теперь добавь к этому, что часть акксунтов отвечает в треды выставляя видимость лишь для своих подписчиков.
Сколько кластеров получилось? Кого из них, ты откинуть собрался?
@grumb @Dmitry
Да, с непишущими комментаторами, конечно, вылезает проблема 😠 MAU тут и не пахнет. Получается, собрать (с разумными усилиями) реально только «активно пишущих, известных тусовке», иначе кроме как парсить все посты и списки подписок/подписчиков — не выйдет.
ОК, значит MAU федиверса останется покрытой мраком 😠
@johan @Dmitry ну ActivityPub — это xml, определенной схемы, реализующей семантической веб, но xml. Так что парсить его вполне удобно, с валидацией и корректностью, проблем не возникнет.
Вопрос лишь как вытаскивать xml данные одного вида, используя другой xml в качестве каталога и отправной точки — тот же atom/rss.
Эдакий краулер, но которому реально нужны лишь метаданные. Таким занимаются всякие службисты. Для отслеживания кто с кем пересекается и контактирует в публичном поле.
Поскольку, изначально людям свойственно налаживать социальные контакты в публичной части, лишь потом переходя в приватные обмены личными сообщениями.
Так что, MAU ни разу не секрет.
это не учитывая ботов и ммл и lor.sh и нишевых других серверов.
тоесть можно умножить на 2.
и не учитывая комментов
🔍 Описание
Скриншот консоли. Изображение показывает длинный текст, написанный белым цветом на чёрном фоне. Текст выровнен по левому краю и состоит из нескольких строк, разделённых пустым пространством. На каждой строке присутствует префикс, возможно, указывающий на источник сообщения. В тексте присутствуют даты, географические названия и фрагменты предложений на русском и английском языках. Часть текста похожа на вывод командной строки.
📝 Текст на картинке
энди
он раст
mastodon.nl
2/2... тогда его усилия не напрасны, его просто обидело бы, если бы оказалось, будто он делал
TO
mastodon.mnl
HD8G - Galapagos Islands - 10 Февраля 2025 - Радиолюбительский Мир
mastodon.social
что это у вас здесь происходит?
mastodon.nl
Ностальжи
mastodon.ml
В Tears of the Kingdom в информации о Пайе не написано самое важное: На попе у неё родинка в ва
mastodon.nl
9L1BXU - Sierra Leone - 14 Февраля 2025 - Радиолюбительский Мир
mastodon.nl
sley@ sley:-$ docker logs -since 24h russianreposter 2>&1 | grep -Eo '.-{20}' | wc -1
746
sley@ sley:-$