У проекта, по моим представлениям, довольно хорошо разработана справка; дежурные ботоводы время от времени сталкиваются с отдельными вопросами в случаях, если справка не прочитана, но в целом в проекте обсуждение менее активно, чем в большинстве других проектов, при том, что сам проект работает.
Тем не менее, на самом деле есть масса тем для обсуждения. К сожалению, я осознала, что не справляюсь с донесением кучи информации; зачастую потому, что в проекте включается какое-то временное решение, я думаю, что, пока оно временное, не надо его анонсировать, а временное становится постоянным. Переписка нескольких активных участников проекта постоянно идёт в почте, но очень не хватает коллективной мудрости.
Ниже речь как о технических вопросах, так и не о технических. Если вы прочтёте о проблеме, которую сами не умеете решать, может, вы знаете человека, который умеет, и попросите его помочь?
Текущее состояние
Сайт проекта переведён на 7 языков (английский, русский, украинский, белорусский-тарашкевица, эсперанто, литовский, португальский), частично готов немецкий перевод. Проект работает для 271 Википедии. Шаблоны расстанавливаются в русской, украинской и двух белорусских Википедиях, статистика загружается ещё в литовскую Википедию, а поляки используют для расстановки своими ботами отдельные файлы. Полностью настроенными считаются, помимо ru+uk+be+be-x-old+lt ещё осетинская, якутская, греческая и шведская Википедии — они выделены на сайте жирным, это значит, что у них есть хронологические статьи и мы умеем их определять. 65 Википедий считаются ненастроенными, так как мы не знаем, какие страницы у них являются неоднозначностями.
Что мы умеем
Мы умеем определять тупиковые, изолированные и некатегоризованные статьи разных видов, расстанавливаем и снимаем шаблоны при необходимости (в нескольких Википедиях). Информация собирается скриптом по имени Голем (используется разными ботами, в основном — Голем, РобоСтася, U-bot), в последнее время шаблоны в рувики и be-x-oldwiki расстанавливаются автоматически (то есть без использования AWB; боты Голем и РобоСтася). В рувики очень помогает KrBot, который расстанавливает некоторые шаблоны через 4 часа после создания статьи, а не раз в сутки, как боты, использующие Голема. На сайте ведутся списки изолированных статей по категориям, по дате создания, по авторам (некоторые авторы не любят этот список, а некоторым он удобен; в том числе есть список изолированных статей, созданных анонимами); есть списки статей и шаблонов, в которых есть ссылки на неоднозначности, и списки неоднозначностей, на которые есть ссылки. Ещё есть «дерево категорий», в котором показано, где категории непоследовательны, и какие категории не категоризованы. Время от времени появляются разные дополнения к этому — скрипт AWB, решающий неоднозначности, скрипт, выделяющий и решающий неоднозначности, пояснения и ссылки с разных страниц интерфейса Википедии, и так далее. Википедии можно сравнивать между собой — в таблице и в «пирогах», правда, надо учитывать поле cluster size limit, оно означает, что если в какой-то Википедии есть изолированный кластер крупнее заданного размера, проект его не находит.
Особенности и проблемы
Технические задачи перечислены на странице Проект:Связность/Улучшение инструментов; ниже расширенный, но выжатый пересказ. Очень нужны руки и головы для поиска решений.
Некогда на сайте были подсказки по связыванию статей — с помощью «интервики-шпиона» (если у изолированной статьи была интервика, бот шёл по ней-ним и смотрел, как в Википедиях на других языках ссылаются на эту статью, и либо давал список, либо подсказывал, какую статью надо написать) и с помощью гугл-подсказки (простым поиском по Википедии — не встречается ли это название в других статьях?). Ссылка на поиск осталась, но сломалось встраивание. Интервики-шпион пришлось отключить, так как на тулсервере, на котором базируется проект, резко ограничили предоставляемые ресурсы. В итоге сейчас подсказок почти что и нет, а их наличие было хорошо и важно.
Нетехническое Нужно поискать в ещё совсем ненастроенных Википедиях, нет ли у них аналога шаблона {{disambig}}, и если есть, то сделать перенаправление с местного template:disambig на этот шаблон. Википедии после этого настроятся при ближайшем проходе бота :)
Сейчас очень сложно настраивать автоматическую расстановку шаблонов. Очень не хватает её для Википедии на украинском языке. Кроме того, описания правок сейчас делаются на английском языке, что не очень хорошо. Очень надо бы доделать этот момент.
Дизайнерское Как можно сделать более читаемой сравнительную таблицу и круговые диаграммы? Куда разместить ссылку на этот дружественный инструмент, который хоть немного может помочь в деле распутываний колец категорий? Что вы думаете об агрессивности раскраски важного скрипта?
Переводческое Хотелось бы перевести сайт на большее количество языков, хотя сейчас это процесс относительно нелёгкий (текты здесь, нужно перевести в текстовом файле и прислать мне или Mashiah Davidson)
Нетехническое Может быть, есть что-то, чего я не вижу? Непонятные и незаметные правила, нелогичности, идеи? Может, у вас есть знакомые Википедии, которым нужна статистика (в таком формате) или даже расстановка шаблонов?
Я попробовал гугл-поиск на тулсервере, он работает. Что касается интервики, то инструмент, видимо, полезный, но мне не совсем понятен алгоритм и глубина работы, возможно, это слишком высокая нагрузка. Тут нужно описать (дать ссылку на описание) как оно работает.
Он сейчас работает как ссылка, а ранее это было встроенное окно. Нагрузка была — 4 гигабайта оперативной памяти, кажется :) Код здесь, насколько я понимаю; можно особо привлечь внимание Машиаха, чтобы он описал былой алгоритм, но понятно, его надо как-то переделывать. Львова Анастасия19:16, 30 января 2012 (UTC)[ответить]
Ну и самое простое- не обращать внимания на временные трудности. Я много времени провёл, работая с сиротами, чтобы понять, что же делать. Для подавляющего большинства статей и пользователей ни гугл, ни интервики не помогут. Нужны обобщающие статьи разного уровня обобщения. Без них связность остаётся самоцелью, к сожалению. А вот как развить дерево статей обобщения, я пока не осознал. --Egor22:41, 30 января 2012 (UTC)[ответить]
Вкратце, интервики-шпион работал так: для каждого языка после сбора данных об изолированных он анализировал интервики ссылки из них, а потом запускал несколько потоков (по одному на каждом из серверов s1, s2, ...), разыскивающих ссылки на эти интервики-партнёры, а из них обратные ссылки в язык-источник. Таким образом, схема работы была "каждый язык с каждым языком", или N^2 операций поиска. Код в файле iwikispy.sql. Идея в том, чтобы при анализе каждого языка складывать изолированные с интервиками в некую общую базу данных, и не отходя от кассы, анализировать, что можно сделать для других языков. Экономия в основном на постороении таблицы ссылок и выявлении дизамбигов. Я пока не рассматриваю эту задачу как сверхприоритетную и хочу сконцентрировать усилия на повышении стабильности работы (уменьшении времени работы запросов, часто убиваемых при высоком реплаге). Mashiah13:04, 31 января 2012 (UTC)[ответить]
Нетехническое. Тут наверное надо осознать, насколько это нужно делать "сверху". Есть ли краткое и понятное описание проекта связности и его инструментов на базовых языках и максимально доступные ссылки на эти описания для пользователей. Вероятно, для некоторых разделов проще обращаться к пользователям этих разделов через форумы, пусть даже на английском?.
Ну так о чём сожалеть? Википедия развивающийся проект, и именно русская культура может обеспечить безграничное его развитие. Время всё расставит на свои места. Даже если мы заговорим на другом языке (хотя вряд ли). Умирающие умрут, или станут песочницами с ограниченными целями. --Egor22:41, 30 января 2012 (UTC)[ответить]
А в чём сложность настройки простановки шаблонов? Отсутствие нужных параметров в шаблонах укрвики? или разночтения алгоритмов применения параметров?
У разных проектов бывает своя специфика. Например, в ukwiki уважают шаблоны «nobot», и более трепетно, кажется, относятся к тому, чтобы описания правок были на родном языке. Описания правок сейчас "Мелогом" (скриптом-расстановщиком шаблонов) делаются только на английском языке, и не реализовано ничего типа Википедия:ConnectivityProjectInternationalization. Львова Анастасия19:16, 30 января 2012 (UTC)[ответить]
Ну так это только должно нас подвигать не только разрабатывать инструменты, но и грамотно и увлекательно объяснять, в том числе и нулевым новичкам, для чего это нужно. Я правильно понимаю, что это обсуждение вызвано некоторым "кризисом жанра" в проекте? Так наши основные цели пока не достигнуты, дела навалом. Лишь бы эти дела были в радость. Хорошо, когда работает "Большая Зелёная Кнопка", но, боюсь завалы она не уберёт, только замаскирует. --Egor22:41, 30 января 2012 (UTC)[ответить]
Не совсем поняла, что имеется в виду под «кризисом жанра» и БЗК. Не хватает рук для ряда идей, и лично мне не вполне сейчас понятно текущее состояние, хочется выслушать новые идеи, чтобы понять, надо ли что-то менять и можно ли что-то менять в сторону большего развития. Львова Анастасия11:42, 31 января 2012 (UTC)[ответить]
Наверное, здесь две проблемы для обсуждения. Первая - как сделать чтобы сообщество постоянно видело проблему сирот и сегментации (простота и понятность описания проблемы и понятность работы с инструментарием). Возможно, на портале Вики сделать почётче часть "Нужно сделать", выделить постоянные наиболее важные проблемы, есть ведь и кроме сирот проблемы? Может, вообще на портале сократить эти маловразумительные списки до читаемого состояния, а конкретные проблемы вынести в подстраницы? Вторая - как работать в проекте Связности. Ещё раз попытаюсь - основная проблема в острой нехватке обобщающих статей, к которым можно было бы привязывать сирот, достойных остаться в википедии. Как описать алгоритм определения таких статей, пока не знаю. Возможно, через категорию сироты и заглавную статью в этой категории (если есть, а если нет - то включать в список "К созданию"? --Egor21:55, 31 января 2012 (UTC)[ответить]
Сравнительную таблицу не нужно делать удобнее, она вполне читаема и понятна, если уж до неё дошёл любопытный нос :-) Красивые персональные диаграммы же на основе таблицы можно делать и самому. У меня претензий к дизайну техинструментов нет. Ссылки на инструменты надо ставить везде, где только можно, и в википедии, и на тулсервере. Циклы категорий одна из трудно определяемых на местности задач (помнится, как развязывали цикл с морями Израиля :-)). К показанному инструменту хотелось бы увидеть пояснение, я с первого раза не понял как это работает и как применять.
Вопрос «где» имелся в виду вида «на такой-то страничке сайта вот в этом-то углу мы ставим ссылку на дружественный инструмент с таким-то пояснением». Красивые персональные диаграммы же на основе таблицы можно делать и самому — то есть страница pie charts не нужна?.. Львова Анастасия19:16, 30 января 2012 (UTC)[ответить]
Ну что я буду девушку учить, где бантик навесить :-). А диаграмм указанных, я, честно, не нашёл... :-(. Только графики. Можно прямую ссылку, о чём речь? --Egor22:41, 30 января 2012 (UTC)[ответить]
Насколько я понял, речь идет об этих «пирогах». Как по мне, работать с графиками можно только для top-10 вики, остальные становятся настолько маленькими, что понять в них что-то трудно. Наличие на одной странице всех "пирогов" тоже сомнительно. Да и сами графики как-то мало информативны. Ну всего-то 3 показателя... Таблица намного полезнее. Если графики оставлять, то лучше их строить динамически, по кнопке, добавив в таблицу чекбоксы "сравнить" (или как-то так...) Сколько пользователь отметил строк, столько графиков и получил. Будет сравнивать то, что захочет сравнить. А в самой таблице я предлагаю, во-первых, локализовать "шапку", во-вторых, каждый заголовок колонки сделать ссылкой на описание соответствующего показателя. Хотя бы в виде тултипа. Рост/уменьшение соответствующего показателя можно подкрашивать красным/зеленым (текст или фон) - будет сразу наглядно видна тенденция улучшения/ухудшения. Dimich10:20, 31 января 2012 (UTC)[ответить]
Желтенькое всплывающее окошечко с подсказкой, появляющееся при наведении курсора мыши на элементы html-разметки с атрибутами alt (например у изображений) или title. Dimich12:01, 31 января 2012 (UTC)[ответить]
Нужны, насколько понимаю, переводы текстов на другие языки, которых пока нет в таблице? Тут помочь не могу.
Статистикой я пользуюсь, когда были завалы, это был один из самых полезных инструментов. Что касается автоформирования категорий и тем более текстов-пояснений, то это кажется излишеством. Количество и качество категорий вроде выбрали исходя из глубины кластеров и сиротства, они же временно опустевшие не удаляются по мере работы с ними? А текст надо написать один с толкованием цифровых обозначений сирот и кластеров. Или оставить в каждой категории свой. При решении каких-то расширений (наверное, о них и речь, о кластерах в несколько десятков статей?) нужны не категории и описания (зачем плодить сущности?), а структурированные рабочие списки для желающих по запросу. Заставлять же тулсервер лопатить википедию необходимости пока не вижу.
В целом - проект очень важный и полезный, я всеми силами и возможностями всегда его поддерживал, поддерживаю и надеюсь продолжать. Вероятно, нужно обсуждать и финансово-организационное участие Фонда и НП ВМ-РУ в такой важной работе. --Egor18:30, 30 января 2012 (UTC)[ответить]
Признаться, это обсуждение во многом на это ориентировано. Надо понять, сможем ли мы изыскать своих новых программистов, и есть ли задачи, касающиеся не исключительно наличия команды программистов. Львова Анастасия19:16, 30 января 2012 (UTC)[ответить]
Тут очень важно сформулировать сначала "мечту", что же мы хотим от технической реализации, и кто это "мы". Для кого будут инструменты и цели их работы. Если это действительно главное, то и нужно собрать в удобной форме "что хотелось", "что было", "что есть" и "чего хочется". Я так полагаю, что глубина на первый десяток анализа сирот и кластеров мала, по-хорошему, нужно изредка шерстить всю вики на предмет сегментации. Также по-прежнему полагаю, что проект выявил излишнюю высоту дерева категорий, его нужно подсекать, а для этого нужен внятный анализ длинных цепочек. Видимо, нужно начинать писать вариант проекта создания инструментария. --Egor22:41, 30 января 2012 (UTC)[ответить]
Сейчас по умолчанию проверяется кластер 20, считается, что обычно бо́льшие кластеры находятся редко. Есть возможность шерстить всю Википедию, Голем это умеет, но это требует сейчас таких ресурсов, которые тулсервер искуственно не даёт. А можно услышать идеи — кому и что хочется, о каком инструментарии речь? Я могу составить схему вопросов, на которые нужны ответы, но мне интересны именно мнения, как можно ответить на эти вопросы :) Львова Анастасия11:42, 31 января 2012 (UTC)[ответить]
Предлагаю помощь в качестве программиста. Могу предложить большой практический опыт разработки веб-приложений (C#, php, javascript, sql, html). Готов общаться по e-mail, через страницу обсуждения. "Список добрых дел" проекта сейчас выглядит как меморандум намерений, поэтому нужна детализация заданий, обсуждение и общение. Dimich10:20, 31 января 2012 (UTC)[ответить]
Ну, раз пошла такая пьянка, предстоит углубление в то, как и что работает. Я бы предложил делать это медленно и постепенно, получая удовольствие от решённых небольших задач на этом пути. Наиболее актуальной задачей мне представляется локализация описаний правок и (затем) локализация всех правок в мелоге, т.е. замещение скриптов на perl. Локализация описаний правок даёт нам возможность, наконец, заняться автоматизацией правок в uk и pl. В контексте описаний правок главная задача - дать участникам википедии возможность задавать текст описания правок через википедию, а не через svn. К сожалению, подстановка шаблона в поле описания изменений не работает, а так бы хотелось... Таким образом, главная задача - продумать, где и как должны задаваться описания правок, на какой странице вики. При этом нужно думать о том, чтобы это было удобно как пользователям, так и скриптам (имя страницы должно быть легко вычислимым, например, подстраница Википедия:ConnectivityProjectInternationalization). В будущем можно было бы также локализовывать и сам сайт связности. Что касается общения, мой email в меню "письмо участнику". Mashiah12:48, 31 января 2012 (UTC)[ответить]
Нужно учитывать, что дерево категорий строится не по кратчайшим путям. Не факт, что категория с самого низа ёлки не связана с категорией "Всё" прямым включением. Всилу особенностей алгоритма анализа графа, мы на каждом слое находим те кластеры, до которых других более коротких путей не существует. Mashiah12:53, 31 января 2012 (UTC)[ответить]
Попробую высказать своё мнение, по пунктам. Во-первых, про то, что уже хорошо. Таблица сравнения разделов, на мой взгляд, прекрасна, в ней есть всё, что необходимо. Разные статистики по авторам, категориям, etc. это тоже всё достаточно удобно и мною активно используется.
Теперь про то, что требует допила. Сравнение «в пирогах» — это может, и симпатично, но для маленьких разделов в нынешнем виде абсолютно не удобно, особенно для бевики, потому что доля изолированных у нас очень мала и в существующем масштабе увидеть там ничего не получится при всём желании.
И, наконец, про помощь. Что касается шаблона {{disambig}} в разных разделах. Я прошла по всем интервикам в рувичном шаблоне и сделала штук 25 перенаправлений по ощущением, засада у меня вышла только с арабским и немецким разделами (что-то там технически у меня не выходит, увы). Если бы увидеть где-то список Википедий, где нужно создать перенаправление, то я готова ещё помочь. По поводу скрипта подсветки неоднозначностей, скажу только за бевики. Мои попытки установить его хотя бы гаджетом не удались, поэтому буду очень благодарна, если кто-то подскажет мне, в чём ошибка. Вот эта страница выглядит симпатично, но очевидно, что при увеличении количества переводов, она слишком расползётся. Будет разумно, если столбцы и строки прямо сейчас поменяют местами. Ну и как бонус, сделала перевод на белорусский язык, выслала только что почтой.--Хомелка :) / обс10:57, 31 января 2012 (UTC)[ответить]
Может ли бот выставлять на отдельную страничку списки новых сирот, т.е. статей, определённых им как сирота при каждом новом прохождении. Желательно, чтобы эти статьи находились бы в отдельном списке хотя бы неделю. На тулсеревере есть категория по дате создания, но она начинается с самых старых статей и добраться до свежих сирот практически невозможно. Учитывая, что значительная часть новых сирот появляется при переименовании статей и создании на старом месте неоднозначностей, данная мера позволит хотя бы остановить (или сильно замедлить) появление новых страниц сирот. Т.е., можно было бы заходить на эту страничку время от времени и разгребать новых сирот, созданных из-за лени участников, переименовавших статьи, но не переставивших на них ссылки. И можно будет спокойно разбираться с древними завалами--Фидель2216:14, 22 февраля 2012 (UTC)[ответить]
Поскольку бот сам нуждается в этих данных для простановки и снятия шаблонов, он их собирает, и они доступны по ссылке. В архиве много всего интересного. Mashiah21:02, 24 февраля 2012 (UTC)[ответить]
Там архив в формате 7z, если его распаковать, то можно найти все данные по изменениям на текущий день (точнее, на тот день, в который работал тулсервер в последний раз). Если открывается как текст, то сохраните его к себе на компьютер как файл с расширением 7z.
Спасибо. Я открыл. В архиве 14 файлов - непонятно который из них содержит свежих сирот. Ссылка на последнюю страницу при сортировке по дате действительно была бы удобнее.--Фидель2216:53, 26 февраля 2012 (UTC)[ответить]
Нужно только учитывать, что эти два списка не есть одно и то же. Один упорядочивает по дате создания, другой даётся в момент превращения в изолированные. Mashiah20:09, 26 февраля 2012 (UTC)[ответить]
deset — список новых тупиковых, derem — «больше не тупиковые», orem — больше не изолированные, ncaset и ncarem — (не)категоризованные, а все _1, _1_1 и так далее — как раз новые изолированные. Но в общем да, сложно. Львова Анастасия17:44, 26 февраля 2012 (UTC)[ответить]
Коллеги, мне кажется очень неудобным: сперва качать архив, после его открыть и обнаружить 13 текстовых файлов. Нужно иметь решимость, чтобы копировать руками все эти названия. Быть может, возможно сделать одну wiki-страницу? --Gruznov20:48, 15 мая 2012 (UTC)[ответить]
Идея хороша, но позвольте поинтересоваться: а в чём сакральный смысл работы именно с новыми статьями-сиротами? По опыту работы проекта они-то как раз сами более-менее рассасываются, и двадцатитысячный корпус статей-сирот имеет более-менее постоянное ядро тысяч так на 15-18. Вот его-то по-хорошему и надо разгребать-разгрызать, но там каждый случай зачерствел и твёрд как научный гранит. --Rave21:16, 15 мая 2012 (UTC)[ответить]
По состоянию на 7 февраля 2013 года, больше 1000 статей было создано за последние 38 дней. За некоторые года меньше. Страница со «свежими» сиротами будет полезна и тем, что в нее будет попадать много статей с вопросами по значимости, на которые никто не ссылается--FireWire19:46, 7 февраля 2013 (UTC)[ответить]
Что случилось с мускулом?
Работаю над своими статьями в сторону улучшения по инструменту создатели изолированных статей, однако что-то он в последние дни завис. Что за баг с базой данных? 102RB19:58, 24 февраля 2012 (UTC)[ответить]
подскажите, пожалуйста: вот у меня категория Фармация находится в кат. Медицина. А Фармакология — и в Медицине, и в Фармации. Это допустимо, или надо убрать? Хотелось бы оставить именно так, но я не учил теорию множеств и нахожусь в некоторой растерянности. Akim Dubrow23:08, 3 марта 2012 (UTC)[ответить]
Мне не очень нравится, когда включают в категорию и в её подкатегорию - это лишь личное мнение. Что касается теории множеств, она здесь не применима. Это теория категорий. В качестве примера, если некая статья относится к категории "Изолированные статьи", а эта категория относится к категории "Специальные категории", то эта статья, конечно же, специальной категорией не является. Mashiah20:39, 5 марта 2012 (UTC)[ответить]
Честно говоря, в кат. Фармация (да и в Психиатрия) сейчас такой бардак, что это незначительное сознательное отступления от иерархичности — сущий пустяк. =) Спасибо разъяснение, а то я недавно недоглядел, и устроил закольцовку категорий, с тех пор отношусь с большой опаской к их категоризации. Со статьями-то несколько проще. Akim Dubrow21:28, 5 марта 2012 (UTC)[ответить]
Саботаж инструментов проекта?
Обращаю внимание участников проекта на появление массовых правок такого типа: [3], [4], [5]. То есть выведение статей из категории тупиковых путём викификации единственного слова. — Ivan A. Krestinin21:32, 21 мая 2012 (UTC)[ответить]
Ничего криминального тут нет. Шаблоны {{тупиковая статья}} и {{rq|wikify}} несут всё-таки разные функции. От таких правок статьи действительно перестают быть тупиковыми, и это хорошо. --Rave21:57, 21 мая 2012 (UTC)[ответить]
On Thursday, October 25, 2012, Piotr Konieczny wrote:
So it is no surprise when Wikipedia article comes up high in google ranking (моё выделение А.К.). But occasionally a Wikipedia article will NOT be highly ranked, and will appear only in google 20-30+ or even further down the line . Any idea what makes Google dislike certain Wikipedia articles?
There are a bunch of factors. Two that would presumably play a role: Better linking for other topics than the Wikipedia article, the amount of people clicking on the Wikipedia article when it appears in search results, and the content found on the page. Example: Stubs have less content, are less likely to be clicked on and are not likely to be linked to. All bad conditions for optimal SEO.
Sincerely,
Laura Hale
Вероятно, действительно так: улучшение связности отдельно взятой статьи повышает её позицию в результатах поисковых систем, основанных на PageRank или аналогичных алгоритмах. Экспериментально это не проверялось, но похоже на правду. :) -- Andrew Krizhanovsky06:52, 25 октября 2012 (UTC)[ответить]
Студенты 5-го курса ПетрГУ, предмет называется "Интернет-математика", а рассказываю я там про то, что мне интересно, в основном темы из вычислительной лингвистики. Вопросов, к сожалению не было... :( Cтуденты мои ещё начинающие википедисты. Вот темы (на выбор) для написания статьи в течение семестра: Участник:AKA MBG/Todo2012. Пока что особо хвастаться нечем, по-видимому, большая активность будет к зачётной неделе. :) -- Andrew Krizhanovsky11:47, 25 октября 2012 (UTC)[ответить]
Инструмент на тулсервере, позволяющий участникам найти их изолированные статьи, не работает, не перенаправляет и ссылки не даёт.--Arbnos23:46, 28 января 2014 (UTC)[ответить]
Здравствуйте. В укВП работала РобоСтася, но она с нового года не ходит. Если возможность у кого-то запускать туда своего робота, который в руВП работает по связности? Yakiv Glück02:04, 10 марта 2014 (UTC)[ответить]
На данный момент Корабль определяется в статье в трёх вариантах (в т.ч. невооружённые суда), при этом имеет интервики на en:Warship.
Судно определяется как любое плавсредство от водного велосипеда до танкера, но имеет интервики на en:Ship, который строго ограничен крупными судами (никаких en:boats!). en:Boat, в свою очередь, совсем не Лодка, и в английской терминологии определяется простым способом: судно, способное находиться на другом судне - boat, неспособное - ship.
Голем и связанные с ним странички (например, Задача недели) к сожалению умер вместе с тулсервером, я к сожалению в этой части проекта разбираюсь мало, хотя надо будет попробовать всё-таки разобраться. Однако даже и без этой части мой бот исправно выполняет задачи связанные с этим проектом и активность у него немаленькая. Потому по-моему рановато объявлять проект малоактивным. — Ivan A. Krestinin17:04, 29 августа 2015 (UTC)[ответить]
Снимите лучше. Работает ли ещё кто-нибудь прямо сейчас — не знаю. Сейчас вообще лето, в ВП в принципе затишье, если не считать инициатив некоторых госструктур. — Ivan A. Krestinin18:25, 29 августа 2015 (UTC)[ответить]
@Ivan A. Krestinin: Похоже, что только вы работаете в рамках данного проекта, потому что никто не написал кроме вас в обсуждение проекта, по поводу установки шаблона «Этот проект неактивен». Возможно что сюда никто кроме вас не заходит. Лето уже заканчивается, послезавтра уже осень. --Ping08обс21:33, 29 августа 2015 (UTC)[ответить]
Коллеги, а где-нибудь сохранились исходные тексты «роботизированной» части этого проекта? --be-nt-all (обс) 06:26, 10 сентября 2016 (UTC) Ну, или хотя-бы техдокументация, чтобы можно было заново написать? --be-nt-all (обс) 06:31, 10 сентября 2016 (UTC)[ответить]
проект обозначен "малоактивный" потому что те кто ставит шаблон о "не активности" смотрит не на активность участников проекта, а на то как часто ведутся обсуждения на странице проекта (Idot05:39, 30 августа 2015 (UTC))[ответить]
Я создал категорию «Производители письменных принадлежностей», но не совсем понимаю, как правильно присвоить категории производителям канцелярских товаров. Если компания, кроме перьевых ручек, производит другие письменные принадлежности, нужно ли её включать также и в категорию «Производители письменных принадлежностей» (материнская категория для категории «Производители перьевых ручек»)? Нужно ли компанию из категории «Производители письменных принадлежностей» включать также и в категорию «Производители канцелярских товаров» (материнская категория для категории «Производители письменных принадлежностей»)? --Pavlovskteam (обс.) 04:28, 5 апреля 2019 (UTC)[ответить]
Циклы в дереве категорий на август 2020
Здравствуйте. Участник Adamant.pwn проанализировал дерево категорий рувики и обнаружил следующие циклы категорий:
Эта русскоязычная для интервики-ссылок использует элемент https://www.wikidata.org/wiki/Q3434372#sitelinks-wikipedia из Wikidata, а вот англоязычная статья использует совсем другой: https://www.wikidata.org/wiki/Q17468049
В результате сделать в этой статье полный список ссылок на другие языки не представляется возможным.
Полагаю, логичнее оставить тот, который в английской статье, а Q3434372 удалить. Не знаю, как это сделать. Кто знает, рассмотрите возможность исправить.
Похоже, тот сервер, на который ведут почти все внешние ссылки этой статьи, был перемещён. А редирект поставили без напряжения сил — просто на одну и ту же новую страницу. Кто в теме этих ссылок, прошу перепроверить и по возможности поправить. Nikolay Komarov (обс.) 18:10, 28 августа 2020 (UTC)[ответить]
В основном это касается инструментария проекта. К сожалению, описанная вами проблема — следствие смерти Тулсервера и основных инструментов проекта вместе с ним. Сейчас ведутся работы по созданию новых инструментов, Ссылки пока оставлены в надежде на мизерный шанс починки предыдущего арсенала. Если есть конкретные вопросы по работе проекта — можете задавать, например, здесь. — Rave (обс.) 09:57, 29 августа 2020 (UTC)[ответить]
У инструментов открытый исходный код. Но количество владеющих соответствующими языками программистов, готовых заняться запуском существующего кода на новом хостинге, в данный момент равно нулю. — Rave (обс.) 10:41, 29 августа 2020 (UTC)[ответить]
Языки обычно похожи. Ну кроме ассемблера, руби, раста, лиспа. Остальное более-менее одно и то же. Хостинг же стоит брать всё тот же — Toolforge. Проблема разве что может быть в том, что за время неактивности разработчиков (или мейнтейнеров) мог сильно поменяться API Mediawiki и инструмент придётся дописывать. Там один большой кусок кода или разбитый на части по функциям? Можно ли попробовать завести часть? Я могу глянуть на состояние кода и написать сюда свою оценку его состояния. Но сроков никаких дать не могу. Можете дать ссылку на код, который надо бы запустить? Чтобы у меня была отправная точка. — Vort (обс.) 11:17, 29 августа 2020 (UTC)[ответить]
Исходники здесь. Диалог разработчиков есть тут. Если вкратце, то одна часть кода (Голем) анализирует дамп Википедии, отыскивая изолированные и прочие целевые статьи, а другая часть кода (Мелог) — это бот, который берёт те первичные результаты работы и согласно им идёт по списку статей Википедии, устанавливая/снимая шаблоны. — Rave (обс.) 14:44, 29 августа 2020 (UTC)[ответить]
Ухх, мешанина из sh, php, sql, c#, perl. Может, ещё что-то пропустил. Теперь понятно, почему было мало желающих в это вникать. Ну я попробую завести. Начну с Голема. Трогать шаблоны кодом десятилетней давности пока что не стоит. — Vort (обс.) 15:19, 29 августа 2020 (UTC)[ответить]
Как я понял, работа Голема основана на трёх базах данных: собственной, википедийной и тулсерверной. Собственную он сам создаёт, сам пользуется, вроде тут проблем быть не должно. Википедийную, теоретически, можно собрать из дампов. Но формат базы с момента последних запусков Голема мог поменяться. Самая большая проблема с третьей, тулсерверной, базой. Её нет. Вполне может быть, что у Тулфорджа есть аналогичная база и после адаптации её может будет подключить к Голему. Если же нет, то базу надо формировать вручную. Вроде бы, там никаких особо уникальных данных не было, так что можно даже попробовать забить её произвольными данными. Но главный вывод таков: без модификаций Голема не запустить. Я буду ещё смотреть, что с ним можно сделать. Попробую наполнить основную базу из дампа, поставить заглушки на тулсерверную, но что из этого получится — не знаю. — Vort (обс.) 21:15, 29 августа 2020 (UTC)[ответить]
@Rave: удалось запустить основную часть функций Голема на примере базы be_x_old: [6][7][8]. Для этого пришлось создавать с нуля таблицы language, namespacename и wiki базы toolserver, а также исправлять и адаптировать SQL код для поддержки MySQL 8й версии. Я хотел бы выложить на GitHub те модификации, которые я сделал в коде, но у меня не получается скачать репозиторий по той ссылке, которую рекомендует Gerrit. Может ли кто-нибудь скачать и переслать мне архив с git репозиторием connectivity? — Vort (обс.) 15:04, 31 августа 2020 (UTC)[ответить]
Здравствуйте. Если восстановится работа инструментов, упомянутых в предыдущей теме, то все эти вопросы решатся автоматически. — Rave (обс.) 15:56, 29 августа 2020 (UTC)[ответить]
Обнаружил, что ряд плохо связанных статей не отслеживается:
Статья-сирота Чары гипотезы Пуанкаре ни в одной из версий не содержит пометки об изолированности. Единственная ссылка на неё шла из несвободного изображения, которое в ней же используется. Это касается вообще изображений из Википедии, которые "связывают" статьи, или проcто здесь бот не сработал? всё в порядке, не увидел
Статьи, которые связаны ссылками через навигационные и прочие шаблоны, в том числе примечания, подписи на картах, схемах, под изображениями и т.д. Те же навигационные шаблоны и шаблоны вроде {{Wikidata/Ancestors}} в мобильной версии не видны (и в десктопе часто свёрнуты) и по факту статья может быть изолирована у львиной доли читателей.
С другой стороны навигационный шаблон — это ведь как ссылки из какого-нибудь раздела вроде «см. также» или чего-нибудь подобного. То есть такие статьи действительно не такие уж изолированные) Maryanna Nesina (mar) (обс.) 17:12, 29 августа 2022 (UTC)[ответить]
При этом раздел См.также виден в мобильной версии, которой пользуются более половины читателей. То есть на ru.wikipedia.org статья связана шаблоном, а на ru.m.wikipedia.org может ещё нет. Proeksad (обс.) 17:23, 29 августа 2022 (UTC)[ответить]
К тому же, если шаблон свёрнутый или не свёрнутый, но очень громоздкий, то (с точки зрения перехода из статьи в статью) его ценность ниже даже в десктопе. Proeksad (обс.) 17:33, 29 августа 2022 (UTC)[ответить]
https://petscan.wmflabs.org/?psid=23514609 Участники Великой Отечественной войны — 765 на 20.12.2022, 741 на 21.02.2023, 733 на 03.04.2023, 723 на 28.07.2023, 719 на 19.11.2023, 714 на 17.02.2024, 699 на 31.03.2024, 661 на 03.04.2024, 584 на 22.04.2024, 565 на 03.05.2024 на 03.05.2024
https://petscan.wmflabs.org/?psid=22585275 Участники Олимпийских игр — 240 на 20.12.2022, 271 на 21.02.2023, 281 на 03.04.2023, 347 на 28.07.2023, 385 на 19.11.2023, 431 на 17.02.2024, 461 на 31.03.2024, 458 на 22.04.2024, 460 на 03.05.2024
https://petscan.wmflabs.org/?psid=23446773 Лауреаты (есть и нобелиаты, например Саагян, Дорк) — 546 на 20.12.2022, 570 на 21.02.2023, 565 на 03.04.2023, 544 на 28.07.2023, 536 на 19.11.2023, 560 на 17.02.2024, 562 на 31.03.2024, 557 на 31.03.2024, 557 на 22.04.2024, 555 на 03.05.2024
https://petscan.wmflabs.org/?psid=23514606 Химические вещества 477 на 20.12.2022, 396 на 21.02.2023, 359 на 03.04.2023, 327 на 28.07.2023, 322 на 19.11.2023, 305 на 17.02.2024, 303 на 31.03.2024, 300 на 22.04.2024, 303 на 03.05.2024