Хотелось бы узнать мнение, в каком виде лучше давать формы слова?
Можно явно указывать все суффиксы и окончания для максимальной точности, сооружая примерно такие выражения:
\b(А|а)банент(а(?:ми?|х)?|у|о[вм]|е|ы)?\b — причём только для существительных.
Если добавить поиск и прилагательных во всех формах (абонентный, абонентский) то получается вообще ужасно.
Или же можно писать просто \b(А|а)банент(\w*?)\b, но тогда будут находиться и «исправляться» в том числе и явно ошибочные варианты типа «абанентовпредупреждают». Причём это будет внесено в описание правки.
Я обратил внимание, что в английском и французском списках всегда явно указывают все словоформы и не используют подобные подстановки. Solon15:26, 1 декабря 2006 (UTC)[ответить]
Англичанам и французам проще - у них морфология поскромнее. Можно вместо * (zero or more times) использовать например {0,5} (0 to 5 times). BTW, *? не имеет смысла, т.к. ? = 0 or 1 time. Если я конечно ничего не путаю ;-) --Volkov(?!)15:44, 1 декабря 2006 (UTC)[ответить]
На самом деле, имеет. "*" и "+" - так называемые "жадные" (greedy), то есть повторение происходит наибольшее возможное число раз. Например из строки "профффесор кислых щей" по шаблону: \b(П|п)ро(ф+)е(с+)ор(.*)\b будет найдено целиком "профффесор кислых щей", а не просто "профффесор", так как под "(.*)\b" будет расценена последовательность: " кислых щей". Если вместо ".*" написать ".*?", то "*" станет "ленивым" (lazy), и повторение будет произведено минимальное количество раз, то есть до первого "\b", и результат будет "профффесор". А вообще есть рекомендация "use the dot sparingly", и вместо точки лучше использовать что-то более конкретное. Но это не совсем по теме. :) Solon16:56, 1 декабря 2006 (UTC)[ответить]
Разное
Убрал некоторые неработающие и уе присутствующие в программе автозамены. Но думаю, что вообще не стоит включать сюда замены, не связанные с орфографией, чтобы не создавать путаницы. Вообще конечно было бы удобно иметь возможность произвольно подключать к AWB любые подобные списки автозамены, которые можно было совместно редактировать в вики. Но это уже скорее вопрос к разработчикам. Solon11:20, 12 апреля 2008 (UTC)[ответить]
Слова-то может и разные, но писать одно из них через Е — это бред сивой кобылы. Или вы произносите в каких-то случаях ещё через Е (е́ще / еще́) ??? — Dirl20:54, 13 июня 2008 (UTC)[ответить]
По крайней мере, в в словаре Ушакова пишется именно так. А произносятся они действительно по-разному. Как минимум можно говорить о неустоявшейся норме. А значит, (полу)автоматически заменять где попало еще на ещё не стоит.
Именно поэтому исправление орфографии Автовикибраузером в автоматическом режиме отключено. Я считаю, что в подавляющем большинстве случаев замена оправдана, а в тех единичных случаях, где нет ответственность лежит на пользователе бота или AWB. — Obersachse16:08, 9 марта 2009 (UTC)[ответить]
То есть эту штуку запускают вручную, в управляемом режиме? Тогд ОК — кажется, все возможные сомнительные случаи в этом списке человек может отследить. Разве что на всякий случай хочу сообщить всем пользующимся, что если когда-нибудь им встретится словосочетание «зеленое вино» (например, в песне из оперы Римского-Корсакова «Садко»: «Обносите зеленым вином, Зеленым вином заморским!»), то в этом древнерусском обороте нет буквы «ё», потому что ударение падает на окончание: «зелено́ вино», «зелены́м вином» (и имеется в виду отнюдь не цвет). Андрей Романенко16:26, 9 марта 2009 (UTC)[ответить]
False positives есть всегда, не только на этой ошибке. Тот же бренд/брэнд. Просто надо ботов лишний раз не гонять по ним. —LimeHat16:25, 11 июня 2009 (UTC)[ответить]
Никто специально и не гоняет. Просто будешь проставлять\удалять\изменять категории или проставлять шаблоны и в фоновом режиме сделаешь такую групую замену. Причем не понятно ее происхождение. Факт опечатки единичен, зачем ее занесли в общий список частых опечаток\орфографических ошибок. — Дмитрий Никитин17:15, 11 июня 2009 (UTC)[ответить]
Я же говорю — такие случаи встречаются на разных заменах. И на ёфикации (например, статьи Ё (кириллица)); и на бренд/брэнд (примеры сейчас не вспомню, но буквально сегодня несколько раз сталкивался, исправляя эту ошибку) и прочее прочее. Поэтому, проблема более "глобальна", чем с ногой. Поэтому и говорю — а стоит ли лишний раз (при той же массовой категоризации) исправлять их ботами? —LimeHat17:39, 11 июня 2009 (UTC)[ответить]
Хочу попросить отправить бота исправить «агенств_» на «агентств_», «приемлим_» на «приемлем_», «военоначальник», «военноначальник» на военачальник, коммандир на командир, комманд_ на команд_, коментари_ на комментари_. Ещё нужно исправить ошибки по этому списку, иначе для чего он существует в Википедии?! Кроме кеш/кэш, там сейчас война. Большое спасибо! Четыре тильды08:55, 11 июня 2009 (UTC)[ответить]
Всё, что может вызвать споры, обязательно их вызовет. К примеру, на странице обсуждения Ё (кириллица) вы можете найти сентенции, что нужно вернуться к "стандартному языку" без написания "ё". А в данном случае Четыре тильды приводит авторитетный источник: Русский орфографический словарь: около 180 000 слов / Российская академия наук. Институт русского языка им. В. В. Виноградова / О. Е. Иванова, В. В. Лопатин (отв. ред.), И. В. Нечаева, Л. К. Чельцова. — М., 2005. — 960 с. — ISBN 5-88744-052-X. -- AVBtalk19:47, 11 июня 2009 (UTC)[ответить]
Ещё предложение, исправлять написание единиц измерений (далее регэксп-псевдокод):
([0-9]+)\s*Герц → \1 герц
([0-9]+)\s*гц → \1 Гц
([0-9]+)\s*[кК]гц → \1 кГц
([0-9]+)\s*[мМ]гц → \1 МГц
Здесь имеется ввиду, что "герц" после числа должен идти с пробелом и со строчной буквы, сокращение пишется с прописной ("Гц"), "кило" со строчной ("кГц"), а "мега" - с прописной ("МГц"). Причём в исходном контексте суффикс может идти без пробелов после числа, с одним или несколькими пробелами (\s*), а пробелы могут быть простыми или неразрывными (а если будет обрабатываться тег , будет тоже хорошо). Соответственно, при замене после числа должен добавляться неразрывный пробел (дай бог памяти, это \uA000). Ещё было бы здорово, если бы игнорировались ссылки в суффиксах (пример). -- AVBtalk20:27, 13 июня 2009 (UTC)[ответить]
Теоретически может быть и «по окончанию», например, «по окончанию слова можно определить падеж», возможно, что-то подобное может встретиться в статьях по лингвистике. --Дарёна17:21, 14 июня 2009 (UTC)[ответить]
Я являюсь автором/слежу за многими статьями по вселенной «Вавилона-5». Проблема в том, что многие правки изобилуют неграмотными фразами и т.д. Все это решаемо. Однако, прописать подобное исправление мог бы и бот. Одна закавыка - нет ли пересечений со статьями по известной древней цивилизацией?
Прошу переписать в текстах статей все совпадения подобного рода, особенно тех статей, которые прописаны в категории Вавилон-5. — Эта реплика добавлена участником Zac Allan (о • в) 20:03, 30 июня 2009 (UTC)[ответить]
По-прежнему нет желающих? Жаль. А то ляпы в тексте лежут глаз. Можно было бы в какой-нибудь «литературно-исправляющий» бот добавить функцию... - Allow21:16, 1 июля 2009 (UTC)[ответить]
Предлагаю заменять последовательность цифр, после которой идёт неверный суффикс, на цифры с верным суфиксом. Ориентировочный регеэксп для правила "Однобуквенное наращение используется, если последней букве числительного предшествует гласный звук или мягкий знак":
(\d-)[аеёиоуыэюя](\a\b) → $1$2
Здесь из конструкции вида (цифра)(дефис)(гласная буква)(ещё одна буква) убирается гласная буква после дефиса (списки гласных и согласных букв см. в согласные). Пример: "5-ый" → "5-й". Под "\a" и "\b" я обозначил "любая кириллическая буква" и "не буква" соответственно.
В варианте (цифра)(дефис)(три буквы) нужно убирать одну (первую) букву, если вторая буква согласная (иначе: не-гласная) в соответствии с правилом "Двухбуквенные наращения используют, если последней букве числительного предшествует согласный звук", либо убирать две (первую и вторую) буквы, если вторая - гласная (см. выше правило про однобуквенный суффикс). Примеры: "10-ого" → "10-го", "16-тый" → "16-й".
-- AVBtalk03:03, 27 июля 2010 (UTC)[ответить]
словесные суффиксы у годов
Наконец, нужно доработать обработку годов. Во-первых, я встречал конструкции вида
[[1960]]-е и [[1960]]-х
В этом случае суффикс ("-е" и "-х") нужно вносить в ссылку:
[[1960-е]] и [[1960-е|1960-х]]
соответственно. Разумеется, суффикс должен пройти обработку, упомянутую выше:
[[1960]]-ые → [[1960-е]]
Во-вторых, если после числа (простого или в текстовой части ссылки) идёт суффикс (кроме "-е" и "-х") и буквы "год" (через простой или неразрывный (!) пробел), то суффикс надо убирать (см. правило "Кроме того, не наращивают окончания для номера года и числа месяца, если слово «год» и названия месяца следуют тотчас за числом... Неправильно: в 1991-м году; 5-го марта 1953-го года"). То есть должны обрабатываться случаи
В статье Бунин, Юлий Алексеевич предлагается замена: переговоры с петербургскими народниками -> переговоры санкт-петербургскими народниками. Нужно как то подправить.
Просмотрел случаи употребления: половина — в цитатах из источников с дореволюционной орфографией, половина — какие-то месопотамские имена собственные. Думаю, можно безболезненно удалить замену «итти — идти», так как потенциальный вред от ее существования превышает возможную пользу. --Bandar Lego22:12, 3 сентября 2010 (UTC)[ответить]
Написание «каратэ» присутствует в официальных наименованиях нескольких организаций и в названии огромного числа книг и статей на русском языке. Считаю, что автоматическая замена «каратэ → карате» безусловна вредна, так как приведёт к искажению наименований организаций и выходных данных источников. Предлагаю эту строчку удалить. INSARо-в13:49, 3 августа 2011 (UTC)[ответить]
раз так -- удаляйте. Я полагаю, что консенсуса тут можно ждать годами, поэтому вообразим, что процедура по изменению носит уведомительный характер, а не согласовательный, т.е. изменил, оповестил на странице обсуждения и дело в шляпе. — Dnikitin14:07, 3 августа 2011 (UTC)[ответить]
(Санкт-)Петербург
Я временно удалил замену, связанную с этим словом, по причине большого числа ложных срабатываний ("параллельно с Петербургской" на "параллельно санкт-Петербургской", "200 л. с. петербургского завода" на "200 л. санкт-петербургского завода", информация от INSAR). Поскольку код довольно сложный, прошу тех, кто лучше разбирается в регэкспах, сузить его область действия.
Я не понимаю, почему все маски неправильного написания начинаются с ограничителя \b, говорящего о том, что слово должно начинаться на этом месте. Вполне можно себе представить сложносоставные слова, отличающиеся от приведённых какой-либо приставкой или вторым корнем, такие при текущей схеме будут пропущены. Соответственно, предлагаю из начала масок \b поубирать. MaxBioHazard04:15, 20 января 2012 (UTC)[ответить]
В списке нет ни слова "ареал", ни слова, похожего на "обитание" и мой АВБ в режиме исправления ошибок подобных замен не делает (проверил на этой СО). Где такое было ? MaxBioHazard17:32, 25 февраля 2012 (UTC)[ответить]
Это предложение ввести. К слову "ареал" определение "обитания" лишнее, между тем весьма распространённая ошибка. Когда говорят "ареал обитания", всегда в таких случаях нужно заменить на ареал. Λονγβοωμαν17:48, 25 февраля 2012 (UTC)[ответить]
Непрофильный источник, к тому же в географии населения (99,9% используется в биологии). А вообще есть даже специализированные словари такие, что должны даже прежде Каутского в печку лететь (печально известный Соколов). Но вопрос падежей автозаменами не решается, так что здесь это не актуально. Λονγβοωμαν18:39, 25 февраля 2012 (UTC)[ответить]
Ладно, включил, учитывая, что режим исправления ошибок у АВБ полуручной и правку каждой статьи надо отдельно подтверждать. Если у кого-то останутся претензии, обсуждайте здесь. MaxBioHazard19:24, 25 февраля 2012 (UTC)[ответить]
Подскажите, пожалуйста, как-то можно отключить автозамену отдельных слов белорусского языка? Например, «раён» → «район». Пробел в начале строки не получается, так как слово находится в списке литературы. — StanTRC09:24, 27 июня 2012 (UTC)[ответить]
в городе Москве
В названии закона: «О внесении изменений в Закон города Москвы от 15 октября 2003 года № 59 „О наименованиях и границах внутригородских муниципальных образований в городе Москве“» AutoWikiBrowser убирает слово городе. Permjak18:10, 1 июля 2012 (UTC)[ответить]
Какой-то код, используемый викификатором, заменяет "чем" на "чём", что не всегда корректно (пример: "нам не о чем сожалеть" → "нам не о чём сожалеть"). -- AVBtalk01:28, 22 ноября 2012 (UTC)[ответить]
Думаю, что данную автозамену надо убирать. Сегодня один участник пожаловался на то, что у него эта замена сработала некорректно. Там фраза «рухнул в месте с координатами ...» была заменена на «рухнул вместе с координатами ...». Причём это уже было неоднократно. Так что я строчку <Typo word="вместе (с)" find="\b(В|в) месте\b(?= с )" replace="$1месте" /> пока убираю.-- Vladimir Solovjevобс11:57, 2 декабря 2012 (UTC)[ответить]
Требуется сделать автозамену для неправильных форм слов «лучше», «лучший» и других однокоренных. Для слова «лучше» встречаются такие неправильные варианты: «лутше», «лучще», «лушче», «лучьше», «лудше» (даже такое встречается). Насколько я вижу в последних правках, правильное регулярное выражение подобрать не удаётся. --newMitЁk06:28, 7 марта 2013 (UTC)[ответить]
Проблема тут скорее в том, что есть слова исключения, которые подходят под регулярное выражение. Например:
в цитате«худого человека, а лутших людей, Самка с таварищи, от начальства отлучили».
Я пытался сделать универсальную регулярку, но, видимо, если достигать цели, чтобы замены работали максимально аккуратно, то нужно сделать набор из нескольких регулярных выражений, чтобы отсекать вышеуказанные false positive. --Movses08:39, 7 марта 2013 (UTC)[ответить]
Думаю, цитату надо в nowiki заключать - мало ли какая ещё цитата с "неправильным" написанием будет, не на современном русском языке. С цитатами это вопрос сложный, интересно, где-нибудь есть рекомендация заключать цитаты в nowiki?--newMitЁk09:35, 7 марта 2013 (UTC)[ответить]
Если желаете, то можете дополнить Википедия:Цитирование ... Практически вы всё равно не заставите людей оформлять по правильному, поэтому при использовании регулярок надо учитывать, что может быть всё что угодно... --Movses10:00, 7 марта 2013 (UTC)[ответить]
Например, эта статья будет «исправлена», и никакими выражениями этого не изменить, если не использовать nowiki — статья намеренно так написана. А вообще, пользователь AWB должен следить за правками и проверять, не испортилось ли что-нибудь после редактирования. Тут уже ответственность как и автора статьи, так и редактора.
Ну, учитывать в автозамене цитаты с авторским написанием слов невозможно - именно поэтому у AWB, который эту автозамену использует, стоит пометка - проверяйте изменения перед сохранением. Теоретически, в английской справке написано что цитаты вообще не обрабатываются автозаменой, но не указано как именно он определяет где цитата а где нет. По поводу непосредственно регэкспа: "Лутш" и "Лушчыцкi" отсекаются, если указать в конце регэкспа (и|е), тем самым ограничив его применение словами типа лушче, лушчий, лушчие и так далее. Основная проблема - исправлять написание "лучче", но при этом не исправлять "Луччи" - и я не совсем представляю как это написать компактно, без расползания на два регэкспа, для "лучше" и для "лучший"/"лучшие" и так далее. --Mitas5710:58, 7 марта 2013 (UTC)[ответить]
Предлагаю такое: <Typo word="лучший" find="\b(Л|л)у(тш|чщ|шч|чьш|дш|шш|шщ|щщ|щч)(и\B|е\b)" replace="$1учш$3" />. Конструкция в конце обрабатывает либо "и" не на конце слова, либо "е" на конце - так что Луччи пропускается. --Mitas5711:18, 7 марта 2013 (UTC)[ответить]
Гм, нет. Значит, нужно ограничение что "и" не может быть в конце слова, а вот "е" - может быть и в конце и не в конце. (и\B|е). Еще хорошо бы учесть, что есть слова типа "улучшение", "улучшить" и подобные. Получится <Typo word="лучший" find="\b(У|у)?(Л|л)у(тш|чщ|шч|чьш|дш|шш|шщ|щщ|щч)(и\B|е)" replace="$1;2учш$3" />
Мда, это уже жестче. Я бы не взялся и это поймать и невинных выражений не наловить. И вообще, регэкспы же не всесильный инструмент :) --Mitas5718:28, 7 марта 2013 (UTC)[ответить]
Что-то «везёт» сочетанию «СТВ» на пропажи: «отсутсвие» (больше 30 вхождений) — похоже, непроизносимые согласные выпадают ещё и на письме... 149.62.3.23318:20, 16 марта 2013 (UTC)[ответить]
Сообщать о таких ошибках или не надо? Что общего правила нет, понимаю, потому и спрашиваю. Если надо, вот первый случай: (Н|н)астояш(его|ий|ие|...) → $1астоящ$2 37.147.205.16216:46, 2 апреля 2013 (UTC)[ответить]
Я вот не сторонник добавления редко встречающихся замен опечаток. Их проще один раз их поправить, чем захламлять список. А вот какие-то общие правила вполне можно. Например, для «ш» → «щ» можно добавить замену «-ншик» → «нщик» (там только «пуншик» исключение). Ну и вообще подумать, какие ещё есть паттерны. — putnik17:56, 2 апреля 2013 (UTC)[ответить]
Викификатор превращает медицинский термин «котрансплантация» в «которансплантация» (на этой странице почему-то случается, только если выделить само слово). На странице обсуждения Викификатора сказано писа́ть сюда. DmitTrix09:18, 23 мая 2013 (UTC)[ответить]
Исправлено, но правило пока вообще убрано из замен для Викификатора, надо будет думать, как корректно написать преобразование в JS-регекспы. — putnik18:05, 14 ноября 2013 (UTC)[ответить]
Я удалил эту замену - насколько я знаю регэкспы, она вообще ничего не делает, кроме добавления этого вопроса (я мог бы её исправить, но тогда она бы вообще ничего не делала), а нормальная замена для этого же слова прописана строкой выше. MaxBioHazard18:29, 28 декабря 2013 (UTC)[ответить]
Было find="\b([Цц])етр(\w*)\b" replace="$1ентр$2". Чтобы ловило как в заголовке, надо find="\b([Цц])е(тр|нр)(\w*)\b" replace="$1ентр$3"92.242.90.24602:32, 18 мая 2014 (UTC)[ответить]
Хочу заменить ссылки типа [http://twitter.com/(*)/status/(*) (*)] [https://twitter.com/(*)/status/(*)] [http://twitter.com/(*)/status/(*)] [https://twitter.com/(*)/status/(*)] на шаблон {{Твиттер}} в своей вики. Как это можно сделать в AWB??
Викификатор берёт замены не из этого списка, ответственность за корректное составление списка для викификатора - на составителе того списка. АВБ делает здешние замены только в полуручном режиме, оператор должен отслеживать подобные случаи. Не сделаноMaxBioHazard17:54, 21 мая 2015 (UTC)[ответить]
"Начнется" и "самопровозглашенный"
Прошу сделать так, чтобы при викификации текста слово «начнется» заменялось на «начнётся», а «(само)провозглашенный» (-ая и прочие окончания) — на «(само)провозглашённый». Кадош20:57, 22 марта 2015 (UTC)[ответить]
В режиме исправления Typos'ов в АВБ нельзя включить полный автомат, в нём работает только ручное сохранение каждой правки после предпросмотра диффа. Исходя из этого, подобные замены, неадекватные в других языках, в списке оставляются, т.к. предполагается, что правщик увидит дифф перед сохранением правки и не станет его сохранять. Не понравившаяся вам правка не могла быть совершена через АВБ, т.к. отключить добавление в описание правки текста "с помощью АВБ" можно только с учётки со флагом бота, кроме того правка вообще немассовая. Возможно, это сделал викификатор, но у него свой список замен, лежащий в его js-файле, он не берёт замены из АВБшного списка. На основании вышенаписанного предлагаю восстановить удалённую вами замену. MaxBioHazard12:09, 3 мая 2015 (UTC)[ответить]
Насколько я понимаю, Putnik обновляет гаджет скриптом, а специальной отметки «только для ботов, в гаджет не переносить» в ВП:Typos не предусмотрено. Кроме того, есть достаточно много примеров, где это срабатывает некорректно и в русском тексте — всевозможные названия организаций, групи…; в то же время, некоторые нужные автозамены не проводились (например, в русском тексте «групой» → «группой»). Думаю, что эта замена достаточно сложная, поэтому её лучше периодически производить отдельным проходом по результатам поиска. NBS18:53, 3 мая 2015 (UTC)[ответить]
Да, переношу скриптом, копируются все правила, которые можно воспроизвести при помощи регулярных выражений на JS. — putnik18:58, 3 мая 2015 (UTC)[ответить]
Комунерос
Не могу составить правило для исключения слова комунерос. Сделал было так (К|к)ом+ун+(?!ерос), но оно не работает. Тут бы пригодился свержадный квантификатор (К|к)ом++ун++(?!ерос), но они не поддерживаются. Есть идеи? Игорь Темиров13:12, 21 июля 2015 (UTC)[ответить]
По поводу правила "Коммунизм". Я понял, коллега, что не понимаете, потому и написал, тренируйтесь в личном пространстве. Я вернул страницу к консенсусной версии от 10 февраля и начинать обсуждение должны вы, а не я. Претензии изложены в комментариях к правкам. Что я должен к ним добавить? Лишь то, что, если видите работающее правило, не стоит ломать его, а постараться модернизировать. В данном случае, например, возможен такой вариант: find="\b(К|к)ом+ун+(?!ерос|иг)", но вы предпочли сделать из одного работающего правила два, причём одно из них неработающее. Я уже не раз, как вы помните, правил за вами новые правила, но в данном случае, когда вы ломаете старые, счёл правильным этот путь исправления. Игорь Темиров05:05, 28 февраля 2016 (UTC)[ответить]
некий "комумунизм" - это из вашей правки: <Typo word="коммунизм", чтобы было понятно, о каком правиле идёт речь.
По поводу неправильных замен этой вашей версии, я написал в комментарии: "Съедаются две буквы в правиле "комумунизм". Тренируйтесь в личном пространстве". Что тут непонятного? Вместо того, чтобы спрашивать здесь, просто применили бы ваше правило и, если бы и после этого было непонятно, тогда бы писали. Игорь Темиров06:12, 28 февраля 2016 (UTC)[ответить]
Typo word="коммунизм" find="\b(К|к)ом+ун+и[^г]" replace="$1оммун" />: "коммунизм" => "коммунм". Жаль, что у вас под рукой нет AWB, чтобы в AWB Regex Tester испытать ваше правило, как я вас просил, и получить тот же результат. Игорь Темиров06:55, 28 февраля 2016 (UTC)[ответить]
Предлагаю добавить в автоисправление удаление устаревших параметров шаблона {{НП}} (размер карты (страны/региона/района) и ЯндексКарта). Гонять ради них бота жалко, а вот если добавить сюда, то небольшими темпами оно частично будет вычищено вместе с сопутствующими правками. -- dima_st_bk07:56, 2 мая 2016 (UTC)[ответить]
А первое слово существует? Список не обязан корректно обрабатывать несуществующие слова; он пишется в расчёте на существующие. MBH23:10, 19 июля 2016 (UTC)[ответить]
Вы исключили из обработки сложные слова типа «четырёхэтажный» — пожалуйста, верните. А слово «четыремя» разве существует, что ради него надо что-то менять? Должно быть «четырьмя», не? DmitTrix (обс) 07:30, 20 июля 2016 (UTC)[ответить]
Вот здесь (правки) викификатор отработал некорректно. Поскольку существует корректное слово укр.Комунарський, то предлагаю в коде MediaWiki:Gadget-wfTypos.js исправить строку
Добрый день!
Скажите, пожалуйста, викификатор умеет заменять е на ё? Здесь написано что да, однако у меня (Google Chrome 55) этого не происходит (по крайней мере на тексте "Найдем зеленый цвет"), хотя другие функции работают (в частности замена "т.е." на "то есть"). Спасибо! Дима74 (обс.) 18:24, 27 января 2017 (UTC)[ответить]
Предлагаю добавить в гаджет исправления орфографии слово «молодёжь» и все производные. С белорусским, болгарским и украинским нежелательных совпадений нет, я проверил. Могу ошибаться, но выглядеть это должно так:
Вторая регулярка выглядит более безопасно, но она не ловит "науч.-практ. молодеж. конф." И обе регулярки не ловят "Техника-Молодежи" и "(молодежь)". Также не ловятся "«Молодежь Эстонии»", "«Молодежь Алтая»", хотя кавычки лучше и не ловить — вполне возможно, что в оригинале имя собственное без "ё". --Movses (обс.) 09:22, 1 февраля 2017 (UTC)[ответить]
О чём вы говорите? Вы думаете, что я захожу в АвтоВикиБраузер, чтобы вручную вписать туда код замены br’ов, пройтись по статьям и заменить исключительно их? Мне проще было бы это делать через Википедию, где викификатор с этим прекрасно справляется. Поэтому мой ответ — да, я сохраняю правку с другими необходимыми изменениями (вычищал ненужные флаги из карточек, можете посмотреть в моё вкладе). ←ALEX GREAT[обсуждение]02:43, 26 мая 2017 (UTC)[ответить]
Ёфикация
Просьба добавить замену таких слов: шахтер → шахтёр, молодежный → молодёжный, партнер → партнёр, провел → провёл, прошел → прошёл, пришел → пришёл, перешел → перешёл. Спасибо. — Mitte27 (обс.) 22:19, 31 января 2018 (UTC)[ответить]
(Добавлено в список техзадач на будущее)
Этот невидимый раздел используется для формирования ссылок на разделы на странице поиска. Тхздч 2018-02-08: Добавить ёфикацию в викификатор. Mitte27. /Тхздч.
Ох-ох. Слова с корнем «шёл», в принципе, могли бы исправляться уже сейчас — соответствующее правило есть, но проблема возникает на этапе перевода из AWB-формата в JS-формат: скрипт-конвертер почему-то отбрасывает такие правила. Надо выяснять с его автором. — Джек (обс.) 22:55, 8 февраля 2018 (UTC)[ответить]
странно это, учитывая что в реальности их officer это офисный работник (тот кто работает в office), а совсем не наш офицер
Цетрария
Исправление орфографии неправильно срабатывает на статье Цетрария исландская. К сожалению, я не понимаю, почему там ошибочно срабатывает (ведь исключение прописано), потому просьба посмотреть более подкованным людям. — Movses (обс.) 21:13, 26 декабря 2019 (UTC)[ответить]
Movses, я посмотрела, это не только в исландской, но и в других цетрариях тоже не работало. Там в исключении не был прописан вариант со строчной буквой и с ударением. Добавила, вроде работает, и в викификаторе тоже обновила. К слову, надо бы везде ударные буквы проверить. — Alexandrine (обс.) 13:30, 12 июля 2020 (UTC)[ответить]
Мягкий ЧЬ
Встретил ошибку "передачь". Понятно, что произносим мягко, а пишем без мягкого знака. Конкретно эта ошибка встречается не часто (всего 2 раза), потому не добавлял в список автозамен. Но есть чуйка, что если поискать по дампу, то найдётся таких ошибок не одна и тогда можно будет добавить в список автозамен. — Movses (обс.) 22:37, 28 декабря 2019 (UTC)[ответить]
Я сделал запрос к ботоводам, запрошу и здесь. Встретил два раза подряд ошибку (и исправил её) в выражении: тем ни менее вместо правильного тем не менее. Если этого ещё нет в коде викификатора, предлагаю добавить. — 217.197.250.6519:05, 4 июля 2020 (UTC)[ответить]
Здравствуйте! Не совсем вас понял. Для замены обязательно наличие цифр и дефиса, но даже с ними не смог подобрать примера, приводящего к неправильной замене. Не могли бы вы привести хотя бы один такой пример?
На всякий случай — последние по дате изменения регулярное выражение и строка замены в скрипте —
Эту регулярку на днях добавили в викификатор и она стала вызывать подобные ошибки: [5], [6], [7], и тд. Сам не уверен почему она реагирует только на нижнее подчеркивание. Возможно проблема возникает в связи с чем-то ещё, но появилась она ровно в день этой правки. Solidest (обс.) 22:50, 29 мая 2024 (UTC)[ответить]
В начале регулярного выражения присутствует "(\d+)-", что означает одну или несколько цифр, а следом — дефис, они являются обязательными для того, чтобы шаблон сработал. Если в тексте их нет — выражение сработать не может ни при каких прочих условиях, что и было мной проверено раньше, когда с помощью AWB и этого выражения я заменил множество (несколько тысяч) ошибочных наращений, при этом не было ни одной жалобы. Кроме того, вот эта правка https://ru.wikipedia.org/w/index.php?title=%D0%92%D0%B8%D0%BA%D0%B8%D0%BF%D0%B5%D0%B4%D0%B8%D1%8F:AutoWikiBrowser/Typos&diff=prev&oldid=135455251 участника Putnik показывает, что он не увидел ничего подозрительного в выражении, а, по слухам, он является специалистом в этой области. Кстати, и подчёркивания в рег. выр. нет, ни нижнего, ни верхнего. Gromolyak (обс.) 02:28, 30 мая 2024 (UTC)[ответить]
Кстати, добавленная версия не соответствует моей и вообще не может правильно работать, так как первая скобка, которой не было, захватывает и копирует всё исходное выражение и ставит его перед дефисом, что уже неверно.
Не могу себе представить, что скрипт произвёл такую замену, так как при этом он поменял захватывающие скобки на незахватывающие ("(\d+)" на "(?:\d+)"), а также произвольно поместил всё выражение ещё в пару захватывающих скобок, чего быть не должно. Похоже, будто кто-то неправильно изменил выражение вручную. Копирование выражения без модификаций, без сомнений, решит проблему.
Gromolyak (обс.) 02:57, 30 мая 2024 (UTC)[ответить]
Судя по характеру изменений и отсутствию метки AWB в описании изменения Вы использовали Викификатор, а не AWB? — Эта реплика добавлена участником A.sav (о • в)
Оказалось документированным поведением — если исправляемый вариант попадается во внутренней ссылке, правило отключается для всего файла. И это порождает следующий класс проблем. Сейчас многие правила написаны таким образом, что включают в себя вариант правильного написания слова, это сильно их упрощает, а замена правильного написания на правильное вроде как не было проблемой. Однако из-за этой особенности поведения AWB многие ошибки не исправляются. Вчера проверил на примере "регентство" (пропущена первая буква "т") — AWB действительно пропускает, приходится исправлять руками. Насколько я знаю регулярные выражения, нельзя задать исключение для правильного варианта? A.sav (обс.) 14:43, 24 ноября 2024 (UTC)[ответить]
Партнер, шахтер порождает длинное описание в описании правки
Понятно, что это проверка для гарантирования ложных срабатываний в украинских текстах, однако может стоит добавить квалификатор ?>= для того, чтобы сократить описание. И будет проще понимать, какая замена производится. A.sav (обс.) 16:33, 22 октября 2024 (UTC)[ответить]