Обсуждение Википедии:AutoWikiBrowser/Typos

Пожалуйста, добавляйте новые темы снизу

Формы слова

Хотелось бы узнать мнение, в каком виде лучше давать формы слова?

Можно явно указывать все суффиксы и окончания для максимальной точности, сооружая примерно такие выражения: \b(А|а)банент(а(?:ми?|х)?|у|о[вм]|е|ы)?\b — причём только для существительных. Если добавить поиск и прилагательных во всех формах (абонентный, абонентский) то получается вообще ужасно.

Или же можно писать просто \b(А|а)банент(\w*?)\b, но тогда будут находиться и «исправляться» в том числе и явно ошибочные варианты типа «абанентовпредупреждают». Причём это будет внесено в описание правки.

Я обратил внимание, что в английском и французском списках всегда явно указывают все словоформы и не используют подобные подстановки. Solon 15:26, 1 декабря 2006 (UTC)[ответить]

Англичанам и французам проще - у них морфология поскромнее. Можно вместо * (zero or more times) использовать например {0,5} (0 to 5 times). BTW, *? не имеет смысла, т.к. ? = 0 or 1 time. Если я конечно ничего не путаю ;-) --Volkov (?!) 15:44, 1 декабря 2006 (UTC)[ответить]
На самом деле, имеет. "*" и "+" - так называемые "жадные" (greedy), то есть повторение происходит наибольшее возможное число раз. Например из строки "профффесор кислых щей" по шаблону: \b(П|п)ро(ф+)е(с+)ор(.*)\b будет найдено целиком "профффесор кислых щей", а не просто "профффесор", так как под "(.*)\b" будет расценена последовательность: " кислых щей". Если вместо ".*" написать ".*?", то "*" станет "ленивым" (lazy), и повторение будет произведено минимальное количество раз, то есть до первого "\b", и результат будет "профффесор". А вообще есть рекомендация "use the dot sparingly", и вместо точки лучше использовать что-то более конкретное. Но это не совсем по теме. :) Solon 16:56, 1 декабря 2006 (UTC)[ответить]

Разное

Убрал некоторые неработающие и уе присутствующие в программе автозамены. Но думаю, что вообще не стоит включать сюда замены, не связанные с орфографией, чтобы не создавать путаницы. Вообще конечно было бы удобно иметь возможность произвольно подключать к AWB любые подобные списки автозамены, которые можно было совместно редактировать в вики. Но это уже скорее вопрос к разработчикам. Solon 11:20, 12 апреля 2008 (UTC)[ответить]

еще → ещё ?

Предлагаю убрать эту замену. Есть мнение [1], что «еще» (безударная частица) и «ещё» (наречие) — воообще разные слова. Shureg 13:25, 13 июня 2008 (UTC)[ответить]

Слова-то может и разные, но писать одно из них через Е — это бред сивой кобылы. Или вы произносите в каких-то случаях ещё через Е (е́ще / еще́) ??? — Dirl 20:54, 13 июня 2008 (UTC)[ответить]
По крайней мере, в в словаре Ушакова пишется именно так. А произносятся они действительно по-разному. Как минимум можно говорить о неустоявшейся норме. А значит, (полу)автоматически заменять где попало еще на ещё не стоит.
Вот что говорит на этот счёт грамота.ру. — Dirl 15:41, 14 июня 2008 (UTC)[ответить]

kg->кг

у меня AWB испортил стилевые слова "background"... infovarius 22:43, 25 августа 2008 (UTC)[ответить]

Мне он тоже предлагает заменить "background" на "bacкгround". Где это можно исправить? — ОВ3Я2ДСН23 18:36, 9 октября 2008 (UTC)[ответить]

Бангладеш

По правилам русского языка[2] слово Бангладеш не слоняется, поэтому нужна замена Бангладеш(а,у,е,ь) на Бангладеш --Tat1642 21:49, 25 января 2009 (UTC)[ответить]

1960-ые → 1960-е

<Typo word="1960-ые и подобное" find="\d-ы(е|м|х)" replace="$1-$2" /> Так правильно будет? — Obersachse 18:12, 3 февраля 2009 (UTC)[ответить]

репер

Успокойте меня, пожалуйста - скажите, что вот это дополнение не означает смертного приговора термину репер. Андрей Романенко 15:55, 9 марта 2009 (UTC)[ответить]

Спасибо. Честно говоря, впервые узнал о существовании этого списка. Изучаю его в задумчивости. Пытаюсь понять, например, как существование строчки

<Typo word="бренд" find="\b(Б|б)рэнд(\w*)\b" replace="$1ренд$2" />

согласуется с существованием статьи Макс Брэнд. Андрей Романенко 16:02, 9 марта 2009 (UTC)[ответить]
Именно поэтому исправление орфографии Автовикибраузером в автоматическом режиме отключено. Я считаю, что в подавляющем большинстве случаев замена оправдана, а в тех единичных случаях, где нет ответственность лежит на пользователе бота или AWB. — Obersachse 16:08, 9 марта 2009 (UTC)[ответить]
То есть эту штуку запускают вручную, в управляемом режиме? Тогд ОК — кажется, все возможные сомнительные случаи в этом списке человек может отследить. Разве что на всякий случай хочу сообщить всем пользующимся, что если когда-нибудь им встретится словосочетание «зеленое вино» (например, в песне из оперы Римского-Корсакова «Садко»: «Обносите зеленым вином, Зеленым вином заморским!»), то в этом древнерусском обороте нет буквы «ё», потому что ударение падает на окончание: «зелено́ вино», «зелены́м вином» (и имеется в виду отнюдь не цвет). Андрей Романенко 16:26, 9 марта 2009 (UTC)[ответить]

АгенТсТво

То, что ищется слово целиком приводит к тому, что часто не срабатывает тупо-фикс. ·Carn !? 11:26, 17 апреля 2009 (UTC)[ответить]

Как это сделано?

Почему в статье Ли Тхай То фраза "Ле Нгоа Чиеу" викификатором не изменяется на "Ле Нога Чиеу", хотя соответсвующая замена для ноги прописана на странице. Как это сделано? — Дмитрий Никитин 13:52, 11 июня 2009 (UTC)[ответить]

Замечательно. Тогда давайте исключим эту Ногу, раз нельзя запретить эту автозамену для определенноой статьи. — Дмитрий Никитин 15:11, 11 июня 2009 (UTC)[ответить]
False positives есть всегда, не только на этой ошибке. Тот же бренд/брэнд. Просто надо ботов лишний раз не гонять по ним. —LimeHat 16:25, 11 июня 2009 (UTC)[ответить]
Никто специально и не гоняет. Просто будешь проставлять\удалять\изменять категории или проставлять шаблоны и в фоновом режиме сделаешь такую групую замену. Причем не понятно ее происхождение. Факт опечатки единичен, зачем ее занесли в общий список частых опечаток\орфографических ошибок. — Дмитрий Никитин 17:15, 11 июня 2009 (UTC)[ответить]
Я же говорю — такие случаи встречаются на разных заменах. И на ёфикации (например, статьи Ё (кириллица)); и на бренд/брэнд (примеры сейчас не вспомню, но буквально сегодня несколько раз сталкивался, исправляя эту ошибку) и прочее прочее. Поэтому, проблема более "глобальна", чем с ногой. Поэтому и говорю — а стоит ли лишний раз (при той же массовой категоризации) исправлять их ботами? —LimeHat 17:39, 11 июня 2009 (UTC)[ответить]

автозамены

Если нет возражений и ошибок, то предлагаю добавить следующие автозамены

<Typo word="военачальник" find="\b(В|в)оен+оначальник(\w*)\b" replace="\1оеначальник\2" />
<Typo word="комментарий" find="\b(К|к)оментари(\w+)\b" replace="\1омментари\2" />
<Typo word="команда, командир" find="\b(К|к)омманд(\w*)\b" replace="\1оманд\2" />
<Typo word="приемлемый" find="\b(П|п)р[еи]емлим(\w*)\b" replace="\1риемлем\2" />
Опс, надо исключить как то "действия отрядов коммандос" — Дмитрий Никитин 14:14, 11 июня 2009 (UTC)[ответить]
(К|к)омманд(?!ос|о\b)(\w*) -- так? Коммандир комманды коммандосов коммандовал коммандо.
добавил — Дмитрий Никитин 15:01, 16 июня 2009 (UTC)[ответить]

Орфография

Хочу попросить отправить бота исправить «агенств_» на «агентств_», «приемлим_» на «приемлем_», «военоначальник», «военноначальник» на военачальник, коммандир на командир, комманд_ на команд_, коментари_ на комментари_. Ещё нужно исправить ошибки по этому списку, иначе для чего он существует в Википедии?! Кроме кеш/кэш, там сейчас война. Большое спасибо! Четыре тильды 08:55, 11 июня 2009 (UTC)[ответить]

Лучше внести в RegexTypoFix, потом попутно править rubin16 10:59, 11 июня 2009 (UTC)[ответить]
Внесите, пожалуйста, я в этом совсем ничего не понимаю. Четыре тильды 12:23, 11 июня 2009 (UTC)[ответить]
если нет возражений, то добавлю в общий список — Дмитрий Никитин 14:08, 11 июня 2009 (UTC)[ответить]
не вызовет ли это споры, так же как кэш\кеш и бренд\брэнд — Дмитрий Никитин 19:02, 11 июня 2009 (UTC)[ответить]
  • Всё, что может вызвать споры, обязательно их вызовет. К примеру, на странице обсуждения Ё (кириллица) вы можете найти сентенции, что нужно вернуться к "стандартному языку" без написания "ё". А в данном случае Четыре тильды приводит авторитетный источник: Русский орфографический словарь: около 180 000 слов / Российская академия наук. Институт русского языка им. В. В. Виноградова / О. Е. Иванова, В. В. Лопатин (отв. ред.), И. В. Нечаева, Л. К. Чельцова. — М., 2005. — 960 с. — ISBN 5-88744-052-X. -- AVBtalk 19:47, 11 июня 2009 (UTC)[ответить]

Ещё предложение, исправлять написание единиц измерений (далее регэксп-псевдокод):

  • ([0-9]+)\s*Герц → \1 герц
  • ([0-9]+)\s*гц → \1 Гц
  • ([0-9]+)\s*[кК]гц → \1 кГц
  • ([0-9]+)\s*[мМ]гц → \1 МГц

Здесь имеется ввиду, что "герц" после числа должен идти с пробелом и со строчной буквы, сокращение пишется с прописной ("Гц"), "кило" со строчной ("кГц"), а "мега" - с прописной ("МГц"). Причём в исходном контексте суффикс может идти без пробелов после числа, с одним или несколькими пробелами (\s*), а пробелы могут быть простыми или неразрывными (а если будет обрабатываться тег &nbsp;, будет тоже хорошо). Соответственно, при замене после числа должен добавляться неразрывный пробел (дай бог памяти, это \uA000). Ещё было бы здорово, если бы игнорировались ссылки в суффиксах (пример). -- AVBtalk 20:27, 13 июня 2009 (UTC)[ответить]

Орфография

Теоретически может быть и «по окончанию», например, «по окончанию слова можно определить падеж», возможно, что-то подобное может встретиться в статьях по лингвистике. --Дарёна 17:21, 14 июня 2009 (UTC)[ответить]
Мне кажется, этот сравнительно небольшой урон статьям по лингвистике быстро ликвидируют наблюдающие за ними лингвисты. Четыре тильды 17:44, 14 июня 2009 (UTC)[ответить]
Согласна. Если это будет сделано разово, то нет проблем. --Дарёна 18:37, 14 июня 2009 (UTC)[ответить]
Спасибо за поддержку. :) Четыре тильды 18:39, 14 июня 2009 (UTC)[ответить]
\b(П|п)роцес(?!с)(\w*)\b → \1роцесс\2 ?? — Дмитрий Никитин 14:52, 16 июня 2009 (UTC)[ответить]

Вавилон 5 →→ «Вавилон-5»

Я являюсь автором/слежу за многими статьями по вселенной «Вавилона-5». Проблема в том, что многие правки изобилуют неграмотными фразами и т.д. Все это решаемо. Однако, прописать подобное исправление мог бы и бот. Одна закавыка - нет ли пересечений со статьями по известной древней цивилизацией?
Прошу переписать в текстах статей все совпадения подобного рода, особенно тех статей, которые прописаны в категории Вавилон-5. — Эта реплика добавлена участником Zac Allan (ов) 20:03, 30 июня 2009 (UTC)[ответить]

По-прежнему нет желающих? Жаль. А то ляпы в тексте лежут глаз. Можно было бы в какой-нибудь «литературно-исправляющий» бот добавить функцию... - Allow 21:16, 1 июля 2009 (UTC)[ответить]
Если знаете регулярные выражения, то можете добавить правило к списку: Википедия:AutoWikiBrowser/Typos --Ashik talk 04:17, 2 июля 2009 (UTC)[ответить]
А на примере моего случая должно быть так?

<Typo word="«Вавилон-5»" find="Вавилон 5" replace="«Вавилон-5»" /> ? Или как правильнее, научите плиз. - Zac Allan Слова / Дела 12:00, 6 июля 2009 (UTC)[ответить]

Так мы получим замену в "Вавилон 567 до н.э." --> "Вавилон-567 до н.э." — Дмитрий Никитин 12:30, 6 июля 2009 (UTC)[ответить]

Маленькая орфографическая правка

«Рейх» --> «рейх» (-а, -у, -ом, и т. д.) — Zac Allan Слова / Дела 18:15, 12 июля 2009 (UTC)[ответить]

Только осторожно! Есть такая фамилия, а она, естественно, пишется с прописной буквой. — Obersachse 18:21, 12 июля 2009 (UTC)[ответить]
Это через Typo у AWB лучше делать rubin16 18:28, 12 июля 2009 (UTC)[ответить]
Я не знаю. как с ним работать. Можешь сделать сам? - Zac Allan Слова / Дела 22:16, 12 июля 2009 (UTC)[ответить]

Наряду

А почему у нас такое странное правило?

<Typo word="наряду (с)" find="\b(Н|н)а ряду\b(?= с )" replace="$1а ряду" />

Кто-нибудь может пояснить? — GranD 11:42, 26 августа 2009 (UTC)[ответить]

Думаю, что это опечатка, где-то там пробела не должно быть. Вот правка 2007 года, спросите участника Solon. — AlexSm 14:17, 26 августа 2009 (UTC)[ответить]

в/на Украине

Предлагаю добавить замену с "в Украине" на "на Украине". Есть кто против? Advisor 20:40, 22 сентября 2009 (UTC)[ответить]

А как быть с цитатами и названиями статей или книг? Dinamik 20:55, 22 сентября 2009 (UTC)[ответить]
Не учёл. Тогда не получится, а жаль, надоедает откатывать переправляльщиков. Advisor 22:17, 22 сентября 2009 (UTC)[ответить]

нужно исправить

представляет из себя → представляет собой — Dirl 11:02, 8 декабря 2009 (UTC)[ответить]

✔ Сделано. --Volkov (?!) 12:27, 8 декабря 2009 (UTC)[ответить]

Image

Не то, чтобы это было ошибкой, но замена «[[Изображение:» или «[[Image:» на «[[Файл:» следовала бы принципам викификатора. --Obersachse 12:45, 8 декабря 2009 (UTC)[ответить]

Можно ведь просто в AWB поставить галочку, чтобы выполнялись general fixes --Volkov (?!) 12:47, 8 декабря 2009 (UTC)[ответить]
Возможно ты прав. Я, кажется, снял эту галочку после того, что где-то прозвучала критика этих general fixes. --Obersachse 13:28, 8 декабря 2009 (UTC)[ответить]

Республика ххх

Есть ли возражения против добавления <Typo word="аксиома" find="\bРеспублик(и|е) (Албан|Болгар|Македон|Серб|Словен|Хорват|Черногор)ия\b" replace="Республик$1 $2ии" /> и аналога для винительного и творительного падежа? Вопрос подняли на Википедия:Запросы к ботоводам#Ещё раз про республики (кардинальное предложение). --Obersachse 13:49, 14 июля 2010 (UTC)[ответить]

word="аксиома"? Ashik talk 14:21, 14 июля 2010 (UTC)[ответить]
Эх, проклятый копи-паст. Наверное word="Республика ххх" будет понятным описанием. --Obersachse 05:34, 15 июля 2010 (UTC)[ответить]

словесные суффиксы у чисел

Предлагаю заменять последовательность цифр, после которой идёт неверный суффикс, на цифры с верным суфиксом. Ориентировочный регеэксп для правила "Однобуквенное наращение используется, если последней букве числительного предшествует гласный звук или мягкий знак":

  • (\d-)[аеёиоуыэюя](\a\b)$1$2

Здесь из конструкции вида (цифра)(дефис)(гласная буква)(ещё одна буква) убирается гласная буква после дефиса (списки гласных и согласных букв см. в согласные). Пример: "5-ый" → "5-й". Под "\a" и "\b" я обозначил "любая кириллическая буква" и "не буква" соответственно.

В варианте (цифра)(дефис)(три буквы) нужно убирать одну (первую) букву, если вторая буква согласная (иначе: не-гласная) в соответствии с правилом "Двухбуквенные наращения используют, если последней букве числительного предшествует согласный звук", либо убирать две (первую и вторую) буквы, если вторая - гласная (см. выше правило про однобуквенный суффикс). Примеры: "10-ого" → "10-го", "16-тый" → "16-й". -- AVBtalk 03:03, 27 июля 2010 (UTC)[ответить]

словесные суффиксы у годов

Наконец, нужно доработать обработку годов. Во-первых, я встречал конструкции вида

  • [[1960]]-е и [[1960]]-х

В этом случае суффикс ("-е" и "-х") нужно вносить в ссылку:

  • [[1960-е]] и [[1960-е|1960-х]]

соответственно. Разумеется, суффикс должен пройти обработку, упомянутую выше:

  • [[1960]]-ые[[1960-е]]

Во-вторых, если после числа (простого или в текстовой части ссылки) идёт суффикс (кроме "-е" и "-х") и буквы "год" (через простой или неразрывный (!) пробел), то суффикс надо убирать (см. правило "Кроме того, не наращивают окончания для номера года и числа месяца, если слово «год» и названия месяца следуют тотчас за числом... Неправильно: в 1991-м году; 5-го марта 1953-го года"). То есть должны обрабатываться случаи

  • 1991-м году1991 году
  • [[1991]]-го года[[1991 год]]а
  • [[1991 год|1991]]-ого года[[1991 год]]а

-- AVBtalk 03:03, 27 июля 2010 (UTC)[ответить]

Проблемные замены

  1. В статье Бунин, Юлий Алексеевич предлагается замена: переговоры с петербургскими народниками -> переговоры санкт-петербургскими народниками. Нужно как то подправить.
  2. Замена
<Typo word="белорусский" find="\b(Б|б)еларусс?к(\w*)\b" replace="$1елорусск$2" />

глючит на каждом полустанке. К примеру, в статьях Годлевский, Винцент, Федута, Александр Иосифович, Олехнович, Франтишек используются названия на белорусском языке и в итоге предлагаются варианты:

Беларуская  - Белорусская 
Беларускі    -  Белорусскі

Целесообразен ли такой шаблон, со многими неизвестными? Артём Л. 12:06, 5 августа 2010 (UTC)[ответить]

В большинстве случаев замена пока оправдана. Нужно смотреть, что чаще - ошибка или исключение из правила. --Obersachse 13:16, 9 августа 2010 (UTC)[ответить]
Раз пять точно встретилось Артём Л. 13:23, 9 августа 2010 (UTC)[ответить]
Именно поэтому нужно тщательно проверять дифф перед тем, как записывать правку, и, при необходимости, исправлять вручную. Rainbow 14:00, 9 августа 2010 (UTC)[ответить]

Итти

Просмотрел случаи употребления: половина — в цитатах из источников с дореволюционной орфографией, половина — какие-то месопотамские имена собственные. Думаю, можно безболезненно удалить замену «итти — идти», так как потенциальный вред от ее существования превышает возможную пользу. --Bandar Lego 22:12, 3 сентября 2010 (UTC)[ответить]

бол->bol, л->l

Что-то не могу найти, почему у меня AWB заменяет эти буквосочетания в ключах сортировки шаблонов... infovarius 14:56, 2 октября 2010 (UTC)[ответить]

Санкт-Петербург

Лишнего меняет во фразе Вместе с петербургскими оркестрами она... К сожалению в регэкспах не силен, поправить не смогу. --IGW 09:17, 24 января 2011 (UTC)[ответить]

римейк -> ремейк

Предлагаю добавить замену "римейк" на "ремейк". Основание: [3]. Ошибка встречается довольно часто, сейчас около 700 статей содержат ошибку [4]. -- NZeemin 00:49, 31 марта 2011 (UTC)[ответить]

空手

Написание «каратэ» присутствует в официальных наименованиях нескольких организаций и в названии огромного числа книг и статей на русском языке. Считаю, что автоматическая замена «каратэ → карате» безусловна вредна, так как приведёт к искажению наименований организаций и выходных данных источников. Предлагаю эту строчку удалить. INSAR о-в 13:49, 3 августа 2011 (UTC)[ответить]

раз так -- удаляйте. Я полагаю, что консенсуса тут можно ждать годами, поэтому вообразим, что процедура по изменению носит уведомительный характер, а не согласовательный, т.е. изменил, оповестил на странице обсуждения и дело в шляпе. — Dnikitin 14:07, 3 августа 2011 (UTC)[ответить]

(Санкт-)Петербург

Я временно удалил замену, связанную с этим словом, по причине большого числа ложных срабатываний ("параллельно с Петербургской" на "параллельно санкт-Петербургской", "200 л. с. петербургского завода" на "200 л. санкт-петербургского завода", информация от INSAR). Поскольку код довольно сложный, прошу тех, кто лучше разбирается в регэкспах, сузить его область действия.

Либо вообще его отменить, т.к. название "Петерберг" без префикса тоже активно употребляется (см. статью История Санкт-Петербурга), и буква "с" перед ним тогда не является сокращением от "Санкт". Смотрите также темы выше - #Санкт-Петербург и #Проблемные замены MaxBioHazard 16:12, 10 августа 2011 (UTC)[ответить]

{{Шаблон: → {{

Перенесено на страницу Обсуждение Википедии:Викификатор.

по-умолчанию, поумолчанию → по умолчанию

Предлагаю добавить. -- NZeemin 06:00, 27 октября 2011 (UTC)[ответить]

Да, ошибка встречается в ру-вики не менее 90 раз. Добавил. --Movses 07:43, 27 октября 2011 (UTC)[ответить]

Ограничения на начало слова

Я не понимаю, почему все маски неправильного написания начинаются с ограничителя \b, говорящего о том, что слово должно начинаться на этом месте. Вполне можно себе представить сложносоставные слова, отличающиеся от приведённых какой-либо приставкой или вторым корнем, такие при текущей схеме будут пропущены. Соответственно, предлагаю из начала масок \b поубирать. MaxBioHazard 04:15, 20 января 2012 (UTC)[ответить]

ареал обитания → ареал

Ы? Λονγβοωμαν 17:24, 25 февраля 2012 (UTC)[ответить]

  • В списке нет ни слова "ареал", ни слова, похожего на "обитание" и мой АВБ в режиме исправления ошибок подобных замен не делает (проверил на этой СО). Где такое было ? MaxBioHazard 17:32, 25 февраля 2012 (UTC)[ответить]

Есть ещё ареал распространения (992 включения в Википедии, по Яндексу). --С уважением, Borealis55 13:46, 26 марта 2012 (UTC)[ответить]

деревянистый

Неверное исправление: деревянистый → деревяннистый. Нужно подправить.--Cinemantique 21:21, 27 марта 2012 (UTC)[ответить]

Так подойдёт ? --Movses 07:13, 28 марта 2012 (UTC)[ответить]
Нет. Попробуйте обработать викификатором слово деревянистый или фамилию Деревянко — появляется второе «н». --Bff 11:43, 29 марта 2012 (UTC)[ответить]
Так это не викификатор, у викификатора свои замены, о его проблемах пишите на его СО. MaxBioHazard 11:48, 29 марта 2012 (UTC)[ответить]
Извиняюсь. --Bff 11:54, 29 марта 2012 (UTC)[ответить]

Дети

Добавьте «ребенок → ребёнок». INSAR о-в 01:43, 6 апреля 2012 (UTC)[ответить]

Белорусский язык

Подскажите, пожалуйста, как-то можно отключить автозамену отдельных слов белорусского языка? Например, «раён» → «район». Пробел в начале строки не получается, так как слово находится в списке литературы. — StanTRC 09:24, 27 июня 2012 (UTC)[ответить]

в городе Москве

В названии закона: «О внесении изменений в Закон города Москвы от 15 октября 2003 года № 59 „О наименованиях и границах внутригородских муниципальных образований в городе Москве“» AutoWikiBrowser убирает слово городе. Permjak 18:10, 1 июля 2012 (UTC)[ответить]

WPCleaner

Hi,

If you're interested, WPCleaner can now be configured to use the same list as AWB to detect spelling and typography mistakes and provide suggestions. --NicoV 09:44, 23 сентября 2012 (UTC)[ответить]

"чем"

Какой-то код, используемый викификатором, заменяет "чем" на "чём", что не всегда корректно (пример: "нам не о чем сожалеть" → "нам не о чём сожалеть"). -- AVBtalk 01:28, 22 ноября 2012 (UTC)[ответить]

Замена "в месте с" на "вместе с"

Думаю, что данную автозамену надо убирать. Сегодня один участник пожаловался на то, что у него эта замена сработала некорректно. Там фраза «рухнул в месте с координатами ...» была заменена на «рухнул вместе с координатами ...». Причём это уже было неоднократно. Так что я строчку <Typo word="вместе (с)" find="\b(В|в) месте\b(?= с )" replace="$1месте" /> пока убираю.-- Vladimir Solovjev обс 11:57, 2 декабря 2012 (UTC)[ответить]

Сочетание «ответств»

… в словах «соответствовать», «ответственный» и т. д. Исключений вспомнить не смог. --88.81.32.220 09:04, 23 февраля 2013 (UTC)[ответить]

Я что-то не пойму, это проблемы с текущей какой-то автозаменой или предложение новой автозамены ? --Movses 09:09, 23 февраля 2013 (UTC)[ответить]
Предложение. 88.81.32.220 09:20, 23 февраля 2013 (UTC)[ответить]
Несколько сложно читать мысли...
<Typo word="Ответственно" find="(О|о)твеств" replace="$1тветств" />
Вы эту строчку имеете в виду ? --Movses 12:26, 23 февраля 2013 (UTC)[ответить]
Она самая. Кстати, здесь упомянули одну очень распространённую ошибку «справочнник» — более 1000 (на тот момент) случаев. Можно внести? 89.189.29.215 19:03, 24 февраля 2013 (UTC)[ответить]
Ну, раз она самая, то я добавил и из кивипедии вычистил. Спасибо, что обратили внимание! А «справочнник» MaxBioHazard уже внёс. --Movses 20:00, 24 февраля 2013 (UTC)[ответить]

«Лучший»

Приветствую всех!

Требуется сделать автозамену для неправильных форм слов «лучше», «лучший» и других однокоренных. Для слова «лучше» встречаются такие неправильные варианты: «лутше», «лучще», «лушче», «лучьше», «лудше» (даже такое встречается). Насколько я вижу в последних правках, правильное регулярное выражение подобрать не удаётся. --newMitЁk 06:28, 7 марта 2013 (UTC)[ответить]

Проблема тут скорее в том, что есть слова исключения, которые подходят под регулярное выражение. Например:
Я пытался сделать универсальную регулярку, но, видимо, если достигать цели, чтобы замены работали максимально аккуратно, то нужно сделать набор из нескольких регулярных выражений, чтобы отсекать вышеуказанные false positive. --Movses 08:39, 7 марта 2013 (UTC)[ответить]
  • Думаю, цитату надо в nowiki заключать - мало ли какая ещё цитата с "неправильным" написанием будет, не на современном русском языке. С цитатами это вопрос сложный, интересно, где-нибудь есть рекомендация заключать цитаты в nowiki?--newMitЁk 09:35, 7 марта 2013 (UTC)[ответить]
Если желаете, то можете дополнить Википедия:Цитирование ... Практически вы всё равно не заставите людей оформлять по правильному, поэтому при использовании регулярок надо учитывать, что может быть всё что угодно... --Movses 10:00, 7 марта 2013 (UTC)[ответить]
Например, эта статья будет «исправлена», и никакими выражениями этого не изменить, если не использовать nowiki — статья намеренно так написана. А вообще, пользователь AWB должен следить за правками и проверять, не испортилось ли что-нибудь после редактирования. Тут уже ответственность как и автора статьи, так и редактора.
Я к чему это всё… с цитатами — проблема отдельная, а остальное уже надо решать регулярными выражениями. --newMitЁk 10:28, 7 марта 2013 (UTC)[ответить]
  • Ну, учитывать в автозамене цитаты с авторским написанием слов невозможно - именно поэтому у AWB, который эту автозамену использует, стоит пометка - проверяйте изменения перед сохранением. Теоретически, в английской справке написано что цитаты вообще не обрабатываются автозаменой, но не указано как именно он определяет где цитата а где нет. По поводу непосредственно регэкспа: "Лутш" и "Лушчыцкi" отсекаются, если указать в конце регэкспа (и|е), тем самым ограничив его применение словами типа лушче, лушчий, лушчие и так далее. Основная проблема - исправлять написание "лучче", но при этом не исправлять "Луччи" - и я не совсем представляю как это написать компактно, без расползания на два регэкспа, для "лучше" и для "лучший"/"лучшие" и так далее. --Mitas57 10:58, 7 марта 2013 (UTC)[ответить]
  • Предлагаю такое: <Typo word="лучший" find="\b(Л|л)у(тш|чщ|шч|чьш|дш|шш|шщ|щщ|щч)(и\B|е\b)" replace="$1учш$3" />. Конструкция в конце обрабатывает либо "и" не на конце слова, либо "е" на конце - так что Луччи пропускается. --Mitas57 11:18, 7 марта 2013 (UTC)[ответить]
  • Гм, нет. Значит, нужно ограничение что "и" не может быть в конце слова, а вот "е" - может быть и в конце и не в конце. (и\B|е). Еще хорошо бы учесть, что есть слова типа "улучшение", "улучшить" и подобные. Получится <Typo word="лучший" find="\b(У|у)?(Л|л)у(тш|чщ|шч|чьш|дш|шш|шщ|щщ|щч)(и\B|е)" replace="$1;2учш$3" />
Вот это поймать ещё не желаете :-) ? --Movses 12:17, 7 марта 2013 (UTC)[ответить]
  • Мда, это уже жестче. Я бы не взялся и это поймать и невинных выражений не наловить. И вообще, регэкспы же не всесильный инструмент :) --Mitas57 18:28, 7 марта 2013 (UTC)[ответить]

И снова «ответств»

Нашлось ещё одно искажение — пропуск третьей «Т» (пример — «соответсвующим»), примерно 65 вхождений. Никто не натыкался? 92.242.86.133 19:11, 11 марта 2013 (UTC)[ответить]

Наткнулись. Добавились. Спасибо ! Аффтар пеши исчо :-) --Movses 06:28, 12 марта 2013 (UTC)[ответить]

Что-то «везёт» сочетанию «СТВ» на пропажи: «отсутсвие» (больше 30 вхождений) — похоже, непроизносимые согласные выпадают ещё и на письме... 149.62.3.233 18:20, 16 марта 2013 (UTC)[ответить]

Добавлено. Благодарствую. --Movses 20:32, 16 марта 2013 (UTC)[ответить]

ТСТВ

Проблему с ТСТВ я закрыл на 99 % таким образом:

  1. Идём на сайт http://www.krossw.ru и забиваем маску *тств*
  2. Выцепляем нужное и формируем строку нужного вида для всех начальных букв
<Typo word="ТСТВ" find="(А|а)(бба|ген|гна|двока|дъюнк|дъютан|кроба|мана|нахоре|ристокра|рхимандри|спиран)т?ст?в" replace="$1$2тств" />

--Movses 09:19, 17 марта 2013 (UTC)[ответить]

лейтенат

Ещё одна предлагаемая запись
(Л|л)ейтенат $1ейтенант 88.81.40.178 12:10, 22 марта 2013 (UTC)[ответить]

✔ Добавил, а заодно и замены для «летенант», «лейтинант», «лейтеннант» и подобного. — putnik 12:30, 22 марта 2013 (UTC)[ответить]

Путаница ш/щ

Сообщать о таких ошибках или не надо? Что общего правила нет, понимаю, потому и спрашиваю. Если надо, вот первый случай: (Н|н)астояш(его|ий|ие|...) → $1астоящ$2 37.147.205.162 16:46, 2 апреля 2013 (UTC)[ответить]

  • Я вот не сторонник добавления редко встречающихся замен опечаток. Их проще один раз их поправить, чем захламлять список. А вот какие-то общие правила вполне можно. Например, для «ш» → «щ» можно добавить замену «-ншик» → «нщик» (там только «пуншик» исключение). Ну и вообще подумать, какие ещё есть паттерны. — putnik 17:56, 2 апреля 2013 (UTC)[ответить]
  • А я вот — сторонник. Сообщайте ещё ! --Movses 20:47, 2 апреля 2013 (UTC)[ответить]
  • Вы считаете, что не все ошибки следует заносить в данный список автозамен ? Я что-то не увидел никаких дисклеймеров на странице Википедия:AutoWikiBrowser/Typos. Хотите внести такой дисклеймер ? Может желаете его сформулировать поточнее ? --Movses 15:36, 3 апреля 2013 (UTC)[ответить]

Акт второй марлезонского балета (это про "хреначить"): (Б|б)лиз?жай[шщ](ий|ая|ое|…) → $1лижайш$2 37.147.207.122 15:11, 11 мая 2013 (UTC)[ответить]

✔ Добавил и исправил. Поиск вёл по "ближайщ*" и "близжа*". Спасибо. Кстати, вы могли бы зарегистрироваться ... --Movses 11:33, 12 мая 2013 (UTC)[ответить]

Растояние

Огромное количество включений--Хомелка  :) / обс 06:27, 24 апреля 2013 (UTC)[ответить]

Поддерживаю включение в список для автоисправлений. --Pessimist 11:00, 24 апреля 2013 (UTC)[ответить]
✔ Сделано. Добавил и исправил. --Movses 19:10, 24 апреля 2013 (UTC)[ответить]

Котрансплантация

Викификатор превращает медицинский термин «котрансплантация» в «которансплантация» :-) (на этой странице почему-то случается, только если выделить само слово). На странице обсуждения Викификатора сказано писа́ть сюда. DmitTrix 09:18, 23 мая 2013 (UTC)[ответить]

Это срабатывала замена для «котрая» → «которая», поправил. — putnik 09:24, 23 мая 2013 (UTC)[ответить]

«Ничего этого»

<Typo word="ничего" find="\b(Н|н)и\s?че[го]{2}([^-бы]{3,3})" replace="$1ичего$3" /> неверно срабатывает на «ничего этого» и «ничего другого». Отключаю. KPu3uC B Poccuu 05:44, 27 июля 2013 (UTC)[ответить]

Оптимизация

Использование символьных классов ускоряет обработку выражений, поэтому рекомендуется вместо (А|а) применять [Аа]. KPu3uC B Poccuu 08:35, 30 июля 2013 (UTC)[ответить]

Можно, чисто для расширения кругозора, пруфлинк на это утверждение ? --Movses 09:30, 30 июля 2013 (UTC)[ответить]
http://www.php.net/manual/ru/regexp.reference.performance.php. KPu3uC B Poccuu 11:56, 30 июля 2013 (UTC)[ответить]

Бангладеш 2

Викификатор заменяет сочетание "в Бангладеше" на "вБангладеш". Пример - Виейра ди Меллу, Сержиу, Обсуждение:The Simpsons Hit & Run. Kalendar 12:15, 12 ноября 2013 (UTC)[ответить]

Да, есть такая проблема. В гаджете актуальные замены, но в что именно не так, пока не нахожу. — putnik 13:28, 12 ноября 2013 (UTC)[ответить]
✔ Исправлено, но правило пока вообще убрано из замен для Викификатора, надо будет думать, как корректно написать преобразование в JS-регекспы. — putnik 18:05, 14 ноября 2013 (UTC)[ответить]

нашлось в старом файле

/// — собственно замены, после них комментарии

  • r/[Рр]а[ий]{1,2}сполком/$1айисполком/
Добавлено и исправлено. --Movses 19:22, 30 декабря 2013 (UTC)[ответить]
  • r/[Рр]екомм?енд/$1екоменд/
Добавлено и исправлено. --Movses 19:22, 30 декабря 2013 (UTC)[ответить]
  • r/[Уу]достоин/$1достоен/
Добавлено и исправлено. --Movses 19:22, 30 декабря 2013 (UTC)[ответить]
  • r/[Пп]ревоначаль/$1ервоначаль/
Добавлено и исправлено. --Movses 19:22, 30 декабря 2013 (UTC)[ответить]
  • r/[Сс]териотип/$1тереотип/ скорее всего, уже вычищено, но повтор возможен
Добавлено и исправлено. --Movses 19:22, 30 декабря 2013 (UTC)[ответить]
  • r/[фФ]ранцузк/$1ранцузск/
Хотя замена уже была, я её немного улучшил. --Movses 19:22, 30 декабря 2013 (UTC)[ответить]
  • r/[Кк]орр?еспон?ден/$1орреспонден/ !вариант с одной "р" встречается в украиноязычных фрагментах
  • r/[Пп]омош/$1омощ/ "помощь" и производные
  • r/[Оо]кк?упир/$1кк?упир/ оккупировать
  • r/[Оо]кк?упаци/$1ккупаци/ "оккупация" и производные
  • r/[Пп]аралл?ель/$1араллель/ ! но Паралельная

Там ещё 10 Кб слов с ошибками 149.62.8.217 11:00, 26 декабря 2013 (UTC)[ответить]

Спасибо ! С радостью посмотрим ваши 10 кб, если зальёте в википедию, например сюда. --Movses 11:34, 26 декабря 2013 (UTC)[ответить]
Залито; собственно слова под чертой, выше порция более менее однозначных замен, продублированы здесь:
  • r/[Вв]осемдесят\b/$1осемьдесят/ числительные надо бы в отдельной группе
  • r/[Вв]осемдесят\B/осьмидесят/ особенно порядковые
  • r/[Дд]естятысячн/$есятитысячн/
  • r/[Чч]етыремя/$1етырьмя/
  • r/[Тт]ринн?ад?цат/$1ринадцат/
  • r/[Аа]вгут/$1август/
  • r/[Аа]бб?р[ие]в[еи]атур/$1ббревиатур/ вроде уже было?
  • r/[Вв]аринт/$1ариант/
  • r/[Вв]сётаки/$1сё-таки/
  • r/[Гг]луюок/$1лубок/ опечатка б-ю
  • r/[Ии]нфркрасн/$1нфракрасн/
  • r/[Ии]стичени/$1стечени/
  • r/[Кк]омиси/$1омисси/
  • r/[Кк]онтр-атак/$1онтратак/
  • r/[Оо]бепокоен/$1беспокоен/
  • r/[Пп]лавнк/$1лавник/
  • r/[Пп]ригорд/$1ригород/
  • r/[Пп]оло[шщ]ад/$1лощад/
  • r/[Пп]рородител/$1рародител/
  • r/[Пп]р[еи]обрел\b/$1риобрёл/ !граница слова
  • r/[Пп]одданы/$1одданны/ !внимание на контекст
  • r/[Пп]оломник/$1аломник/ "половник" маловероятно, но возможно
  • r/[пП]роишестви/$1роисшестви/
  • r/[Сс]ред[ие]земномо?р/$1редиземномор/
  • r/[Тт]еме?п?ератур/$1емператур/
  • r/полога/полага/ лаг-лож,
  • r/Филл?ипп?ин/Филиппин/
  • r/резеден/резиден/
  • r/\Bних\b/ниях/ попытка отловить именно окончания: по идее \B должно отсечь "\bних\b" (местоимение после предлога)
  • r/обсулов/обуслов/

37.147.194.106 16:30, 28 декабря 2013 (UTC)[ответить]

Да, неслабый файлик, спасибо ещё раз ! Работы предстоит немало :) --Movses 22:47, 29 декабря 2013 (UTC)[ответить]

Оккупация

Думаю, «оккупацию» нужно доработать-подправить. Примеры (при редактировании в AWB):

Замена "окупац" > "оккупац" нормально работает если убрать лишний знак вопроса. ✔ Сделано (diff) --Movses 19:28, 30 декабря 2013 (UTC)[ответить]

ценральный

Было find="\b([Цц])етр(\w*)\b" replace="$1ентр$2". Чтобы ловило как в заголовке, надо find="\b([Цц])е(тр|нр)(\w*)\b" replace="$1ентр$3" 92.242.90.246 02:32, 18 мая 2014 (UTC)[ответить]

Штуттгарт → Штутгарт

С одним "т". --Fedor Babkin talk 18:13, 19 июня 2014 (UTC)[ответить]

Хочу заменить ссылки на шаблон

Хочу заменить ссылки типа [http://twitter.com/(*)/status/(*) (*)] [https://twitter.com/(*)/status/(*)] [http://twitter.com/(*)/status/(*)] [https://twitter.com/(*)/status/(*)] на шаблон {{Твиттер}} в своей вики. Как это можно сделать в AWB??

17:13, 23 августа 2014 (UTC)

афициальный

Работа над ошибками от Яндекса утверждает, что так тоже ошибаются 88.81.43.41 16:53, 14 января 2015 (UTC)[ответить]

В википедии "афициальный" я не нашёл, но модицифировал регулярное выражение, авось когда поймаем. --Movses 08:43, 15 января 2015 (UTC)[ответить]

Викификатор некорректно обрабатывает такие случаи. --Insider 51 11:50, 24 февраля 2015 (UTC)[ответить]

  • Викификатор берёт замены не из этого списка, ответственность за корректное составление списка для викификатора - на составителе того списка. АВБ делает здешние замены только в полуручном режиме, оператор должен отслеживать подобные случаи. × Не сделано MaxBioHazard 17:54, 21 мая 2015 (UTC)[ответить]

"Начнется" и "самопровозглашенный"

Прошу сделать так, чтобы при викификации текста слово «начнется» заменялось на «начнётся», а «(само)провозглашенный» (-ая и прочие окончания) — на «(само)провозглашённый». Кадош 20:57, 22 марта 2015 (UTC)[ответить]

Група

Перенесено со страницы Обсуждение участника:NBS. NBS 22:42, 16 мая 2015 (UTC)

В режиме исправления Typos'ов в АВБ нельзя включить полный автомат, в нём работает только ручное сохранение каждой правки после предпросмотра диффа. Исходя из этого, подобные замены, неадекватные в других языках, в списке оставляются, т.к. предполагается, что правщик увидит дифф перед сохранением правки и не станет его сохранять. Не понравившаяся вам правка не могла быть совершена через АВБ, т.к. отключить добавление в описание правки текста "с помощью АВБ" можно только с учётки со флагом бота, кроме того правка вообще немассовая. Возможно, это сделал викификатор, но у него свой список замен, лежащий в его js-файле, он не берёт замены из АВБшного списка. На основании вышенаписанного предлагаю восстановить удалённую вами замену. MaxBioHazard 12:09, 3 мая 2015 (UTC)[ответить]

Насколько я понимаю, Putnik обновляет гаджет скриптом, а специальной отметки «только для ботов, в гаджет не переносить» в ВП:Typos не предусмотрено. Кроме того, есть достаточно много примеров, где это срабатывает некорректно и в русском тексте — всевозможные названия организаций, групи…; в то же время, некоторые нужные автозамены не проводились (например, в русском тексте «групой» → «группой»). Думаю, что эта замена достаточно сложная, поэтому её лучше периодически производить отдельным проходом по результатам поиска. NBS 18:53, 3 мая 2015 (UTC)[ответить]
Да, переношу скриптом, копируются все правила, которые можно воспроизвести при помощи регулярных выражений на JS. — putnik 18:58, 3 мая 2015 (UTC)[ответить]

Комунерос

Не могу составить правило для исключения слова комунерос. Сделал было так (К|к)ом+ун+(?!ерос), но оно не работает. Тут бы пригодился свержадный квантификатор (К|к)ом++ун++(?!ерос), но они не поддерживаются. Есть идеи? Игорь Темиров 13:12, 21 июля 2015 (UTC)[ответить]

дествительно - дйствительно

Викификатор заменяет «дествительно» на «дйствительно». Kalendar 09:40, 29 января 2016 (UTC)[ответить]

Здесь я исправил, а вот у викификатора это надо бы написать на страницу Обсуждение Википедии:Викификатор. --Movses 10:01, 29 января 2016 (UTC)[ответить]

Комунига

т.к. Обсуждение Википедии:Викификатор посылает сюда ...

Викификатор заменяет «Комунига» на «Коммунига», что неправильно--User№101 22:09, 26 февраля 2016 (UTC)[ответить]

Война правок

По поводу правила "Коммунизм". Я понял, коллега, что не понимаете, потому и написал, тренируйтесь в личном пространстве. Я вернул страницу к консенсусной версии от 10 февраля и начинать обсуждение должны вы, а не я. Претензии изложены в комментариях к правкам. Что я должен к ним добавить? Лишь то, что, если видите работающее правило, не стоит ломать его, а постараться модернизировать. В данном случае, например, возможен такой вариант: find="\b(К|к)ом+ун+(?!ерос|иг)", но вы предпочли сделать из одного работающего правила два, причём одно из них неработающее. Я уже не раз, как вы помните, правил за вами новые правила, но в данном случае, когда вы ломаете старые, счёл правильным этот путь исправления. Игорь Темиров 05:05, 28 февраля 2016 (UTC)[ответить]

Устаревшие параметры

Предлагаю добавить в автоисправление удаление устаревших параметров шаблона {{НП}} (размер карты (страны/региона/района) и ЯндексКарта). Гонять ради них бота жалко, а вот если добавить сюда, то небольшими темпами оно частично будет вычищено вместе с сопутствующими правками. -- dima_st_bk 07:56, 2 мая 2016 (UTC)[ответить]

Поддерживаю. --Insider 51 06:32, 12 сентября 2016 (UTC)[ответить]

четыремя → четырёмя

AWB предлагает вот такую странную замену: четыремя → четырёмя. -- NZeemin (обс) 21:26, 19 июля 2016 (UTC)[ответить]

  • А первое слово существует? Список не обязан корректно обрабатывать несуществующие слова; он пишется в расчёте на существующие. MBH 23:10, 19 июля 2016 (UTC)[ответить]
  • Вы исключили из обработки сложные слова типа «четырёхэтажный» — пожалуйста, верните. А слово «четыремя» разве существует, что ради него надо что-то менять? Должно быть «четырьмя», не? DmitTrix (обс) 07:30, 20 июля 2016 (UTC)[ответить]
P.S.: попросил ботоводов заменить «четыремя» на «четырьмя». DmitTrix (обс) 08:04, 20 июля 2016 (UTC)[ответить]

Клиппертон

Превращает Клиппертон в Клипертон. --Insider 51 06:32, 12 сентября 2016 (UTC)[ответить]

Уточнение: превращает Остров Клиппертон в Остров Клипертон (не меняет название статьи, но меняет отображаемый текст). Kalendar (обс) 06:36, 12 сентября 2016 (UTC)[ответить]
Участник:Jack who built the house. Oleg3280 (обс.) 07:55, 21 июля 2019 (UTC)[ответить]

Викификация слов с ударением

Текст с ударением в преамбуле: Викификатор превращает «Коэффицие́нт рассе́яния» в «Коэффицие́нт расе́яния». Kalendar (обс) 07:09, 12 сентября 2016 (UTC)[ответить]

агентство

Надо убрать дубль из секции А — есть в секции ТСТВ 92.242.79.77 19:59, 16 ноября 2016 (UTC)[ответить]

Коммунарский район

Вот здесь (правки) викификатор отработал некорректно. Поскольку существует корректное слово укр. Комунарський, то предлагаю в коде MediaWiki:Gadget-wfTypos.js исправить строку

r( /((?:^|\s)[Кк])ом+ун+(?!ерос)/g, '$1оммун' );

на

r( /([^іїєґІЇЄҐ]{100}(?:^|\s)[Кк])ом+ун+(?!ерос)([^іїєґІЇЄҐ]{100})/g, '$1оммун$2' );

Я проверил регулярку с помощью https://regex101.com/#javascript и проблем не увидел. --Movses (обс) 18:46, 17 августа 2016 (UTC)[ответить]

Буква ё

Добрый день! Скажите, пожалуйста, викификатор умеет заменять е на ё? Здесь написано что да, однако у меня (Google Chrome 55) этого не происходит (по крайней мере на тексте "Найдем зеленый цвет"), хотя другие функции работают (в частности замена "т.е." на "то есть"). Спасибо! Дима74 (обс.) 18:24, 27 января 2017 (UTC)[ответить]

Молодёжь

Предлагаю добавить в гаджет исправления орфографии слово «молодёжь» и все производные. С белорусским, болгарским и украинским нежелательных совпадений нет, я проверил. Могу ошибаться, но выглядеть это должно так:

r( /((?:^|\s)[Мм])олодеж/g, '$1олодёж' );

Или так:

r( /((?:^|\s)[Мм])олодеж(\w+)(?=[^A-ZА-ЯЁa-zа-яё́ъ|$)/g, '$1олодёж$2' );

Krokusse (обс.) 03:23, 1 февраля 2017 (UTC)[ответить]

Вторая регулярка выглядит более безопасно, но она не ловит "науч.-практ. молодеж. конф." И обе регулярки не ловят "Техника-Молодежи" и "(молодежь)". Также не ловятся "«Молодежь Эстонии»", "«Молодежь Алтая»", хотя кавычки лучше и не ловить — вполне возможно, что в оригинале имя собственное без "ё". --Movses (обс.) 09:22, 1 февраля 2017 (UTC)[ответить]

br

AWB не превращает <br /> → <br>. Почему? Включены Typos. Пришлось копировать код замены br’ов вручную в «поиске и замене».  ← ALEX GREAT [обсуждение] 05:02, 22 мая 2017 (UTC)[ответить]

Я надеюсь, вы не одну эту сверхмелкую правку сохраняете? MBH 10:01, 22 мая 2017 (UTC)[ответить]
О чём вы говорите? Вы думаете, что я захожу в АвтоВикиБраузер, чтобы вручную вписать туда код замены br’ов, пройтись по статьям и заменить исключительно их? Мне проще было бы это делать через Википедию, где викификатор с этим прекрасно справляется. Поэтому мой ответ — да, я сохраняю правку с другими необходимыми изменениями (вычищал ненужные флаги из карточек, можете посмотреть в моё вкладе).  ← ALEX GREAT [обсуждение] 02:43, 26 мая 2017 (UTC)[ответить]

Ёфикация

Просьба добавить замену таких слов: шахтер → шахтёр, молодежный → молодёжный, партнер → партнёр, провел → провёл, прошел → прошёл, пришел → пришёл, перешел → перешёл. Спасибо. — Mitte27 (обс.) 22:19, 31 января 2018 (UTC)[ответить]

(Добавлено в список техзадач на будущее)

Этот невидимый раздел используется для формирования ссылок на разделы на странице поиска. Тхздч 2018-02-08: Добавить ёфикацию в викификатор. Mitte27. /Тхздч.

Теплый → тёплый, ночевка → ночёвка, береза → берёза, днем → днём. — Оркрист 01:05, 25 июня 2019 (UTC)[ответить]

Замены с учётом иных языков

Есть некоторые проблемы с заменами из этой группы:

  1. они не попадают в викификатор
  2. (вроде бы) если два слова находятся на расстоянии меньше 200 символов, то будет обработано только одно из них

Предлагаю изменить эти замены с использованием lookahead и lookbehind. Например, замену "учасник → участник":

<Typo word="участник" find="([^іїєґІЇЄҐuk]{100,100}\b)([Уу])часник([^іїєґІЇЄҐ]{100,100})" replace="$1$2частник$3" />

изменить вот так:

<Typo word="участник" find="\b(?<=(?:[^іїєґІЇЄҐuk]|^){100})([Уу])часник(?=(?:[^іїєґІЇЄҐuk]|$){100})" replace="$1частник" />

Это позволит решить вторую проблему (если она есть, конечно) и когда-нибудь в будущем первую. Дима74 (обс.) 18:30, 2 апреля 2019 (UTC)[ответить]

Намёк

Добавьте, пожалуйста, намек → намёк. Здесь был Вася 1234qwer1234qwer4⇝обс⇜⇝вклад⇜ 11:37, 18 августа 2019 (UTC)[ответить]

Typo word="манёвр"

а слово "манёвренный" у вас без ё будет ?

оффицер → офицер

странно это, учитывая что в реальности их officer это офисный работник (тот кто работает в office), а совсем не наш офицер

Цетрария

Исправление орфографии неправильно срабатывает на статье Цетрария исландская. К сожалению, я не понимаю, почему там ошибочно срабатывает (ведь исключение прописано), потому просьба посмотреть более подкованным людям. — Movses (обс.) 21:13, 26 декабря 2019 (UTC)[ответить]

  • Movses, я посмотрела, это не только в исландской, но и в других цетрариях тоже не работало. Там в исключении не был прописан вариант со строчной буквой и с ударением. Добавила, вроде работает, и в викификаторе тоже обновила. К слову, надо бы везде ударные буквы проверить. — Alexandrine (обс.) 13:30, 12 июля 2020 (UTC)[ответить]

Мягкий ЧЬ

Встретил ошибку "передачь". Понятно, что произносим мягко, а пишем без мягкого знака. Конкретно эта ошибка встречается не часто (всего 2 раза), потому не добавлял в список автозамен. Но есть чуйка, что если поискать по дампу, то найдётся таких ошибок не одна и тогда можно будет добавить в список автозамен. — Movses (обс.) 22:37, 28 декабря 2019 (UTC)[ответить]

Непонятно как различать с такими словами как "ночь", "прочь", "речь". Дима74 (обс.) 14:02, 29 декабря 2019 (UTC)[ответить]

на протяжение → на протяжении

Исправил около двуж сотен случаев; по-моему, достаточно для включения в список. Здесь был Вася 1234qwer1234qwer4⇝обс⇜⇝вклад⇜ 22:20, 15 июня 2020 (UTC)[ответить]

брошурі → брошюрі

Ошибочно исправляет украинское брошура (в польській брошурі исправляет на в польській брошюрі). Radmir Far (обс.) 07:09, 4 сентября 2021 (UTC)[ответить]

Тем не менее

Перенесено со страницы Обсуждение Википедии:Викификатор#Тем не менее. — putnik 20:33, 25 декабря 2021 (UTC)

Я сделал запрос к ботоводам, запрошу и здесь. Встретил два раза подряд ошибку (и исправил её) в выражении: тем ни менее вместо правильного тем не менее. Если этого ещё нет в коде викификатора, предлагаю добавить. — 217.197.250.65 19:05, 4 июля 2020 (UTC)[ответить]

Использование в других проектах

Коллеги, правильно ли я понимаю, что для того, что бы всё представленное здесь работало в ру-викиновостях, нужно перетащить это в викиновости? VladimirPF (обс.) 11:19, 20 февраля 2022 (UTC)[ответить]

привело→привёло

Уберите из автовикифкатора эту замену.— Inctructor (обс.) 12:44, 12 августа 2023 (UTC)[ответить]

Единственен

Викификатор заменяет корректное «единственен» на некорректное «единственнен», хорошо бы поправить, bezik° 20:30, 24 сентября 2023 (UTC)[ответить]

<ref>[//site.com ... km2 ...]</ref>

Заменяет «km2» внутри ref, нужно отключить. ~~‍~~ Jaguar K · 17:41, 8 декабря 2023 (UTC)[ответить]

Неверные наращения числительных

@Gromolyak, приветствую. В вашей реализации появился баг, меняющий:

  • ой_ → ой-й_
  • ою_ → ою-ю_
  • ое_ → ое-е_
  • ом_ → ом-м_
  • ого_ → ого-го_
  • ому_ → ому-му_
  • ая_ → ая-я_
  • ую_ → ую-ю_
  • ий_ → ий-й_
  • им_ → им-м_
  • их_ → их-х_
  • ими_ → ими-ми_
  • ем_ → ем-м_
  • ей_ → ей-й_
  • ею_ → ею-ю_
  • его_ → его-го_
  • ему_ → ему-му

Просьба поправить или откатить. Solidest (обс.) 20:48, 29 мая 2024 (UTC)[ответить]

  • Здравствуйте! Не совсем вас понял. Для замены обязательно наличие цифр и дефиса, но даже с ними не смог подобрать примера, приводящего к неправильной замене. Не могли бы вы привести хотя бы один такой пример?

На всякий случай — последние по дате изменения регулярное выражение и строка замены в скрипте —

"\b(\d+)-(?:(?:ы([ймех]|ми))|(?:о([йюем]|го|му))|(?:а(я))|(?:у(ю))|(?:и([ймх]|ми))|(?:е([мйю]|го|му)))\b"

и

"$1-$2$3$4$5$6$7"

Gromolyak (обс.) 22:41, 29 мая 2024 (UTC)[ответить]

  • Эту регулярку на днях добавили в викификатор и она стала вызывать подобные ошибки: [5], [6], [7], и тд. Сам не уверен почему она реагирует только на нижнее подчеркивание. Возможно проблема возникает в связи с чем-то ещё, но появилась она ровно в день этой правки. Solidest (обс.) 22:50, 29 мая 2024 (UTC)[ответить]
    • В начале регулярного выражения присутствует "(\d+)-", что означает одну или несколько цифр, а следом — дефис, они являются обязательными для того, чтобы шаблон сработал. Если в тексте их нет — выражение сработать не может ни при каких прочих условиях, что и было мной проверено раньше, когда с помощью AWB и этого выражения я заменил множество (несколько тысяч) ошибочных наращений, при этом не было ни одной жалобы. Кроме того, вот эта правка https://ru.wikipedia.org/w/index.php?title=%D0%92%D0%B8%D0%BA%D0%B8%D0%BF%D0%B5%D0%B4%D0%B8%D1%8F:AutoWikiBrowser/Typos&diff=prev&oldid=135455251 участника Putnik показывает, что он не увидел ничего подозрительного в выражении, а, по слухам, он является специалистом в этой области. Кстати, и подчёркивания в рег. выр. нет, ни нижнего, ни верхнего. Gromolyak (обс.) 02:28, 30 мая 2024 (UTC)[ответить]
    • Кстати, добавленная версия не соответствует моей и вообще не может правильно работать, так как первая скобка, которой не было, захватывает и копирует всё исходное выражение и ставит его перед дефисом, что уже неверно.

Правильная версия:

\b(\d+)-(?:(?:ы([ймех]|ми))|(?:о([йюем]|го|му))|(?:а(я))|(?:у(ю))|(?:и([ймх]|ми))|(?:е([мйю]|го|му)))\b

Добавленная неправильная версия:

((?:^|\s)(?:\d+)-(?:(?:ы([ймех]|ми)))|(?:о([йюем]|го|му))|(?:а(я))|(?:у(ю))|(?:и([ймх]|ми))|(?:е([мйю]|го|му)))\b

Не могу себе представить, что скрипт произвёл такую замену, так как при этом он поменял захватывающие скобки на незахватывающие ("(\d+)" на "(?:\d+)"), а также произвольно поместил всё выражение ещё в пару захватывающих скобок, чего быть не должно. Похоже, будто кто-то неправильно изменил выражение вручную. Копирование выражения без модификаций, без сомнений, решит проблему. Gromolyak (обс.) 02:57, 30 мая 2024 (UTC)[ответить]

Прошу исправить её. Gromolyak (обс.) 13:05, 1 июня 2024 (UTC)[ответить]

\b(В|в)ертолет → $1ертолёт и Bell AH-1 Super Cobra

Правило из WP:AutoWikiBrowser/Typos#В почему-то не работает в статье Bell AH-1 Super Cobra, хотя если его перенести в личные, производится 45 таких замен. В статье Афон замена производится. Что-то не так с regex, самой статьёй или оформлять Bug Report на фабрикаторе? A.sav (обс.) 18:30, 21 октября 2024 (UTC)[ответить]

  • У меня всё сработало. Странно. Посмотрите в консоль на той версии статьи, на которой у вас не работало. stjn 21:01, 21 октября 2024 (UTC)[ответить]
    • Судя по характеру изменений и отсутствию метки AWB в описании изменения Вы использовали Викификатор, а не AWB? — Эта реплика добавлена участником A.sav (ов)
      • А, да. Лучше указывать точнее, с чем у вас проблемы, потому что этот список используется и в викификаторе. stjn 10:39, 22 октября 2024 (UTC)[ответить]
      • Оказалось документированным поведением — если исправляемый вариант попадается во внутренней ссылке, правило отключается для всего файла. И это порождает следующий класс проблем. Сейчас многие правила написаны таким образом, что включают в себя вариант правильного написания слова, это сильно их упрощает, а замена правильного написания на правильное вроде как не было проблемой. Однако из-за этой особенности поведения AWB многие ошибки не исправляются. Вчера проверил на примере "регентство" (пропущена первая буква "т") — AWB действительно пропускает, приходится исправлять руками.
        Насколько я знаю регулярные выражения, нельзя задать исключение для правильного варианта? A.sav (обс.) 14:43, 24 ноября 2024 (UTC)[ответить]

Партнер, шахтер порождает длинное описание в описании правки

Понятно, что это проверка для гарантирования ложных срабатываний в украинских текстах, однако может стоит добавить квалификатор ?>= для того, чтобы сократить описание. И будет проще понимать, какая замена производится. A.sav (обс.) 16:33, 22 октября 2024 (UTC)[ответить]