В период с 2001 по 2010 год было опубликовано не менее 1746 подобных исследований[1][2].
Производство контента
Меньшинство редакторов создают большую часть постоянного контента
Исследования 2005—2007 годов показали, что:
большинство правок в Википедии вносит меньшинство редакторов
распределение правок подчиняется степенному закону: около половины всех правок вносит 1 % редакторов.
В 2007 году другое исследование показало, что «элитные» редакторы, вносившие много правок, вносили 30 % изменений контента, измеряемых по количеству слов. Эти редакторы также чаще добавляли, а не удаляли контент[3].
В ходе исследования (2007) в Университете Миннесоты были проанализированы триллионы просмотров слов (в период с сентября 2002 года по октябрь 2006 года), и был сделан вывод о том, что 0,1 % сообщества Википедии (4200 редакторов) создали 44 % просмотров слов за этот период[3].
В результате исследования 2009 года было выяснено, что один процент редакторов (которые в среднем вносят более 1000 правок в месяц) вносят 55 % правок[4].
Распределение труда и социальные слои
В 2007 году было выявлено «социальное расслоение в сообществе Википедии» с выделением «класса администраторов». Признавалось явное смещение власти между администраторами и другими редакторами[5].
Анализ всей истории правок английской Википедии по июль 2006 года показал, что влияние правок администраторов на контент неуклонно снижалось с 2003 года, когда администраторы вносили примерно 50 % от общего числа правок, до 2006 года, когда администраторами было выполнено только 10 % правок. Явление было названо «подъемом толпы». Результаты для «элитных пользователей», то есть пользователей, внесших более 10 000 правок, в некоторой степени соответствовали результатам, полученным для администраторов. Однако «количество слов, изменённых элитными пользователями, соответствовало изменениям, внесенным новичками, хотя количество правок, внесенных новичками, росло пропорционально быстрее».
Надёжность
Оценивалась зависимость доверия к Википедии от эпистемических или прагматических достоинств. Хотя читатели не могут оценить фактические знания и опыт авторов конкретной статьи, они могут оценить страсть участников к проекту и коммуникативный дизайн, посредством которого эта страсть проявляется, что может дать основания для доверия[6].
Википедии нельзя доверять, основываясь на индивидуальной экспертизе, коллективных знаниях или прошлом опыте надёжности. Личный опыт и эмпирические исследования, подтвержденные инцидентами, включая споры вокруг биографии Зайгенталера, позволили сделать вывод, что Википедия в целом не заслуживает доверия. Следовательно, эти эпистемические факторы не оправдывают обращение к Википедии.
Было предложено обоснование доверия к Википедии, основанное на прагматических ценностях, которые можно свести к двум факторам:
масштабы и активность Википедии свидетельствуют о том, что редакторы глубоко заинтересованы в предоставлении миру знаний
прозрачное развитие политики, практик, институтов и технологий, в дополнение к заметным масштабным усилиям, устраняет возможные сомнения.
Высказанные опасения включают определение предоставляемых знаний, предотвращение искажения вклада людей, не разделяющих тех же обязательств, исправление ошибок редактирования, а также контроль и улучшение качества статей.
Информация о здоровье
Информация о здоровье в английской Википедии обычно доступна в виде результатов поисковых систем и страниц результатов поисковой системы, которые часто предоставляют ссылки на статьи Википедии[7]. Были проведены независимые оценки качества медицинской информации, представленной в Википедии, и круга лиц, получающих доступ к этой информации. Были изучены количество и демографические данные людей, которые ищут информацию о здоровье в Википедии, объём информации о здоровье в Википедии и качество информации в Википедии[8].
Предвзятость
Исследования неизменно показывают, что Википедия систематически переоценивает точку зрения, принадлежащую определённой демографической группе, описываемой как «среднестатистический википедист», который является образованным, технически подкованным, англоговорящим белым мужчиной в возрасте 15-49 лет из развитой христианской страны в северном полушарии[9][10][11]. Такая системная предвзятость в демографических данных редакторов приводит к[12][13]:
явная (когда определённая точка зрения поддерживается в статье или ссылками).
Междисциплинарные научные оценки статей Википедии показали, что:
статьи, как правило, точны и свободны от дезинформации,
как правило, неполны и не представляют все точки зрения с нейтральной точки зрения[12].
Исследователями из Вашингтонского университета в Сент-Луисе была разработана статистическая модель для измерения систематической предвзятости в поведении пользователей Википедии в отношении спорных тем. Были исследованы поведенческие изменения администраторов энциклопедии после вступления в должность. Было определено, что систематическая предвзятость имела место постфактум[14].
Географическая предвзятость
Исследование, проведенное в 2009 году Оксфордским институтом Интернета, показало, что статьи с геотегами во всех языковых версиях Википедии охватывают около полумиллиона мест на Земле. Большинство статей было посвящено Северной Америке, Европе и Восточной Азии. Обширные регионы развивающегося мира, включая большую часть Африки, были описаны мало[13].
Исследование (2009) 15 языковых изданий показало, что каждое издание было в высокой степени «самофокусированным», с акцентом на географическом «родном регионе» данного языка[15].
Исследование (2021) Франчески Триподи показало, что из примерно 1,5 миллионов биографических статей в английской Википедии в 2021 году только 19 % были о женщинах[16][17]. Существующие биографии женщин имеют гораздо больше шансов быть номинированными на удаление[англ.], чем биографии мужчин[16][17].
Борьба с предвзятостью
В некоторых исследованиях изучалась работа WikiProject Countering Systemic Bias (WP:CSB)[18], которая представляет собой коллективные усилия некоторых редакторов Википедии по расширению точки зрения энциклопедии. Исследование (2010) среди 329 редакторов, участвовавших в WP:CSB, показало, что редакторы отдавали предпочтение темам, относящимся к Соединённым Штатам и Англии[9].
В 2021 году рассматривалась «золотая середина» предвзятости энциклопедии. Был сделан вывод, что включение надёжных, рецензируемых источников, предлагающие более полную точку зрения, чем существующие статьи Википедии, обеспечит лучшее представительство исключённых или маргинализированных точек зрения[11].
В Лаборатории обработки всеобъемлющих знаний[англ.] используется Википедия и Викисловарь для автоматического создания баз лингвистических знаний, которые аналогичны экспертному ресурсу WordNet[19]. Был создан алгоритм для определения связей между словами на базе английской Википедию и с помощью её схемы категоризации. Был сделан вывод, что в Википедии была создана таксономия, способная конкурировать с WordNet в задачах лингвистической обработки[20].
Социальные аспекты
Конфликт
Исследование 2011 года сообщило о новом способе измерения степени спорности википедийной статьи, проверенном на шести изданиях на индоевропейских языках, включая английский[21].
В статье 2013 года в Physical Review Letters описывалась общая модель социальной динамики в среде сотрудничества, включающая мнения, конфликты и консенсус, с конкретным примером из Википедии[22].
В 2014 году был проанализирован объём редактирования статей в различных языковых версиях Википедии с целью выявления наиболее спорных. В английской версии тремя самыми спорными статьями стали «Джордж Буш-младший», «Анархизм» и «Мухаммед». Темы на других языках, вызвавшие наибольшие споры: Хорватия (немецкий), Сеголен Руаяль (французский), Чили (испанский) и Гомосексуализм (чешский)[23].
Демография
Исследование Hitwise[англ.] (2007), воспроизведенное в журнале Time[24] , показало, что посетители Википедии почти поровну делятся на мужчин и женщин (50/50), но 60 % правок вносят редакторы-мужчины. Опрос 2010 года показал, что только 13 % редакторов и 31 % читателей были женщинами[4]. В исследовании 2017 года 15 % редакторского сообщества составляли женщины[10].
Исследование 2012 года, охватившее 32 языковых издания, проанализировало циркадную активность редакторов. Был сделан вывод, что доли вклада в англоязычную Википедию из Северной Америки и Европы, Дальнего Востока и Австралии почти равны, тогда как для упрощенной англоязычной Википедии этот показатель увеличился до 75 %[25].
Правила и рекомендации
По состоянию на сентябрь 2007 года, анализ правил и рекомендаций англоязычной Википедии выявил ряд ключевых статистических данных[26]:
44 официальных правила
248 руководств
Несмотря на то, что правило «игнорировать все правила» было коротким, оно вызвала массу обсуждений и разъяснений.
Хотя сама политика «Игнорировать все правила» состоит всего из шестнадцати слов, страница, поясняющая её смысл, содержит более 500 слов, отсылает читателей к семи другим документам, вызвала более 8000 слов обсуждения и была изменена более 100 раз менее чем за год.
Некоторые ключевые правила значительно расширились со временем:
Был проведен количественный анализ выборки активных страниц обсуждений англоязычной Википедии за ноябрь 2006 года. Изучалось, как применялись правила и как участники работали над достижением консенсуса[27].
Исследование показало, что правила применялись непоследовательно.
Примеры:
обсуждение, в ходе которого участники пришли к выводу, что расчет среднего значения на основе данных, предоставленных государственным агентством, представляет собой оригинальное исследование
обсуждение, в котором логическая дедукция использовалась в качестве контраргумента для первоначальной исследовательской политики
Исследование выявило, используя методы Grounded theory, 7 типов игр с правилами:
область применения статьи (что не относится к теме статьи)
предшествующий консенсус (прошлые решения, представленные как абсолютные и неоспоримые)
сила толкования (подсообщество, претендующее на большую правильность толкования, чем другое)
легитимность участника (его/её опыт и т. д.)
угроза санкций (блокировка и т. п.)
совет попрактиковаться на других страницах (другие страницы считаются образцами для подражания)
Подробно были описаны первые 4 типа игр с правилами, которые осуществлялись путём простой интерпретации правила. Пятая категория проявления власти состояла из грубых нарушений правил, которые прощались, поскольку вклад участника ценился, несмотря на его неуважение к правилам.
Область применения статьи
В исследовании делается вывод о том, что политика Википедии в вопросах определения области действия неоднозначна.
Предварительный консенсус
В Википедии консенсус никогда не бывает окончательным и может меняться. Исследование показали, что эта временная неоднозначность является плодородной почвой для игр с правилами, и помещает борьбу за консенсус в более широкую картину борьбы за право собственности на статью.
Сила интерпретации
Администраторы нарушали консенсус и удаляли личные учётные записи пользователей-анонимов.
Легитимность вкладчика
Для этого типа игры с правилами характерна ссылка на прошлые заслуги, как возражение на обвинение в непродуктивности и подрывной деятельности.
Явная борьба за право собственности
Есть участники, которые постоянно и успешно нарушают правила без каких-либо санкций.
Выборы в администрацию являются повышением, отличающим элитную основную группу от большой массы редакторов. Соответственно, в статье использовался метод захвата политики[29] — метод, который сравнивает номинально важные атрибуты с теми, которые фактически ведут к повышению в рабочей среде.
Общий показатель успешности продвижения снизился с 75 % в 2005 году до 53 % в 2006 году и до 42 % в 2007 году. Такое внезапное увеличение числа неудач кандидатов в администраторы было объяснено более высокими стандартами, которым должны соответствовать новые назначенные администраторы[30]. Некоторые из первых администраторов выразили сомнение в успехе на выборах, если бы их выборы состоялись недавно.
Было определено:
многократное «баллотирование» на статус администратора пагубно влияет на шансы кандидата на успех. Каждая последующая попытка имеет на 14,8 % меньше шансов на успех, чем предыдущая. Продолжительность участия в проекте вносит лишь незначительный вклад в вероятность успеха.
одно изменение правила Википедии или редактирование WikiProject равноценно десяти изменениям статьи, что было измерено с помощью показателя разнообразия — простого подсчета количества областей (16 областей: статья, обсуждение статьи, статьи/категории/шаблоны для удаления, обзор (не)удаления и т. д.), в которых редактор принимал участие. Пользователь, который редактировал статьи, свою собственную страницу и разместил одну публикацию при проверке на (от)удаление, будет иметь показатель разнообразия 3. Внесение хотя бы одной правки в любой дополнительный раздел Википедии на 2,8 % повышал вероятность успеха в получении административной должности.
внесение незначительных правок также помогало.
каждая правка на странице арбитража или посредничества или уведомления Wikiquette (площадки для разрешения споров) снижали вероятность успеха на 0,1 %. Размещение сообщений на досках объявлений администратора имело столь же пагубный эффект. Исследование интерпретировало это как доказательство того, что редакторы, вовлеченные в эскалацию или затягивание конфликтов, снижают свои шансы стать администраторами
выражение «спасибо», а также указание на проблемы с точкой зрения (исследование анализировало только метаданные) имели незначительную пользу, повышая шансы кандидата в администраторы на победу в 2006—2007 годах на 0,3 % и 0,1 %.
Несущественные факторы:
редактирование страниц пользователей (в том числе и своих) и страниц обсуждения пользователей
приветствие новичков или обращение «пожалуйста» в комментарии к редактированию
участие в формировании консенсуса, например, в голосовании по кандидату в администраторы.
борьба с вандализмом. Каждая тысяча правок, содержащих вариации «отмена», положительно коррелировала (7 %) с администрированием в 2006—2007 годах, но не достигала статистической значимости, если только не снизить порог до p < .1). Ещё более запутанным является тот факт, что до 2006 года число отмен отрицательно коррелировало (-6,8 %) с успешностью администрирования, в то время как статистической значимости не достигало даже при p < 0,1. Это может быть связано с введением в 2006 году политики, известной как «Три отмены», направленной на сокращение числа отмен.
Не были измерены такие факторы, как: качество редактирования или участие в координации за пределами сайта Википедии[31]. Был сделан следующий вывод:
простого выполнения большого объёма производственной работы недостаточно для «продвижения» в Википедии
кандидаты в администраторы должны были продемонстрировать больше навыков управленческого поведения
разнообразный опыт и вклад в разработку правил и WikiProjects были более сильными предикторами успеха для кандидата.
Это согласуется с выводами о том, что Википедия является бюрократией[32] и что работа по координации существенно возросла[33][34]. Сообщество в целом начало отдавать приоритет разработке правил и организационному опыту, а не простой координации на уровне статей.
Решения о кандидатах в администраторы принимаются на основе истории предыдущих взаимодействий[35].
Читательская аудитория
Википедией пользуются врачи, студенты, журналисты и учёные[36]. В ходе исследования (2009), было установлено, что 70 % молодых врачей еженедельно использовали Википедию для поиска медицинской информации в 26 % случаев[4].
По крайней мере одно исследование показало, что британцы доверяют BBC меньше, чем Википедии[36].
Количество просмотров страницы итальянской Википедии о рассеянном склерозе увеличивалось, когда истории о рассеянном склерозе широко распространялись в новостных средствах массовой информации[37].
В образовании
Википедия является наиболее часто используемым открытым образовательным ресурсом в сфере высшего образования и в 2000 раз более эффективна с точки зрения затрат, чем печатные учебники[36]. Использование Википедии повышает интерес студентов к обучению, их вклад в свою работу, их обучение и личностное развитие, а также создает возможности для местного и международного сотрудничества[38].
Машинное обучение
Извлечение информации, пригодной для машинной обработки, происходит путём автоматизированного извлечения семантических знаний с использованием алгоритмов машинного обучения[39]. Такой проект, как DBpedia использует структурированный контент, извлеченный из информационных блоков статей Википедии на разных языках с помощью алгоритмов машинного обучения. Целью является создание ресурса связанных данных в семантической паутине[40].
Как предсказатель или фактор влияния на поведение человека
Статистика просмотров страниц статей о фильмах хорошо коррелирует с их кассовыми сборами. Была разработана математическая модель для прогнозирования кассовых сборов путем анализа количества просмотров страниц, а также количества правок и уникальных редакторов страниц Википедии о фильмах. Хотя эта модель была разработана для английской Википедии для фильмов, её можно распространить на другие языки и на другие виды контента[41].
В 2013 году исследователи, в том числе Хелен Сюзанна Моат, Тобиас Прейс[англ.], продемонстрировали связь между изменениями в количестве просмотров статей английской Википедии, посвященных финансовым темам, и последующими крупными изменениями на фондовом рынке США[42][43].
Был сделан вывод о том, что данные о просмотрах страниц Википедии могут улучшить традиционные методы (такие как опросы) прогнозирования результатов выборов[44].
В период с 2019 по 2021 год группа американских и ирландских исследователей провела рандомизированный полевой эксперимент, который показал, что создание статьи в Википедии о юридическом прецеденте более чем на 20 % увеличивает вероятность его цитирования в последующих судебных решениях[45].
↑S - tuckman, Jeff. Measuring the wikisphere // Proceedings of the 5th International Symposium on Wikis and Open Collaboration / S - tuckman, Jeff, James Purtilo. — 2009. — P. 1. — ISBN 978-1-60558-730-1. — doi:10.1145/1641309.1641326.
↑Goodwin, Jean. (2010). The authority of WikipediaАрхивировано 16 февраля 2016 года.. In Juho Ritola (Ed.), Argument cultures: Proceedings of the Ontario Society for the Study of Argumentation Conference. Windsor, ON, Canada: Ontario Society for the Study of Argumentation.CD-ROM.24 pp.
↑ 1234Hube, Christoph.Bias in Wikipedia // Proceedings of the 26th International Conference on World Wide Web Companion - WWW '17 Companion. — Republic and Canton of Geneva, CHE : International World Wide Web Conferences Steering Committee, 2017-04-03. — P. 717–721. — ISBN 978-1-4503-4914-7. — doi:10.1145/3041021.3053375.
↑Sumi, R. Edit Wars in Wikipedia // 2011 IEEE Third Int'l Conference on Privacy, Security, Risk and Trust and 2011 IEEE Third Int'l Conference on Social Computing / R. Sumi, T. Yasseri, A. Rung … [и др.]. — 1 October 2011. — P. 724–727. — ISBN 978-1-4577-1931-8. — doi:10.1109/PASSAT/SocialCom.2011.47.
↑Yasseri T. The most controversial topics in Wikipedia: A multilingual and geographical analysis // Global Wikipedia:International and cross-cultural issues in online collaboration / Yasseri T., Spoerri A., Graham M. … [и др.]. — Lanham, Maryland : Rowman and Littlefield Press, 2014. — ISBN 978-0-8108-9101-2.
↑Butler, Brian. Don't look now, but we've created a bureaucracy // Proceedings of the SIGCHI Conference on Human Factors in Computing Systems / Brian Butler, Elisabeth Joyce, Jacqueline Pike. — 2008. — P. 1101. — ISBN 978-1-60558-011-1. — doi:10.1145/1357054.1357227.
↑Kriplean, Travis. Community, consensus, coercion, control // Proceedings of the 2007 international ACM conference on Conference on supporting group work - GROUP '07 / Travis Kriplean, Ivan Beschastnikh, David W. McDonald … [и др.]. — 2007. — P. 167. — ISBN 978-1-59593-845-9. — doi:10.1145/1316624.1316648.
↑Stumpf, S. A.; London, M. (1981). "Capturing rater policies in evaluating candidates for promotion". The Academy of Management Journal. 24 (4): 752–766. JSTOR256174.
↑Киттур, Аникет. Он говорит, она говорит // Труды конференции SIGCHI по человеческому фактору в вычислительных системах / Киттур, Аникет, Су, Бонгвон, Пендлтон, Брайан А. … [и др.]. — 2007. — P. 453–462. — ISBN 978-1-59593-593-9. — doi:10.1145/1240624.1240698.
↑Виегас, Фернанда Б. Talk Before You Type: Координация в Википедии // 2007 40-я ежегодная Гавайская международная конференция по системным наукам (HICSS'07) / Виегас, Фернанда Б., Ваттенберг, Мартин, Kriss, Jesse … [и др.]. — 2007. — P. 575–582. — ISBN 978-0-7695-2755-0. — doi:10.1109/HICSS.2007.511.