Упередження вибіркиУ статистиці упереджена вибірка — це упередження, за якого вибірка збирається таким чином, що деякі члени цільової сукупності мають меншу або вищу ймовірність потрапити до вибірки[en], ніж інші. Це призводить до упередженої вибірки[1] генеральної сукупності (або факторів, не пов'язаних із людським фактором), у якій не однаково імовірно були відібрані всі особи чи екземпляри.[2] Якщо це не враховано, результати можуть бути помилково віднесені до досліджуваного явища, а не до методу відбору зразків . Медичні джерела іноді називають похибку вибірки похибкою констатації.[3][4] Похибка констатації має в основному те саме визначення[5][6], але все ще іноді класифікується як окремий тип упередженості.[5] Відмінність від упередженості відборуУпереджену вибірку зазвичай класифікують як підтип упередженості відбору,[7] іноді спеціально називають упередженням вибірки[8][9][10], але дехто класифікує її як окремий тип упередження.[11] Відмінність, хоча й не загальновизнана, упередження вибірки полягає в тому, що воно підриває зовнішню валідність тесту (здатність його результатів бути узагальненими для всієї сукупності), тоді як упередження відбору головним чином стосується внутрішньої валідності відмінностей або подібностей, виявлених у зразках, які є в руках. У цьому сенсі помилки, що виникають у процесі відбору вибірки чи когорти, викликають упередження вибірки, тоді як помилки в будь-якому подальшому процесі спричиняють упередження відбору. Однак упередження відбору та упередження вибірки часто використовуються як синоніми.[12] Типи
Вибірка на основі симптомівВивчення медичних умов починається з анекдотичних повідомлень. За своїм характером такі звіти включають лише тих, хто направлений для діагностики та лікування. У дитини, яка не може вчитися в школі, з більшою ймовірністю буде діагностована дислексія, ніж у дитини, яка зі складностями, але вчиться. Дитину, обстежену на одне захворювання, з більшою ймовірністю буде перевірено на наявність інших захворювань, що спотворить статистику супутніх захворювань. Оскільки певні діагнози асоціюються з проблемами поведінки чи розумовою відсталістю, батьки намагаються запобігти стигматизації своїх дітей за допомогою цих діагнозів, створюючи подальшу упередженість. Дослідження, ретельно відібрані з цілої популяції, показують, що багато захворювань є набагато більш поширеними та зазвичай набагато легшими, ніж вважалося раніше. Усечений відбір у племінних дослідженняхГенетики обмежені в тому, як вони можуть отримати дані з людської популяції. Як приклад розглянемо людську характеристику. Нам цікаво визначити, чи успадковується певна характеристика як проста ознака Менделя. Відповідно до законів менделівської спадковості, якщо батьки в родині не мають ознаки, але несуть її алель, вони є носіями (наприклад, неекспресивна гетерозигота). У цьому випадку кожне з їхніх дітей матиме 25 % шансів проявити цю характеристику. Проблема виникає через те, що ми не можемо визначити, в яких сім'ях обоє батьків є носіями (гетерозиготними), якщо вони не мають дитини, яка демонструє цю характеристику. Опис відповідає підручнику Саттона.[13] На рисунку показано родоводи всіх можливих сімей з двома дітьми, коли батьки є носіями (Аа).
Імовірність кожної з відібраних сімей наведена на малюнку, а також частота вибірки постраждалих дітей. У цьому простому випадку дослідник буде шукати частоту 4⁄7 або 5⁄8 для характеристики, залежно від типу використаного усікаючого відбору. Ефект печерної людиниПриклад упередження вибірки називається «ефект печерної людини». Значна частина нашого розуміння доісторичних народів походить від печер, таких як наскальні малюнки, зроблені майже 40 000 років тому. Якби були сучасні малюнки на деревах, шкурах тварин чи схилах пагорбів, їх би давно змило. Подібним чином, докази ям з вогнищами, смітникових місць, місць поховань тощо, швидше за все, залишаться недоторканими до сучасної епохи в печерах. Доісторичні люди асоціюються з печерами, тому що саме там все ще існують дані, не обов'язково тому, що більшість із них прожила в печерах більшу частину свого життя.[14] Проблеми через упередження вибіркиУпередження вибірки є проблемою, оскільки статистичні дані, обчислені для вибірки, можуть бути систематично помилковими. Упередження вибірки може призвести до систематичної завищеної або заниженої оцінки відповідного параметра в сукупності. Упередження вибірки виникає на практиці, оскільки практично неможливо забезпечити ідеальну випадковість вибірки. Якщо ступінь спотворення невеликий, то вибірку можна розглядати як прийнятне наближення до випадкової вибірки. Крім того, якщо зразок суттєво не відрізняється за вимірюваною величиною, упереджений зразок все ще може бути розумною оцінкою. Слово упередженість має сильний негативний відтінок. Дійсно, упередження іноді походять від навмисного наміру ввести в оману або іншого наукового шахрайства. При застосуванні у статистиці упередження просто представляє математичну властивість, незалежно від того, чи є воно навмисним, чи несвідомим, чи через недосконалість інструментів, що використовуються для спостереження. Хоча деякі люди можуть навмисно використовувати упереджену вибірку для отримання оманливих результатів, частіше упереджена вибірка є лише відображенням труднощів у отриманні справді репрезентативної вибірки або незнання упередженості в процесі вимірювання чи аналізу. Прикладом того, як може існувати незнання упередженості, є широке використання співвідношення (воно же кратність зміни[en]) як міри відмінності в біології. Оскільки легше досягти великого відношення з двома малими числами з заданою різницею, а відносно важче досягти великого відношення з двома великими числами з більшою різницею, великі значущі відмінності можна не помітити при порівнянні відносно великих числових вимірювань. Дехто назвав це «демаркаційним упередженням», оскільки використання співвідношення (поділу) замість різниці (віднімання) переносить результати аналізу з науки в псевдонауку (див. проблему демаркації). У деяких зразках використовується упереджений статистичний дизайн, який, тим не менш, дозволяє оцінити параметри. Національний центр статистики охорони здоров'я[en] США, наприклад, навмисно проводить надмірну вибірку меншин у багатьох своїх загальнонаціональних опитуваннях, щоб отримати достатню точність для оцінок у цих групах.[15] Ці дослідження вимагають використання ваг вибірки (див. далі) для отримання належних оцінок для всіх етнічних груп. За умови дотримання певних умов (головним чином те, що вагові коефіцієнти розраховані та використані правильно), ці вибірки дозволяють точно оцінити параметри популяції. Історичні прикладиКласичний приклад упередженої вибірки та результатів, які вводять в оману, стався в 1936 році. У перші дні опитування громадської думки журнал American Literary Digest[en] зібрав понад два мільйони поштових опитувань і передбачив, що кандидат від Республіканської партії на президентських виборах у США Альф Лендон переможе чинного президента Франкліна Рузвельта з великою перевагою. Результат був прямо протилежним. Опитування Literary Digest представляло собою вибірку, зібрану серед читачів журналу, доповнену записами зареєстрованих власників автомобілів і користувачів телефонів. Ця вибірка включала надмірне представництво заможних людей, які, як група з більшою ймовірністю голосували за кандидата від Республіканської партії. Навпаки, опитування лише 50 тисяч громадян, відібраних організацією Джорджа Геллапа, успішно передбачило результат, що призвело до популярності опитування Геллапа. Ще один класичний приклад стався під час президентських виборів 1948 року. У ніч виборів Chicago Tribune надрукувала заголовок «ДЬЮІ ПЕРЕМАГАЄ ТРУМЕНА[en]», який виявився помилковим. Вранці усміхненого обраного президента Гаррі Трумена сфотографували з газетою з таким заголовком. Причина помилки Tribune полягає в тому, що їхній редактор довірився результатам телефонного опитування. Опитування тоді було в зародковому стані, і небагато вчених усвідомлювали, що вибірка користувачів телефонів не є репрезентативною для загальної сукупності. Телефони ще не були широко поширені, і ті, хто їх мав, як правило, були заможними та мали стабільні адреси. (У багатьох містах телефонний довідник Bell System[en] містив ті самі імена, що й Соціальний реєстр[en]). Крім того, опитування Геллапа, на основі якого Tribune ґрунтувала свій заголовок, існувало понад два тижні на момент друку.[17] У даних про якість повітря забруднювачі (такі як оксид вуглецю, оксид азоту, діоксид азоту або озон) часто демонструють високі кореляції, оскільки вони походять від того самого хімічного процесу(ів). Ці кореляції залежать від простору (тобто місця) і часу (тобто періоду). Таким чином, розподіл забруднюючих речовин не обов'язково є репрезентативним для кожного місця та кожного періоду. Якщо недорогий вимірювальний прилад відкалібровано за допомогою польових даних у багатоваріантний спосіб, точніше шляхом спільного розміщення поруч із еталонним приладом, зв'язки між різними сполуками включаються в модель калібрування. Переміщення вимірювального приладу може призвести до отримання помилкових результатів.[18] Більш свіжим прикладом є пандемія COVID-19, коли було показано, що варіації у зміщеннях вибірки при тестуванні на COVID-19 пояснюють значні варіації як у показниках смертності, так і у віковому розподілі випадків у країнах.[19][20] Статистичні поправки для упередженої вибіркиЯкщо цілі сегменти сукупності виключаються з вибірки, тоді немає ніяких коригувань, які можуть дати оцінки, репрезентативні для всієї сукупності. Але якщо деякі групи недостатньо представлені і ступінь недопредставленості можна визначити кількісно, тоді ваги вибірки можуть виправити зміщення. Однак успіх корекції обмежується обраною моделлю вибору. Якщо певні змінні відсутні, методи, які використовуються для виправлення упередження, можуть бути неточними.[21] Наприклад, гіпотетична популяція може включати 10 мільйонів чоловіків і 10 мільйонів жінок. Припустимо, що упереджена вибірка зі 100 пацієнтів включала 20 чоловіків і 80 жінок. Дослідник міг виправити цей дисбаланс, додавши вагу 2,5 для кожного чоловіка та 0,625 для кожної жінки. Це призведе до коригування будь-яких оцінок для досягнення такого ж очікуваного значення, як і вибірка, яка включала рівно 50 чоловіків і 50 жінок, якщо тільки чоловіки та жінки не відрізняються за ймовірністю участі в опитуванні. Див. також
Примітки
|