Екологічна помилка

Екологічна помилка (також помилка екологічного висновування [1] або помилка сукупності) — формальна помилка в інтерпретації статистичних даних, яка виникає, коли висновки про природу індивідів виводяться з висновків про групу, до якої ці індивіди належать. «Екологічна помилка» — це термін, який іноді використовують для опису помилки поділу, яка не є статистичною помилкою. Чотири поширені статистичні екологічні помилки: плутанина між екологічними кореляціями та індивідуальними кореляціями, плутанина між груповим середнім і загальним середнім, парадокс Сімпсона та плутанина між вищим середнім і вищою ймовірністю.

Приклади

Середнє та медіана

Прикладом екологічної помилки є припущення, що середнє значення чисельності населення має просту інтерпретацію при розгляді ймовірностей для окремої людини.

Наприклад, якщо середня оцінка групи більша за нуль, це не означає, що випадкова особа з цієї групи, імовірніше, матиме позитивну оцінку, ніж негативну (поки негативних оцінок більше, ніж позитивних, особа, швидше за все, матиме негативний бал). Подібним чином, якщо визначено, що певна група людей має нижчий середній IQ, ніж генеральна сукупність, було б помилкою робити висновок, що навмання вибраний член групи швидше за все матиме нижчий IQ, ніж середній IQ населення в цілому; також не обов’язково, що випадково обраний член групи швидше за все матиме нижчий IQ, ніж випадково обраний член генеральної сукупності. Математично це випливає з того факту, що розподіл може мати позитивне середнє, але негативну медіану. Ця властивість пов'язана з асиметрією розподілу. 

Розглянемо наступний числовий приклад:

  • Група А: 80% людей отримали 40 балів і 20% з них отримали 95 балів. Середня оцінка – 51 бал.
  • Група B: 50% людей отримали 45 балів і 50% отримали 55 балів. Середня оцінка – 50 балів.
  • Якщо ми навмання виберемо двох людей з А і Б, буде 4 можливі результати:
    • A – 40, B – 45 (B перемагає, ймовірність 40% – 0,8 × 0,5)
    • A – 40, B – 55 (B перемагає, ймовірність 40% – 0,8 × 0,5)
    • А – 95, Б – 45 (перемагає А, ймовірність 10% – 0,2 × 0,5)
    • А – 95, Б – 55 (перемагає А, ймовірність 10% – 0,2 × 0,5)
  • Хоча група A має вищий середній бал, у 80% випадків випадкова особа з A матиме нижчий бал, ніж випадкова особа з B.

Індивідуальні та сукупні кореляції

Дослідження Еміля Дюркгейма свідчать про те, що в переважно протестантських місцевостях рівень самогубств вищий, ніж у переважно католицьких.[2] За словами Фрідмана[3], ідея про те, що відкриття Дюркгейма пов’язують на індивідуальному рівні релігію людини з ризиком самогубства, є прикладом екологічної помилки. Відносини на рівні групи не характеризують автоматично відносини на рівні особистості.

Так само, навіть якщо на індивідуальному рівні багатство позитивно корелює зі схильністю голосувати за республіканців, ми спостерігаємо, що заможніші штати, як правило, голосують за демократів. Наприклад, у 2004 році кандидат від Республіканської партії Джордж Буш переміг у п'ятнадцяти найбідніших штатах, а кандидат від Демократичної партії Джон Керрі переміг у 9 з 11 найбагатших штатів. Проте 62% виборців із річним доходом понад 200 000 доларів проголосували за Буша, але лише 36% виборців із річним доходом 15 000 доларів або менше проголосували за Буша.[4] Кореляція на сукупному рівні відрізнятиметься від кореляції на індивідуальному рівні, якщо на переваги голосування впливає загальне багатство держави навіть після контролю індивідуального багатства. Цілком можливо, що справжнім рушійним чинником переваги при голосуванні є відносне багатство, яке сприймається самим; можливо, ті, хто вважає себе кращим за своїх сусідів, швидше проголосують за республіканців. У цьому випадку людина з більшою ймовірністю проголосує за республіканців, якщо вона стане багатшою, але вона з більшою ймовірністю проголосує за демократа, якщо багатство її сусіда зросте (що призведе до багатшого штату).

Однак спостережувану різницю у виборчих звичках на основі статків на державному та індивідуальному рівнях також можна пояснити загальною плутаниною між вищими середніми показниками та вищими ймовірностями, як обговорювалося вище. Штати можуть бути заможнішими не тому, що в них проживає більше заможних людей (тобто більше людей із річним доходом понад 200 000 доларів США), а радше тому, що в них проживає невелика кількість надбагатих людей; тоді екологічна помилка є наслідком неправильного припущення, що індивіди в заможніших державах мають більше шансів бути заможними.

Багато прикладів екологічних помилок можна знайти в дослідженнях соціальних мереж, які часто поєднують аналіз і наслідки з різних рівнів. Це було проілюстровано в науковій статті про мережі фермерів на Суматрі. [5]

Парадокс Робінсона

У статті 1950 року Вільяма С. Робінсона було підраховано рівень неписьменності та частку населення, народженого за межами США, для кожного штату та округу Колумбія за даними перепису 1930 року.[6] Він показав, що ці дві цифри були пов'язані з негативною кореляцією -0,53; іншими словами, чим більша частка іммігрантів у державі, тим нижчий середній рівень неписьменності. Однак, коли розглядаються окремі особи, кореляція склала +0,12 (іммігранти були в середньому більш неписьменними, ніж корінні громадяни). Робінсон показав, що негативна кореляція на рівні населення штатів пояснюється тим, що іммігранти, як правило, селяться в штатах, де корінне населення було більш грамотним. Він застеріг від висновків щодо окремих людей на основі популяційних чи «екологічних» даних. У 2011 році було виявлено, що розрахунки Робінсона щодо екологічних кореляцій базуються на неправильних даних державного рівня. Згадане вище співвідношення −0,53 насправді дорівнює −0,46.[7] Стаття Робінсона була основоположною, але термін «екологічна помилка» був введений Селвіном лише в 1958 році. [8]

Формальна проблема

Кореляція сукупних величин (або екологічна кореляція[en]) не дорівнює кореляції окремих величин. Позначимо X iY i дві величини на індивідуальному рівні. Формула для коваріації сукупних величин у групах розміру N є

Коваріація двох сукупних змінних залежить не тільки від коваріації двох змінних в межах одних індивідів, але й від коваріацій змінних між різними індивідами. Іншими словами, кореляція сукупних змінних враховує перехресні ефекти, які не мають значення на індивідуальному рівні.

Проблема кореляції, природно, тягне за собою проблему регресії сукупних змінних: отже, помилка кореляції є важливою проблемою для дослідника, який хоче виміряти причинно-наслідкові наслідки. Починаючи з регресійної моделі, де результат зазнає впливу

Регресійна модель на сукупному рівні отримується шляхом підсумовування окремих рівнянь:

Ніщо не заважає корелювати регресори та помилки на сукупному рівні. Тому, як правило, виконання регресії на сукупних даних не оцінює ту саму модель, ніж виконання регресії на окремих даних.

Агрегована модель правильна тоді і тільки тоді

для всіх i. Це означає, що контроль за , не визначає .

Вибір між сукупним та індивідуальним висновком

Немає нічого поганого в тому, щоб виконувати регресії на зведених даних, якщо вас цікавить зведена модель. Наприклад, для губернатора штату правильно проводити регресію між поліцейськими силами щодо рівня злочинності на рівні штату, якщо хтось зацікавлений у політичних наслідках збільшення поліції. Однак екологічна помилка станеться, якщо міська рада виведе вплив збільшення поліції на рівень злочинності на рівні міста з кореляції на рівні штату.

Вибір виконання сукупної або індивідуальної регресії для розуміння сукупного впливу на певну політику залежить від наступного компромісу: сукупні регресії втрачають дані індивідуального рівня, але індивідуальні регресії додають сильні припущення моделювання. Деякі дослідники припускають, що екологічна кореляція дає краще уявлення про результат дій державної політики, тому вони рекомендують для цієї мети екологічну кореляцію замість кореляції індивідуального рівня (Lubinski & Humphreys, 1996). Інші дослідники не погоджуються, особливо коли зв’язки між рівнями не чітко змодельовані. Щоб запобігти екологічній помилці, дослідники, які не мають індивідуальних даних, можуть спочатку змоделювати те, що відбувається на індивідуальному рівні, потім змоделювати, як пов’язані індивідуальний і груповий рівні, і, нарешті, перевірити, чи щось, що відбувається на рівні групи, додає до розуміння взаємозв’язку. Наприклад, при оцінці впливу державної політики корисно знати, що вплив політики відрізняється між державами менше, ніж сама політика, що свідчить про те, що відмінності в політиці не втілюються в результати, незважаючи на високі екологічні кореляції (Rose, 1973). ).

Групові та загальні середні

Екологічна помилка також може стосуватися такої помилки: середнє значення для групи приблизно дорівнює середньому значенню загальної популяції, поділеному на розмір групи. Припустімо, відома кількість протестантів і рівень самогубств у США, але немає даних, які б пов’язували релігію та самогубства на індивідуальному рівні. Якщо когось цікавить рівень самогубств серед протестантів, то буде помилкою оцінювати його загальним рівнем самогубств, поділеним на кількість протестантів. Формально познач середнє значення групи, ми загалом маємо:

Проте закон повної ймовірності дає

Як ми це знаємо знаходиться між 0 і 1, це рівняння дає межу для .

Парадокс Сімпсона

Докладніше: Парадокс Сімпсона

Вражаючою екологічною помилкою є парадокс Сімпсона : той факт, що при порівнянні двох популяцій, розділених на групи, середнє значення деякої змінної в першій популяції може бути вищим у кожній групі і водночас нижчим у загальній популяції. Формально, коли кожне значення Z належить до іншої групи, а X належить до певного лікування, може статися так

Коли не залежить від , парадокс Сімпсона — це саме упередження пропущеної змінної[en] для регресії Y на X, де регресор є фіктивною змінною[en] та пропущеною змінною є категоріальною змінною, що визначає групи для кожного значення, яке вона приймає. Застосування вражає тим, що зсув досить високий, щоб параметри мали протилежні знаки.

Юридичні застосування

Екологічна помилка обговорювалася під час судового оскарження виборів губернатора Вашингтона у 2004 році[en], під час яких було виявлено кілька нелегальних виборців після виборів; їхні голоси були невідомі, оскільки голосування було таємним. Претенденти стверджували, що незаконні голоси, подані на виборах, відповідали б моделям голосування на дільницях, на яких вони були подані, і, отже, слід внести відповідні корективи.[9] Свідок-експерт сказав, що цей підхід схожий на спробу визначити середній показник відбивань Ічіро Сузукі, дивлячись на середній показник відбивань усієї команди Seattle Mariners, оскільки незаконні голоси були віддані нерепрезентативною вибіркою виборців кожного округу, і це може бути як відрізнявся від середнього виборця на дільниці, як Ічіро відрізнявся від решти своєї команди.[10] Суддя визнав, що аргумент претендентів є екологічною помилкою, і відхилив його.[11]

Див. також

 

Примітка

  1. Charles Ess; Fay Sudweeks (2001). Culture, technology, communication: towards an intercultural global village. SUNY Press. с. 90. ISBN 978-0-7914-5015-4. The problem lies with the 'ecological fallacy' (or fallacy of division)—the impulse to apply group or societal level characteristics to individuals within that group.
  2. Durkheim, (1951/1897). Suicide: A study in sociology. Translated by John A. Spaulding and George Simpson. New York: The Free Press. ISBN 0-684-83632-7.
  3. Freedman, D. A. (1999). Ecological Inference and the Ecological Fallacy. International Encyclopedia of the Social & Behavioral Sciences, Technical Report No. 549. https://web.stanford.edu/class/ed260/freedman549.pdf
  4. Gelman, Andrew; Park, David; Shor, Boris; Bafumi, Joseph; Cortina, Jeronimo (2008). Red State, Blue State, Rich State, Poor State. Princeton University Press. ISBN 978-0-691-13927-2.
  5. Matous, Petr (2015). Social networks and environmental management at multiple levels: soil conservation in Sumatra. Ecology and Society. 20 (3): 37. doi:10.5751/ES-07816-200337.
  6. Robinson, W.S. (1950). Ecological Correlations and the Behavior of Individuals. American Sociological Review[en]. 15 (3): 351—357. doi:10.2307/2087176. JSTOR 2087176.
  7. The research note on this curious data glitch is published in Te Grotenhuis, Manfred; Eisinga, Rob; Subramanian, S.V. (2011). Robinson's Ecological Correlations and the Behavior of Individuals: methodological corrections. Int J Epidemiol. 40 (4): 1123—1125. doi:10.1093/ije/dyr081. PMID 21596762. The data Robinson used and the corrections are available at http://www.ru.nl/mt/rob/downloads/[недоступне посилання]
  8. Selvin, Hanan C. (1958). Durkheim's Suicide and Problems of Empirical Research. American Journal of Sociology[en]. 63 (6): 607—619. doi:10.1086/222356.
  9. George Howland Jr. (18 травня 2005). The Monkey Wrench Trial: Dino Rossi's challenge of the 2004 election is on shaky legal ground. But if he prevails, watch litigation become an option in close races everywhere. Seattle Weekly. Архів оригіналу за 1 грудня 2008. Процитовано 17 грудня 2008.
  10. Christopher Adolph (May 12, 2005). "Report on the 2004 Washington Gubernatorial Election". Expert witness report to the Chelan County Superior Court in Borders et al v. King County et al.
  11. Borders et al. v. King County et al. [Архівовано 2008-10-18 у Wayback Machine.], transcript of the decision by Chelan County Superior Court Judge John Bridges, June 6, 2005, published: June 8, 2005

Подальше читання

 

Read other articles:

Флаг гордости бисексуалов Бисексуальность      Сексуальные ориентации Бисексуальность Пансексуальность Полисексуальность Моносексуальность Сексуальные идентичности Би-любопытство Гетерогибкость и гомогибкость Сексуальная текучесть Исследования Шка…

County in Illinois, United States County in IllinoisGreene CountyCountyGreene County CourthouseLocation within the U.S. state of IllinoisIllinois's location within the U.S.Coordinates: 39°21′N 90°23′W / 39.35°N 90.39°W / 39.35; -90.39Country United StatesState IllinoisFounded1821Named forNathanael GreeneSeatCarrolltonLargest cityCarrolltonArea • Total546 sq mi (1,410 km2) • Land543 sq mi (1,410 km2)&#…

هنودمعلومات عامةنسبة التسمية الهند التعداد الكليالتعداد قرابة 1.21 مليار[1][2]تعداد الهند عام 2011ق. 1.32 مليار[3]تقديرات عام 2017ق. 30.8 مليون[4]مناطق الوجود المميزةبلد الأصل الهند البلد الهند  الهند نيبال 4,000,000[5] الولايات المتحدة 3,982,398[6] الإمارا…

Questa voce sull'argomento nuotatori olandesi è solo un abbozzo. Contribuisci a migliorarla secondo le convenzioni di Wikipedia. Segui i suggerimenti del progetto di riferimento. Stan Pijnenburg Nazionalità  Paesi Bassi Nuoto Specialità Stile libero Squadra NY Breakers Palmarès Competizione Ori Argenti Bronzi Mondiali 0 1 0 Mondiali in vasca corta 0 1 3 Europei 0 2 0 Europei in vasca corta 2 0 2 Vedi maggiori dettagli Statistiche aggiornate al 18 febbraio 2024 Modifica dati su …

此條目可能包含不适用或被曲解的引用资料,部分内容的准确性无法被证實。 (2023年1月5日)请协助校核其中的错误以改善这篇条目。详情请参见条目的讨论页。 各国相关 主題列表 索引 国内生产总值 石油储量 国防预算 武装部队(军事) 官方语言 人口統計 人口密度 生育率 出生率 死亡率 自杀率 谋杀率 失业率 储蓄率 识字率 出口额 进口额 煤产量 发电量 监禁率 死刑 国债 外…

تشين بينغ معلومات شخصية الميلاد 22 أكتوبر 1924   فيرق  الوفاة 16 سبتمبر 2013 (88 سنة)   بانكوك  مواطنة ماليزيا  عضو في جيش الشعب الماليزي المناهض لليابان  [لغات أخرى]‏،  وجيش التحرير الوطني المالايوي  الحياة العملية المهنة سياسي،  وبارتيزان  الحزب الحزب …

Association football club in Denmark Football clubAB TårnbyFull nameAmager Boldklub TårnbyFounded1 January 2009; 15 years ago (2009-01-01)GroundTårnby StadiumCapacity10,000 (350 seated)ChairmanAlessandro MusumeciHead coachOle PedersenLeagueDenmark Series2022–233rd Division, 11th of 12 (relegated)WebsiteClub website Home colours Away colours Tårnby Boldklub members' building before the merger in May 2007 located at Tårnby Stadium.[1] Amager Boldklub Tårnby (Danis…

For other uses, see Burj. Town in South Governorate, LebanonBurj El Shimali البرج الشماليTownThe Burj – Tower – of Burj El ShimaliBurj El ShimaliCoordinates: 33°15′47″N 35°14′20″E / 33.26306°N 35.23889°E / 33.26306; 35.23889Country LebanonGovernorateSouth GovernorateDistrictTyre DistrictMunicipalityTyreArea • Town1,069 ha (2,642 acres) • Urban6.8 km2 (2.6 sq mi)Elevation62 m (203 f…

Former railway station in Gloucestershire, England Grange CourtGrange Court station as it appears today but the platforms have been removed.General informationLocationNorthwood Green, Forest of DeanEnglandGrid referenceSO726161Platforms4Other informationStatusDisusedHistoryOriginal companyGloucester and Dean Forest RailwayPre-groupingGreat Western RailwayPost-groupingGreat Western RailwayKey dates1 June 1855Station opens2 November 1964Station closes vteGloucester–Newport line Legend Cross Coun…

Uva

Disambiguazione – Se stai cercando altri significati, vedi Uva (disambigua). Disambiguazione – Acino rimanda qui. Se stai cercando altri significati, vedi Acino (disambigua). Uva L'uva è il frutto della vite (Vitis vinifera) e di altre specie o ibridi del genere Vitis. Indice 1 Botanica 2 Utilizzo 3 Proprietà di uva e derivati 4 Produzione 5 Note 6 Voci correlate 7 Altri progetti 8 Collegamenti esterni Botanica Schema della struttura di un grappolo d'uva Il grappolo d'uva è un'inf…

Tina TalisaLahir24 Desember 1979 (umur 44)Bandung, Jawa Barat, IndonesiaAlmamaterUniversitas PadjadjaranPekerjaanPembawa acaraTahun aktif2007-sekarangPartai politikPartai NasDemSuami/istriAmrinur OktajayaAnak3KerabatTrisa Triandesa (adik) Tina Talisa, S.K.G., M.I.Kom.[1] (lahir 24 Desember 1979) adalah seorang pembawa acara berkebangsaan Indonesia. Saat ini ia bekerja sebagai Juru Bicara Badan Koordinasi Penanaman Modal (BKPM). Karier Ia juga merupakan mantan finalis Puteri Ind…

Forze missilistiche dell'Esercito Popolare di Liberazione中国人民解放军 火箭trad. Zhōngguó Rénmín Jiěfàngjūn Huǒjiàn Jūn Descrizione generaleAttivo1966–2015 (Secondo corpo d'artiglieria) 2016–presente (Forze missilistiche) Nazione Cina ServizioForza armata TipoForza Missilistica Strategica RuoloDifesa strategica nucleare Dimensione~100.000 uomini Guarnigione/QGQinghe, Distretto di Haidian, Pechino, Cina EquipaggiamentoMissile balistico, Missile da crociera MarciaMarci…

Questa voce sull'argomento calciatrici è solo un abbozzo. Contribuisci a migliorarla secondo le convenzioni di Wikipedia. Segui i suggerimenti del progetto di riferimento. Annaïg ButelNazionalità Francia Altezza167 cm Calcio RuoloDifensore Squadra Washington Spirit CarrieraGiovanili 2000-2004 Château Landon2004-2007 Bagneaux Nemours Squadre di club1 2007-2017 FCF Juvisy165 (6)2017-2023 Paris FC107 (4)2023- Washington Spirit3 (0) Nazionale 2007-2009 Francia U-172…

第三十二届夏季奥林匹克运动会帆船女子風浪板比賽比賽場館神奈川縣藤澤市江之島遊艇港口日期2021年7月25日至31日参赛选手27位選手,來自27個國家和地區奖牌获得者01 ! 卢云秀  中国02 ! 沙利纳·皮康  法国03 ! 埃玛·威尔逊  英国← 20162024 → 2020年夏季奥林匹克运动会帆船比赛项目RS:X级帆板男子女子单人艇雷射型男子单人艇辐射型女子芬蘭型…

Chikuma 千曲市Kota BenderaLambangLocation of Chikuma in Nagano PrefectureNegara JepangWilayahChūbuPrefekturNaganoPemerintahan • WalikotaAkio OkadaLuas • Total119,79 km2 (4,625 sq mi)Populasi (Oktober 1, 2019) • Total59.197 • Kepadatan494/km2 (1,280/sq mi)Zona waktuUTC+9 (Japan Standard Time)Simbol kota • PohonPrunus armeniaca• BungaEranthis pinnatifidaNomor telepon026-273-1111Alamat84 Kuiseke, Chikuma…

This article needs additional citations for verification. Please help improve this article by adding citations to reliable sources. Unsourced material may be challenged and removed.Find sources: Archaeology album – news · newspapers · books · scholar · JSTOR (September 2012) (Learn how and when to remove this message) 1996 studio album by The RutlesArchaeologyStudio album by The RutlesReleased29 October 1996Recorded1978, 1996GenreComedyLength…

South Korean voice actor (born 1983) In this Korean name, the family name is Nam. Nam Doh-hyeong남도형南度亨Born (1983-04-24) 24 April 1983 (age 41)[1]Gangneung, South KoreaEducationKorea UniversityEnglish language and literatureOccupationVoice actorYears active2006–presentKorean nameHangul남도형Hanja南度亨Revised RomanizationNam Do-hyeongMcCune–ReischauerNam Tohyŏng WebsiteOfficial Twitter Nam Doh-hyeong (Hangul: 남도형; Hanja: 南度亨; born 24 April 1983…

Israeli judge Moshe LandauSupreme Court of Israel judgeIn office1953–1982President of the Supreme Court of IsraelIn office1980–1982Preceded byYoel ZussmanSucceeded byYitzhak Kahan Personal detailsBorn(1912-04-29)29 April 1912Danzig, Kingdom of Prussia, Germany (present-day Gdańsk, Poland)Died1 May 2011(2011-05-01) (aged 99)Jerusalem, Israel Moshe Landau (Hebrew: משה לנדוי) (29 April 1912 – 1 May 2011)[1] was an Israeli judge. He served on the Supreme Court of Israel f…

Население Бельгии Численность 11,556,297 чел Рождаемость 10,3 ‰ Смертность 9,8 ‰ Возрастная структура до 14 лет 16,1 % 15–64 года 66,3 % старше 65 лет 17,6 % Половая структура при рождении 1,04 муж./жен. до 15 лет 1,04 муж./жен. в возрасте 15–64 года 1,02 муж./жен. после 65 лет 0,72 …

Cet article est une ébauche concernant la Chine. Vous pouvez partager vos connaissances en l’améliorant (comment ?) selon les recommandations des projets correspondants. Guizhou贵州省 Carte indiquant la localisation du Guizhou (en rouge) à l'intérieur de la Chine. Administration Pays Chine Autres noms Chinois : 贵州省Pinyin : Guìzhōu shěng Abréviation 黔 (qián), 贵 (guì) Statut politique Province Capitale Guiyang Secrétaire du parti Xu Lin (en) Gouverneur…