Зовнішня валідністьЗовнішня валідність (англ. External validity) — валідність генералізованих (казуальних) висновків у наукових дослідженнях, як правило заснованих на експериментах як експериментальній валідності.[1] Іншими словами, це ступінь, в якій результати дослідження можуть бути поширені на інші ситуації і інших людей.[2] Математичний аналіз зовнішньої валідності стосується визначення того, чи є поширення на різнорідні групи населення можливим, і розробки статистичних та обчислювальних методів, які створюють валідні генералізації.[3] Загрози зовнішній валідності«Загроза зовнішній валідності - це є пояснення того, як ви можете помилятися при узагальненні».[4] Як правило, узагальнення обмежене, коли причина (тобто незалежна змінна) залежить від інших факторів; тому всі загрози зовнішній валідності взаємодіють з незалежною змінною — так звана фонова взаємодія з фактором х.[5]
Кук і Кемпбелл[6] наголошують на принциповій відмінності між узагальненням для певної популяції та узагальненням на різні субпопуляції, визначені різними рівнями фонового фактору. Лінч стверджував, що практично ніколи не можливо узагальнити для значущих популяцій, крім як зріз історії, але можливо, перевірити, якою мірою ефект якоїсь причини на деяких залежних змінних узагальнюється на різні субпопуляції, які розрізняються за деяким фоновим фактором. Однак потрібно перевірити, чи досліджуваний ефект модерується взаємодією з одним або більше фонових факторів.[5] Зменшення загроз зовнішній валідностіУ той час як перерахування загроз валідності може допомогти дослідникам уникати необґрунтованих узагальнень, багато з цих загроз можуть бути нівельовані або нейтралізовані на систематичній основі, з тим щоб забезпечити валідне узагальнення. Зокрема, експериментальні дані з однієї популяції можуть бути «перероблені», або «калібровані», з тим щоб обійти відмінності популяції і робити достовірні узагальнення для другої популяції, де експерименти не можуть бути виконані. Перл і Барейнбойм[3] поділили проблеми узагальнень на дві категорії: (1) ті, які піддаються валідсній рекалібрації, і (2) ті, де зовнішня валідність теоретично неможлива. Використовуючи розрахунки на основі графів,[7] вони визначили необхідну і достатню умову для приватних випадків проблем, що забезпечує валідне узагальнення, і розробили алгоритми, які автоматично виробляють необхідну рекалібрацію, якщо така існує.[8] Це зменшує проблему зовнішньої валідності до вправи в теорії графів, і дозволило деяким філософам зробити висновок, що проблема тепер вирішена.[9] Важливий варіант проблеми зовнішньої валідності пов'язаний з селективним упередженням, також відомим як упередження вибірки — тобто створюється упередження, коли дослідження проводяться на нерепрезентативній вибірці певної популяції. Наприклад, якщо клінічне випробування проводиться на студентах коледжу, досліднику слід було б знати, ям результат може бути узагальнений на все населення, де такі атрибути, як вік, освіта і дохід істотно відрізняються від типового студента. Заснований на графах метод Перла і Барейнбойма визначає умови, при яких упередження вибірки можна обійти і, коли ці умови будуть виконані, метод створює неупереджену оцінку усередненого казуального ефекту в цілій популяції. Основна відмінність між узагальненням досліджень з неправильними вибірками і узагальненням на відмінні популяції полягає в тому, що відмінності між популяціями, як правило, викликані попередньо існуючими факторами, такими як вік або національність, а селективне упередження часто викликане умовами, які виникли в процесі або дослідження, наприклад неврахування тих, хто «вийшов» з дослідження або відбір учасників з лише певними ознаками. Коли вибір управляється такими умовами, потрібно використовувати нетрадиційні методи рекалібрації для забезпечення неупередженої оцінки, і ці методи можна отримати з графу проблеми.[10][11] Зовнішня, внутрішня та екологічна валідністьУ багатьох дослідженнях і науково-дослідних проектах може відбуватись «обмін» між внутрішньою і зовнішньою валідністю: коли вживаються заходи або процедури, направлені на підвищення шансів більш високого рівня внутрішньої валідності, ці заходи можуть одночасно обмежити генералізацію висновків. Ця ситуація змусила багатьох дослідників прагнути «екологічно валідних» експериментів, тобто експериментальні процедури повинні нагадувати умови «реального світу». Вони критикують відсутність екологічної валідності багатьох лабораторних досліджень з акцентом на штучно обмежені та звужені середовища. Деякі дослідники вважають, що зовнішня валідність та екологічна валідність тісно пов'язані в тому сенсі, що казуальні висновки на основі екологічно валідних дослідних проектів нерідко допускають більш високий рівень узагальнення, ніж ті, що отримані в штучно створених лабораторних умовах. Однак, це знову-таки стосується відмінностей між генералізацією на деяку популяцію (тісно пов'язане з занепокоєннями про екологічну валідність) і узагальненням на різні субпопуляції, які розрізняються за деяким фоновим фактором. Деякі висновки, зроблені в екологічно валідних дослідженнях навряд чи можуть бути узагальненими, а деякі знахідки, зроблені в високо контрольованих параметрах можуть претендувати майже універсальну зовнішню валідність. Тобто, зовнішня і екологічна валідність є незалежними — дослідження може мати зовнішню валідність, але не екологічну, і навпаки. Якісні дослідженняВ рамках парадигми якісних досліджень, зовнішня валідність замінюється поняттям трансферабельності, тобто здатності результатів досліджень застосовуватись до ситуацій зі схожими параметрами, популяціями та характеристиками.[12] Зовнішня валідність в експериментахДослідники часто стверджують, що експерименти по своїй природі мають низьку зовнішню валідність. Деякі стверджують, що при наслідуванні експериментального методу можуть виникати багато недоліків. В силу необхідності достатнього контролю над ситуацією з тим, щоб випадковим чином розподілити людей за умовами і виключити вплив зовнішніх факторів, ситуація в експерименті може стати дещо штучною і далекою від реального життя. Існує два види здатності до генералізації:
Тим не менш, обидва ці види відносяться до поняття концепції узагальнення Кука і Кембелла для деяких цільових груп населення, а не, мабуть, більш головного завдання оцінки здатності до генералізації результатів експерименту на субпопуляції, які відрізняються від конкретної дослідженої ситуації, і людей, які відрізняються від досліджених респондентів деяким суттєвим чином.[6] Критики експериментів припускають, що зовнішня валідність може бути покращена за рахунок використання «польових» умов (або, як мінімум, реалістичних лабораторних умов) і з допомогою справжніх ймовірнісних зразків респондентів. Проте, якщо мета — зрозуміти можливість узагальнення на різні субпопуляції, які розрізняються ситуаційними або особистісними фоновими факторами, такі засоби не мають тої ваги у підвищенні ефективності зовнішньої валідності, що зазвичай їм приписують. Якщо існує фоновий фактор Х, про яких дослідник не знає (що дуже ймовірно), такі дослідницькі практики можуть маскувати істотну нестачу зовнішньої валідності. У праці Діпбоя і Фланагана (1979) про промислову та організаційну психологію зазначається, що результати одного «польового» дослідження і одного лабораторного дослідження в рівній мірі малоймовірно можуть бути поширені на інше «польове» дослідження.[13] Таким чином, «польове» дослідження не мають за своєю природою високу зовнішню валідність, а лабораторні дослідження — низьку; в обох випадках вона залежить від того, чи зміниться досліджуваний ефект зі зміною фонових факторів, які у цьому дослідженні визначені константами.[5] Генералізація на різні ситуаціїНаукові експерименти в психології, які проводяться в університетах, часто критикують за те, що їх проводили в штучних ситуаціях і що вони не можуть бути узагальнені на реальне життя.[14] Щоб вирішити цю проблему, соціальні психологи намагаються збільшити здатність до узагальнення їх результатів, зробивши свої дослідження якомога більш реалістичними. Однак реалізм як такий не допомагає стверджувати, чи зміняться результати, якщо умови будуть ще більш реалістичними, або якщо учасники дослідження будуть поміщені в інші реалістичні налаштування. Якщо перевіряється лише один набір умов (ситуація), не можливо стверджувати, що є генералізація на різні ситуації.[5][15] Однак багато авторів плутають зовнішню валідність і реалізм. Експеримент може бути реалістичним більш ніж одним способом:
Ступінь, в якій експеримент схожий на реальні життєві ситуації, називається приземленим реалізмом експерименту.[14] Більш важливо переконатися, що дослідження має високий психологічний реалізм — наскільки подібні психологічні процеси, що запускаються під час експерименту, психологічним процесам, які відбуваються в повсякденному житті.[16] Психологічний реалізм зростає, якщо люди є поглинені справжньою подією. Щоб досягти цього, дослідники іноді розповість учасникам передісторію —удаваний опис мети дослідження. Однак, якби учасникам розповіли про цілі експерименту, то він мав би низький психологічний реалізм, адже у повсякденному житті ніхто не знає, яка і коли станеться надзвичайна ситуація і люди не мають часу планувати реакцію на неї.[2] Люди не завжди знають, чому вони роблять те, що вони роблять, або що вони роблять, поки це не відбудеться. Тому, опис експериментальної ситуації учасникам, а потім прохання їх відповісти нормально будуть давати відповіді, які можуть не відповідати поведінці людей, які справді опинились в такій же ситуації. Не можливо покладатися на припущення людей про те, що вони будуть робити в гіпотетичній ситуації; дізнатися, що люди дійсно будуть робити, можна лише створивши ситуацію, яка викликає ті ж психологічні процеси, які відбуваються в реальному світі. Генералізація на різних людейСоціальні психологи вивчають те, як люди в цілому піддаються соціальному впливу. Кілька експериментів зафіксували цікавий, несподіваний приклад соціального впливу, коли сама лише присутність інших людей знижує ймовірність того, що людина допоможе іншій людині. Єдиний спосіб бути впевненим, що результати експерименту представляють поведінку певної популяції, є гарантувати, що учасники обрані випадковим чином з цієї популяції. Однак вибірка в експериментах не може бути такою є випадковою, які при опитуваннях, оскільки випадкова вибірка є непрактичною і дорогою у соціально-психологічних експериментах. Але навіть якщо якимось чином була отримана по-справжньому випадкова вибірка, в ній може бути неспостережувана гетерогенність результатів… Наприклад, лікування може мати позитивний вплив на певні підгрупи, але негативний вплив на інші, і ефекти узагальнених результатів лікування не можна буде генералізувати на всі підгрупи.[5][17] Багато дослідників вирішують цю проблему шляхом вивчення основних психологічних процесів, які роблять людей схильними до соціального впливу, припускаючи, що ці процеси настільки фундаментальні, що є універсальними. Однак деякі соціально-психологічні процеси відрізняються в різних культурах і в таких випадках потрібно досліджувати різноманітні вибірки людей.[18] ВідтворюваністьОстаточним тестом зовнішньої валідності експерименту є його відтворюваність — повторне проведення дослідження, як правило, з іншими групами учасників та в інших умовах. Дослідники часто використовують різні методи, щоб побачити чи вони все ще отримують той самий результат. Коли проведено багато досліджень однієї проблеми, результати можуть варіюватися. Наприклад, деякі дослідження виявили вплив кількості перехожих/спостерігачів при нещасному випадку (аварії тощо) на поведінку з допомоги, а інші — ні. Для з'ясування істини існує статистичний метод метааналізу, що усереднює результати двох або більше досліджень, щоб побачити, чи є ефект незалежної змінної надійним. Мета Однак можуть бути надійними явища, не обмежені лабораторією. Наприклад, ефект впливу збільшення кількості перехожих/спостерігачів на блокування поведінки з допомоги спостерігався з багатьма видами людей, включаючи дітей, студентів, та майбутніх міністрів[18]; в Ізраїлі[19]; у малих містах і великих містах США[20]; в різних умовах, таких як психологічні лабораторії, міські вулиці, метро[21]; і при різних видах надзвичайних ситуацій, таких як епілептичні припадки, потенційні пожежі, бійки і нещасні випадки[22], а також менш серйозних подій, наприклад, спустило колесо.[23] Багато з цих відтворень були проведені в реальних життєвих умовах, коли люди людина не могли знати, що проводиться проводиться. Основна дилема соціального психологаПри проведенні експериментів в психології, деякі вважають, що завжди є обмін між внутрішньою і зовнішньою валідністю — # мати достатній контроль над ситуацією, щоб гарантувати, що ніякі сторонні змінні, що впливають на результат, і випадковим чином розподілити людей за умовами експериментів, і
Деякі дослідники вважають, що хороший спосіб підвищити зовнішню валідність є проведення польових експериментів. У польовому експерименті, поведінка людей вивчається поза лабораторією, у її природній обстановці. Польовий експеримент — це ідентичний по дизайну лабораторному експерименту, за винятком того, що відбувається в реальному житті. Учасники польового експерименту не знають, що події, які вони переживають, є насправді експериментом. Деякі стверджують, що зовнішня валідність таких експериментів є високою, тому що вони відбуваються в реальному світі, з реальними людьми, які більш різноманітні, ніж типова вибірка зі студентів. Однак, оскільки в реальному світі параметри значно відрізняються, результати одного експерименту в реальному світі можуть і не узагальнюватись на іншу ситуацію реального світу.[13] Ні внутрішня, ні зовнішня валідність не визначається в одному експерименті. Соціальні психологи частіше обирають забезпечення внутрішньої валідності, проводячи лабораторні експерименти, в яких люди випадково розподіляються по різних умовах і всі сторонні змінні контролюються. Інші соціальні психологи віддають перевагу контролю зовнішньої валідності, проводячи більшу частину своїх досліджень у польових експериментах. Багато однак контролюють обидві валідності. Взяті разом, обидва типи досліджень відповідають вимогам ідеального експерименту. За допомогою відтворюваності дослідники можуть вивчати питання з максимальною внутрішньою і зовнішньою валідністю.[24] Див. такожПримітки
|