Допасованість (статистика)

Допасо́ваність[1] (англ. goodness of fit) статистичної моделі описує, наскільки добре її допасовано до набору спостережень. Міри допасованості зазвичай роблять підсумок незгідності між спостережуваними значеннями та значеннями, очікуваними за моделі, що розглядають. Такі міри можливо використовувати в перевірці статистичних гіпотез, наприклад, для перевірки нормальності залишків, для перевірки того, чи дві вибірки вибрано з ідентичних розподілів (див. критерій Колмогорова — Смирнова), чи для перевірки того, чи слідують виходові частоти певному розподілові (див. критерій хі-квадрат Пірсона). В дисперсійному аналізі однією зі складових, на яку розбивають дисперсію, може бути сума квадратів браку допасованості[en].

Допасованість розподілів

При оцінюванні того, чи підходить даний розподіл до набору даних, можливо використовувати наступні критерії та міри допасованості, що лежать в їх основі:

Регресійний аналіз

В регресійному аналізі до допасованості мають стосунок такі предмети:

Категорійні дані

Далі наведено приклади, що виникають у контексті категорійних даних.

Критерій хі-квадрат Пірсона

Критерій хі-квадрат Пірсона використовує міру допасованості, яка є сумою різниць між спостережуваними та очікуваними виходовими частотами (тобто, кількостями спостережень), кожну з яких піднесено до квадрату, й поділено на очікувану:

де

Oi = спостережувана кількість для засіку (англ. bin) i
Ei = очікувана кількість для засіку i, підтримувана нульовою гіпотезою.

Очікувану частоту обчислюють як

де

F = кумулятивна функція розподілу ймовірності для розподілу ймовірності, що перевіряють.
Yu = верхня (англ. upper) межа класу i,
Yl = нижня (англ. lower) межа класу i,
N = розмір вибірки

Отримуване в результаті значення можливо порівнювати з розподілом хі-квадрат для визначення допасованості. Розподіл хі-квадрат має (kc) ступенів вільності, де k є числом не порожніх комірок, а c є числом оцінюваних параметрів розподілу (включно з параметрами положення, масштабу та форми) плюс один. Наприклад, для 3-параметрового розподілу Вейбула, c = 4.

Приклад: однакові частоти чоловіків та жінок

Наприклад, щоби перевірити гіпотезу, що випадкову вибірку зі 100 людей вибрано із сукупності, в якій чоловіки та жінки є рівними за частотою, спостережуване число чоловіків та жінок порівнюватиметься з теоретичними частотами 50 чоловіків та 50 жінок. Якщо в вибірці було 44 чоловіки та 56 жінок, то

Якщо нульова гіпотеза є істинною (тобто, чоловіків та жінок вибирають з рівною частотою у вибірці), то перевірну статистику вибиратимуть з розподілу хі-квадрат з одним ступенем вільності. І хоча можна було би очікувати двох ступенів вільності (по одному для чоловіків та жінок), ми мусимо враховувати те, що загальне число чоловіків та жінок є обмеженим (100), і відтак є лише один ступінь вільності (2 − 1). Або ж, якщо кількість чоловіків є відомою, то кількість жінок є визначеною, і навпаки.

Результат звернення до розподілу хі-квадрат для 1 ступеню вільності показує, що ймовірність спостереження цієї відмінності (або екстремальнішої за цю), якщо чоловіки та жінки є однаково численними в генеральній сукупності, становить приблизно 0.23. Ця ймовірність є вищою за загальноприйнятий критерій статистичної значущості (.001-.05), тож звичайно ми не відкидатимемо нульову гіпотезу про те, що число чоловіків у сукупності є таким же, як і число жінок (тобто, ми розглядатимемо нашу вибірку як таку, що знаходиться в межах того, що ми би очікували для співвідношення чоловіків/жінок 50/50).

Зверніть увагу на припущення, що механізм, який породив цю вибірку, є випадковим, в сенсі незалежного випадкового вибирання з однаковою ймовірністю, тут 0.5 як для чоловіків, так і для жінок. Якщо ж, наприклад, кожен з обраних 44 чоловіків приведе приятеля-чоловіка, й кожна з обраних 56 жінок приведе приятельку-жінку, то кожне збільшиться в 4 рази, тоді як кожне збільшиться в 2 рази. Значення цієї статистики подвоїться до 2.88. Знаючи цей внутрішній механізм, ми, звісно, повинні були би рахувати пари. В загальному випадку, якщо механізм не є обґрунтовано випадковим, він буде невідомим. Розподіл, до якого повинно бути віднесено перевірну статистику, може, відповідно, дуже відрізнятися від розподілу хі-квадрат.[5]

Біноміальний випадок

Біноміальний експеримент є послідовністю незалежних проб, у якій проби можуть призводити в результаті до двох виходів, успіху чи відмови. Є n проб, кожна з імовірністю успіху, позначуваною через p. Якщо npi ≫ 1 для кожного i (де i = 1, 2, ..., k), то

Це приблизно має розподіл хі-квадрат з k − 1 ступенями вільності. Той факт, що ступенів вільності є k − 1, є наслідком обмеження . Ми знаємо, що є k спостережуваних лічильників клітин, проте щойно стають відомими будь-які k − 1, то один, що лишився, визначається однозначно. В принципі, можна сказати, що є лише k − 1 лічильників клітин, що визначаються вільно, звідси k − 1 ступенів вільності.

G-критерій

G-критерії[en] є перевірками статистичної значущості відношенням правдоподібностей, які все ширше застосовують у ситуаціях, в яких раніше радили критерії хі-квадрат Пірсона.[6]

Загальною формулою G є

де та є тим же, що й для критерію хі-квадрат, позначує натуральний логарифм, а суму беруть над усіма не порожніми комірками. Крім того, загальна спостережена кількість повинна дорівнювати загальній очікуваній кількості:де є загальним числом спостережень.

G-критерії почали радити щонайменше починаючи з випуску популярного статистичного підручника Роберта Р. Сокала[en] та Ф. Джеймса Рольфа[en] 1981 року.[7]

Див. також

Примітки

  1. goodness of fit // Англійсько-українсько-англійський словник наукової мови (фізика та споріднені науки). Частина ІІ українсько-англійська / уклад. О. Кочерга, Є. Мейнарович. — 2010.
  2. Liu, Qiang; Lee, Jason; Jordan, Michael (20 червня 2016). A Kernelized Stein Discrepancy for Goodness-of-fit Tests. Proceedings of the 33rd International Conference on Machine Learning. The 33rd International Conference on Machine Learning. New York, New York, USA: Proceedings of Machine Learning Research. с. 276—284. Архів оригіналу за 1 серпня 2020. Процитовано 18 квітня 2020. (англ.)
  3. Chwialkowski, Kacper; Strathmann, Heiko; Gretton, Arthur (20 червня 2016). A Kernel Test of Goodness of Fit. Proceedings of the 33rd International Conference on Machine Learning. The 33rd International Conference on Machine Learning. New York, New York, USA: Proceedings of Machine Learning Research. с. 2606—2615. Архів оригіналу за 17 лютого 2020. Процитовано 18 квітня 2020. (англ.)
  4. Zhang, Jin (2002). Powerful goodness-of-fit tests based on the likelihood ratio (PDF). J. R. Stat. Soc. B. 64: 281—294. Архів оригіналу (PDF) за 23 листопада 2018. Процитовано 5 листопада 2018. (англ.)
  5. Maindonald, J. H.; Braun, W. J. (2010). Data Analysis and Graphics Using R. An Example-Based Approach (вид. Third). New York: Cambridge University Press. с. 116—118. ISBN 978-0-521-76293-9. (англ.)
  6. McDonald, J.H. (2014). G–test of goodness-of-fit. Handbook of Biological Statistics (вид. Third). Baltimore, Maryland: Sparky House Publishing. с. 53—58. Архів оригіналу за 26 травня 2020. Процитовано 18 квітня 2020. (англ.)
  7. Sokal, R. R.; Rohlf, F. J. (1981). Biometry: The Principles and Practice of Statistics in Biological Research (вид. Second). W. H. Freeman[en]. ISBN 0-7167-2411-1. (англ.)

Література

Read other articles:

Bouvard e PécuchetTitolo originaleBouvard et Pécuchet Frontespizio della prima edizione AutoreGustave Flaubert 1ª ed. originale1881 1ª ed. italiana1927 Genereromanzo Lingua originalefrancese Modifica dati su Wikidata · Manuale Bouvard e Pécuchet (Bouvard et Pécuchet) è un romanzo incompiuto di Gustave Flaubert pubblicato postumo nel 1881. Il libro fu scritto da Flaubert negli ultimi cinque anni di vita, durante i quali assorbì sentimenti e idee contrastanti nei confronti degli acca…

Medical conditionSpasmodic dysphoniaOther namesLaryngeal dystoniaSpecialtyNeurologySymptomsBreaks in the voice making a person difficult to understand[1]ComplicationsDepression, anxiety[2]Usual onset30s to 50s[1]DurationLong term[1]TypesAdductor, abductor, mixed[1]CausesUnknown[1]Risk factorsFamily history[1]Diagnostic methodExamination by a team of healthcare providers[1]Differential diagnosisStuttering, muscle tension dysphonia …

Questa voce sull'argomento stagioni delle società calcistiche italiane è solo un abbozzo. Contribuisci a migliorarla secondo le convenzioni di Wikipedia. Segui i suggerimenti del progetto di riferimento. Voce principale: Football Club Dilettantistico Pinerolo. Associazione Calcio PineroloStagione 1940-1941Sport calcio Squadra Pinerolo Allenatore Guglielmo Rosa Presidente Damiano Sartorio Serie C12º nel girone D, rinuncia alla Serie C 1941-42, iscrivendosi alla Prima Divisione. 1939-…

此條目可能包含不适用或被曲解的引用资料,部分内容的准确性无法被证實。 (2023年1月5日)请协助校核其中的错误以改善这篇条目。详情请参见条目的讨论页。 各国相关 主題列表 索引 国内生产总值 石油储量 国防预算 武装部队(军事) 官方语言 人口統計 人口密度 生育率 出生率 死亡率 自杀率 谋杀率 失业率 储蓄率 识字率 出口额 进口额 煤产量 发电量 监禁率 死刑 国债 外…

Gran Turismo SPORTDéveloppeur Polyphony DigitalÉditeur Sony Interactive EntertainmentRéalisateur Kazunori YamauchiProducteur Kazunori YamauchiDate de sortie 17 octobre 2017 18 octobre 2017 19 octobre 2017Date de fin 2024Genre Course automobileMode de jeu 1 à 2 joueurs (écran divisé)Jeu en ligne (24 joueurs)Plate-forme PlayStation 4 compatible sur PlayStation 5Langue MultilingueVersion 1.68 ( 9 Septembre 2021)Évaluation CERO : A ?ESRB : E ?PEGI : 3 ?USK : 0 ?Site web ww…

Ivy DayIvy growing on the side of Hathorn Hall, featuring respective classes' Ivy StonesNamed afterThe ivy plant, HederaTypeUniversity and college traditionRegion New England, Northeastern United StatesFounded in 1873 Ivy Day is an annual ceremony in which an ivy stone is placed on either a residential, academic or administrative building or ground to commemorate academic excellence. The ceremony is most known for being practiced among older colleges in the Northeastern United States. It is most…

German retired footballer Linda Bresonik Bresonik playing for PSG in 2013.Personal informationFull name Linda Bresonik[1]Date of birth (1983-12-07) 7 December 1983 (age 40)Place of birth Essen, West GermanyHeight 1.75 m (5 ft 9 in)Position(s) Defensive midfielder, wing backYouth career1988–1995 TuS 84/10 Essen1995–2000 Grün-Weiß SchönebeckSenior career*Years Team Apps (Gls)2000–2005 FCR 2001 Duisburg 86 (22)2005–2006 SC 07 Bad Neuenahr 5 (2)2006–2008 SG E…

Валерий Приёмыхов Дата рождения 26 декабря 1943(1943-12-26) Место рождения Куйбышевка-Восточная, РСФСР Дата смерти 25 августа 2000(2000-08-25) (56 лет) Место смерти Москва, Россия Гражданство  СССР Россия Профессия актёр, сценарист, кинорежиссёр, писатель Карьера 1975—2000 Нагр…

The 94,736-capacity FNB Stadium is the home of the Kaizer Chiefs. The following is a list of football stadiums in South Africa, ordered by capacity. Currently all stadiums with a capacity of 10,000 or more are included. Existing stadiums # Image Stadium Capacity City Province Build Home team(s) 1 FNB Stadium 94,736 Johannesburg Gauteng 2009 Kaizer Chiefs F.C. South Africa national soccer team 2 Ellis Park Stadium 62,567 1928 3 Cape Town Stadium 58,310 Cape Town Western Cape 2009 Cape Town City F…

Sailing at the 1990 Asian GamesVenueQinhuangdao Aquatics sports centerDates23–30 September 1990← 19861994 → Sailing was contested at the 1990 Asian Games in Qinhuangdao, China from September 23 to September 30. Medalists Men Event Gold Silver Bronze Lechner A-390details Jiang Chen China Saard Panyawan Thailand Seo Yong-geun South Korea 470details  JapanKenji NakamuraMasayuki Takahashi  ChinaZhang YongqiangWang Yong  IndiaFarokh TaraporeC…

Soviet cosmonaut (1925–1970) In this name that follows Eastern Slavic naming customs, the patronymic is Ivanovich and the family name is Belyayev. Pavel BelyayevПавел БеляевBelyayev in 1965BornPavel Ivanovich Belyayev(1925-06-26)26 June 1925Chelishchevo,[1]Northern Dvina Governorate, Russian SFSR, USSRDied10 January 1970(1970-01-10) (aged 44)Moscow, Soviet UnionNationalitySoviet UnionOccupationFighter pilot, CosmonautAwardsHero of the Soviet UnionOrder of LeninOrder…

1988 film directed by Glenn Gordon Caron Clean and SoberTheatrical release posterDirected byGlenn Gordon CaronWritten byTod CarrollProduced byRon Howard Jay DanielStarring Michael Keaton Kathy Baker Morgan Freeman M. Emmet Walsh Tate Donovan CinematographyJan KiesserEdited byRichard ChewMusic byGabriel YaredProductioncompanyImagine EntertainmentDistributed byWarner Bros.Release date August 10, 1988 (1988-08-10) (United States) Running time124 minutesCountryUnited StatesLanguag…

يفتقر محتوى هذه المقالة إلى الاستشهاد بمصادر. فضلاً، ساهم في تطوير هذه المقالة من خلال إضافة مصادر موثوق بها. أي معلومات غير موثقة يمكن التشكيك بها وإزالتها. (يوليو 2019) منتخب رومانيا لاتحاد الرغبي للسيدات اللقب Stejarii (The Oaks) بلد الرياضة رومانيا  تاريخ التأسيس 11 أبريل 2007  ال…

Queen consort of Provence Ermengard of ItalyQueen consort of ProvenceTenure879 – 887Died896/897SpouseBoso of ProvenceIssue Engelberga Louis the Blind DynastyCarolingianFatherLouis II of ItalyMotherEngelberga Ermengard of Italy (died 896/897) was Queen of Provence as the spouse of King Boso. She was the second and only surviving child of Emperor Louis II. In her early life, she was betrothed to Constantine, the junior Byzantine emperor, but whether the marriage actually occurred or not is still…

UNESCO World Heritage Site in Europe Prehistoric Pile Dwellings around the AlpsUNESCO World Heritage SiteReconstructed pile dwellings at the Pfahlbau Museum Unteruhldingen on Lake Constance in GermanyLocation(see map)Includes111 locations in Austria, France, Germany, Italy, Slovenia and SwitzerlandReference1363Inscription2011 (35th Session)Area274.2 ha (678 acres)Buffer zone3,960.77 ha (9,787.3 acres)Websitewww.palafittes.org Prehistoric pile dwellings around the Alps are a series…

Mesin KD ToyotaPembuatToyota Motor CorporationProduksi2000-sekarangPendahuluMesin KZ ToyotaPenerusMesin GD ToyotaKonfigurasi4 silinder Mesin KD Toyota adalah mesin diesel yang diproduksi oleh Toyota sejak tahun 2000. 1KD-FTV 1KD-FTV diluncurkan tahun 2000. 1KD-FTV memiliki kapasitas silinder 3.0L (2982cc) 4 segaris common rail dengan variable geometry turbocharger dan Intercooler. Diameter x langkah 96 x 103 mm. Menghasilkan tenaga 172.72 hp (127 kW) pada 3400 rpm, dengan torsi 260 lbf·ft …

Cryptographic system with public and private keys This article needs additional citations for verification. Please help improve this article by adding citations to reliable sources. Unsourced material may be challenged and removed.Find sources: Public-key cryptography – news · newspapers · books · scholar · JSTOR (January 2024) (Learn how and when to remove this message) An unpredictable (typically large and random) number is used to begin generation of a…

スエズ運河Suez Canal スエズ運河の位置と衛星写真特長全長 193.30 km (120.11マイル)(当初は164 km または 102 mi)許容最大船幅 77.5 m (254 ft 3 in)閘門 無し運営者 スエズ運河庁歴史当初所有者 スエズ運河会社 (Compagnie Universelle du Canal Maritime de Suez)主要技術者 アロイス・ネグレッリ(en)建設決議 ページ建設開始 1859年4月25日完成 1869年11月17日地理始点 ポートサイド…

Species of bird Lesser Antillean bullfinch Male and two females in Dominica Conservation status Least Concern  (IUCN 3.1)[1] Scientific classification Domain: Eukaryota Kingdom: Animalia Phylum: Chordata Class: Aves Order: Passeriformes Family: Thraupidae Genus: Loxigilla Species: L. noctis Binomial name Loxigilla noctis(Linnaeus, 1766) Synonyms Fringilla noctis (protonym) The lesser Antillean bullfinch (Loxigilla noctis) is a species of bird in the family Thraupidae. It is fou…

Comune in Piedmont, ItalyBosiaComuneComune di Bosia Coat of armsLocation of Bosia BosiaLocation of Bosia in ItalyShow map of ItalyBosiaBosia (Piedmont)Show map of PiedmontCoordinates: 44°36′N 8°9′E / 44.600°N 8.150°E / 44.600; 8.150CountryItalyRegionPiedmontProvinceProvince of Cuneo (CN)Government • MayorEttore SeccoArea[1] • Total5.6 km2 (2.2 sq mi)Elevation484 m (1,588 ft)Population (30 November 2017)…