Théorie de l'estimation

En statistique, la théorie de l'estimation s'intéresse à l'estimation de paramètres à partir de données empiriques mesurées ayant une composante aléatoire. Les paramètres décrivent un phénomène physique sous-jacent tel que sa valeur affecte la distribution des données mesurées. Un estimateur essaie d'approcher les paramètres inconnus à partir des mesures. En théorie de l'estimation, deux approches sont généralement considérées[1]:

  • l'approche probabiliste (décrite ici) suppose que les données mesurées sont aléatoires avec une distribution de probabilités dépendant des paramètres d'intérêt
  • l'approche ensembliste suppose que le vecteur des données mesurées appartient à un ensemble qui dépend du vecteur des paramètres.

Exemples

On souhaite estimer la proportion d'une population d'électeurs qui va voter pour un candidat donné dans une élection. Cette proportion est le paramètre recherché ; l'estimaion est basé sur un petit échantillon aléatoire de votants. De façon alternative, on veut évaluer la probabilité d'un électeur de voter pour un candidat particulier, en se basant sur des données démographiques, comme son âge.

Avec un radar, on veut trouver la taille des objets (avions, bateaux, etc.) en analysant le temps aller-retour des échos reçus d'ondes pulsées. Comme les ondes réfléchies sont toutes perturbées par un bruit électrique, leurs valeurs mesurées sont aléatoires, et le temps de transit doit être estimé.

De façon générale, les mesures de signaux électriques sont souvent associés à un bruit.

Bases

Pour un modèle donné, plusieurs "ingrédients" statistiques sont requis pour implémenter l'estimateur. Le premier est un échantillon statistique – un ensemble de données discrètes dans un vecteur aléatoire de taille N :

on associe un vecteur de M paramètres :

dont on veut estimer les valeurs. Enfin, il faut la densité de probabilité, discrète ou continue, de la loi sous-jacente de probabilité qui ont généré les données, et donc conditionnelle aux valeurs des paramètres :

Il est aussi possible pour les paramètres d'avoir une loi de probabilité (voir statistiques bayésiennes). Il est alors nécessaire de définir la probabilité bayésienne

Après que le modèle est formé, l'objectif est d'estimer les paramètres, dont on note les estimateurs .

Un estimateur classique est l'estimateur des moindres carrés, qui est celui qui minimise l'erreur entre les paramètres estimés et leurs valeurs réelles

Cette erreur est ensuite élevée au carré et la valeur attendue est minimale pour l'estimateur des moindres carrés.

Estimateurs

Les estimateurs les plus communément utilisés et étudiés sont :

Exemples

Constante inconnue avec bruit blanc gaussien

Dans un signal discret mesuré avec N échantillons indépendants constitués d'une constante A avec un bruit blanc gaussien additif (AWGN) de moyenne nulle et de variance connue (i.e., ). Le vecteur de paramètres à estimer se réduit uniquement à A. Le signal modèle s'écrit :

On a alors deux estimateurs possibles pour A :

  • qui est la moyenne empirique de l'échantillon

Les deux estimateurs ont une espérance de A :

Cependant, en étudiant leurs variances, la différence de qualité entre les deux estimateur apparait :

La moyenne de l'échantillon semble alors un bien meilleur estimateur car sa variance est plus petite dès que N > 1.

Maximum de vraisemblable

Sur le même exemple, on utilise l'estimateur du maximum de vraisemblance, la fonction densité de probabilité du bruit pour un échantillon w[n] est

et la probabilité de x[n] devient (x[n] peut être vu comme suivant une loi normale )

Par indépendance, la probabilité de x devient

On prend le logarithme naturel de l'expression :

dont on tire l'estimateur du maximum de vraisemblance :

En prenant la dérivée de la log-vraisemblance :

qu'on cherche à annuler

La résolution de cette équation donne l'estimateur du maximum de vraisemblance :

qui est ici la moyenne empirique.

Borne inférieure de Cramér–Rao

Pour trouver la borne inférieure de Cramér–Rao (CRLB) de l'estimateur de la moyenne de l'échantillon, on doit d'abord établir l'information de Fisher :

et en reprenant le même processus que précédemment :

La dérivée seconde donne :

et trouver la valeur attendue négative est trivial car la dérivée est une constante déterministe :

On réinjecte l'information de Fisher dans le calcul :

ce qui donne

En comparant ce résultat à la variance de la moyenne empirique (déterminé auparavant) montre que la moyenne empirique atteint la borne de Cramér–Rao pour toutes valeurs de N et A. Ainsi, la moyenne de l'échantillon est un (et même forcément le seul) estimateur efficace, et est donc l'estimateur sans biais de variance minimale (MVUE), en plus d'être l'estimateur de maximum de vraisemblance.

Maximum d'une distribution uniforme

Un des exemples non triviaux les plus simples d'estimation est celui de l'estimation du maximum d'une distribution uniforme. Il est utilisé classiquement pour illustrer les principes de bases de la théorie de l'estimation, en mettant en lumière des questions d'a priori et des erreurs dans l'utilisation de l'estimation par maximum de vraisemblance et des fonctions de vraisemblance.

Soit une distribution uniforme discrète 1, 2, ..., N de maximum inconnu, alors l'estimateur sans biais à variance minimale du maximum est

m est le maximum de l'échantillon et k la taille de l'échantillon, sans remplacement[2],[3]. Ce cas est connu sous le nom du problème du char d'assaut allemand, car il fut appliqué à l'estimation du nombre maximal de chars allemands produits pendant la Seconde Guerre Mondiale.

La formule peut être comprise de façon intuitive comme :

"le maximum de l'échantillon plus la différence moyenne entre les observations de l'échantillon",

la différence étant ajouté pour compenser le biais négatif du maximum de l'échantillon comme estimateur du maximum de la population[N 1]

Il a une variance de[2]

donc un écart-type proche de N/k, la taille moyenne (de la population) de la différence entre échantillons ; on pourra comparer avec m/k. On peut voir ce résultat comme un cas simple d'estimation de l'espacement maximum.

Le maximum de l'échantillon est l'estimateur du maximum de vraisemblance du maximum de la population, mais comme vu au-dessus, il est biaisé.

Applications

De nombreux domaines utilisent la théorie de l'estimation :

Des mesures sont susceptibles d'être perturbées par un bruit ou une incertitude et c'est grâce à la théorie des probabilités que des solutions optimales sont étudiées afin d'en tirer autant d'information que possible.

Voir aussi

Une catégorie est consacrée à ce sujet : Estimation theory.

Notes

  1. Le maximum de l'échantillon n'excède jamais le maximum de la population, mais peut lui être inférieur, ce qui en fait un estimateur biaisé : il va tendre à sous-estimer le maximum de la population.

Références

Citations

  1. (en) E. Walter et L. Pronzato, Identification of Parametric Models from Experimental Data, London, England, Springer-Verlag,
  2. a et b (en) Roger Johnson, « Estimating the Size of a Population », Teaching Statistics, vol. 16, no 2 (Summer),‎ , p. 50–52 (DOI 10.1111/j.1467-9639.1994.tb00688.x)
  3. (en) Roger Johnson, Getting the Best from Teaching Statistics, (lire en ligne [archive du ])

Sources

  • (en) E.L. Lehmann et G. Casella, Theory of Point Estimation (ISBN 0387985026)
  • (en) Dale Shermon, Systems Cost Engineering (ISBN 978-0-566-08861-2)
  • (en) John Rice, Mathematical Statistics and Data Analysis (ISBN 0-534-209343))
  • (en) Steven M. Kay, Fundamentals of Statistical Signal Processing: Estimation Theory (ISBN 0-13-345711-7)
  • (en) H. Vincent Poor, An Introduction to Signal Detection and Estimation (ISBN 0-387-94173-8))
  • (en) Harry L. Van Trees, Detection, Estimation, and Modulation Theory, Part 1 (ISBN 0-471-09517-6, lire en ligne)
  • (en) Dan Simon, Optimal State Estimation: Kalman, H-infinity, and Nonlinear Approaches (lire en ligne)
  • (en) Ali H. Sayed, Adaptive Filters, Wiley, NJ, (ISBN 978-0-470-25388-5).
  • (en) Ali H. Sayed, Fundamentals of Adaptive Filtering, Wiley, NJ, (ISBN 0-471-46126-1).
  • (en) Thomas Kailath, Ali H. Sayed et Babak Hassibi, Linear Estimation, Prentice-Hall, NJ, (ISBN 978-0-13-022464-4).
  • (en) Babak Hassibi, Ali H. Sayed et Thomas Kailath, Indefinite Quadratic Estimation and Control: A Unified Approach to H2 and H Theories, Society for Industrial & Applied Mathematics (SIAM), PA, (ISBN 978-0-89871-411-1).
  • (en) V.G.Voinov et M.S.Nikulin, Unbiased estimators and their applications. Vol.1: Univariate case, Kluwer Academic Publishers, (ISBN 0-7923-2382-3).
  • (en) V.G.Voinov et M.S.Nikulin, Unbiased estimators and their applications. Vol.2: Multivariate case, Kluwer Academic Publishers, (ISBN 0-7923-3939-8).

Liens externes

Sur les autres projets Wikimedia :

Read other articles:

Kepala Plato, patung tiruan karya seniman Romawi. Patung aslinya dipajang di Akademia sesudah sang filsuf wafat pada tahun 348 atau 347 Pramasehi. Bagian dari seri tentangPlatoPlato dari Akademi athena dilukis oleh Raphael, 1509 Awal kehidupan Karya Platonisme Epistemologi Idealisme / Realism Demiurge Teori bentuk Transcendentals Form of the Good Third man argument Dilema Euthyphro Five regimes Philosopher king Perumpamaan dan metafora Atlantis Ring of Gyges Perumpamaan gua Plato The divide…

У этого термина существуют и другие значения, см. Западный округ. Западный внутригородской округ город Краснодар Дата основания 1936 год Дата упразднения 1994 Прежние имена Кагановичский, Ленинский районы Микрорайоны Дубинка, Черёмушки, Покровка Площадь 22[1]  км² Насел…

西維珍尼亞 美國联邦州State of West Virginia 州旗州徽綽號:豪华之州地图中高亮部分为西維珍尼亞坐标:37°10'N-40°40'N, 77°40'W-82°40'W国家 美國加入聯邦1863年6月20日(第35个加入联邦)首府(最大城市)查爾斯頓政府 • 州长(英语:List of Governors of {{{Name}}}]]) • 副州长(英语:List of lieutenant governors of {{{Name}}}]])吉姆·賈斯蒂斯(R)米奇·卡邁克爾(英…

本條目存在以下問題,請協助改善本條目或在討論頁針對議題發表看法。 此條目需要擴充。 (2013年1月1日)请協助改善这篇條目,更進一步的信息可能會在討論頁或扩充请求中找到。请在擴充條目後將此模板移除。 此條目需要补充更多来源。 (2013年1月1日)请协助補充多方面可靠来源以改善这篇条目,无法查证的内容可能會因為异议提出而被移除。致使用者:请搜索一下条目的标…

السعفة الذهبيةالشعارمعلومات عامةالبلد فرنسا المكان كان أول جائزة 1955 موقع الويب festival-cannes.com (الإنجليزية) تعديل - تعديل مصدري - تعديل ويكي بيانات السَّعَفَة الذَّهَبية (بالفرنسية: Palme d'Or)‏ أعلى جائزة تمنح لفيلم في مهرجان كان السينمائي. بدأ منح هذه الجائزة في سنة 1955. لمحة تاريخية…

Defensive structure encircling Bath, England City Wallsor Borough WallsBath, Somerset in EnglandRemains of Bath's city wallsCity Wallsor Borough WallsCoordinates51°22′57″N 2°21′41″W / 51.3825028°N 2.3614444°W / 51.3825028; -2.3614444Grid referencegrid reference ST751648TypeCity wallSite informationConditionFragmentary remainsSite historyBuilt3rd centuryMaterialsStoneFateAlmost entirely abandoned Partly preserved (at Upper Borough Walls and East gate remai…

 烏克蘭總理Прем'єр-міністр України烏克蘭國徽現任杰尼斯·什米加尔自2020年3月4日任命者烏克蘭總統任期總統任命首任維托爾德·福金设立1991年11月后继职位無网站www.kmu.gov.ua/control/en/(英文) 乌克兰 乌克兰政府与政治系列条目 宪法 政府 总统 弗拉基米尔·泽连斯基 總統辦公室 国家安全与国防事务委员会 总统代表(英语:Representatives of the President of Ukraine) 总理…

British politician This article is about the British politician Joan Helen Vickers. For the American professor Joan Vickers, see Quiet eye. This article needs additional citations for verification. Please help improve this article by adding citations to reliable sources. Unsourced material may be challenged and removed.Find sources: Joan Vickers, Baroness Vickers – news · newspapers · books · scholar · JSTOR (April 2016) (Learn how and when to remove this…

Artistic and ritual tradition and practice of Vanuatu Sand drawing in Vanuatu (2007) Sand drawing (or sandroing in Bislama) is a ni-Vanuatu artistic and ritual tradition and practice, recognised by UNESCO as a Masterpiece of the Oral and Intangible Heritage of Humanity. Another form of art which implies drawing in the sand is sandpainting, but this process also implies the coloring of sand to create a colorful environment on a small or a large scale. This form of sand art has been heavily record…

Person who has an on-air position in radio broadcasting A radio personality (Randy J. Allum) at work at the now-defunct WKZV in Washington, Pennsylvania in 1997 A radio personality is a person who has an on-air position in radio broadcasting. A radio personality who hosts a radio show is also known as a radio host (North American English), radio presenter (British English) or radio jockey. Radio personalities who introduce and play individual selections of recorded music are known as disc jockey…

County in Oregon, United States Not to be confused with Wheeler, Tillamook County, Oregon. County in OregonWheeler CountyCountyWheeler County Courthouse in FossilLocation within the U.S. state of OregonOregon's location within the U.S.Coordinates: 44°44′N 120°01′W / 44.73°N 120.02°W / 44.73; -120.02Country United StatesState OregonFoundedFebruary 17, 1899Named forHenry H. Wheeler [Wikidata]SeatFossilLargest cityFossilArea • Total…

The topic of this article may not meet Wikipedia's notability guidelines for products and services. Please help to demonstrate the notability of the topic by citing reliable secondary sources that are independent of the topic and provide significant coverage of it beyond a mere trivial mention. If notability cannot be shown, the article is likely to be merged, redirected, or deleted.Find sources: Cram software – news · newspapers · books · scholar · …

American author and journalist (born 1970) Matt TaibbiTaibbi in 2012BornMatthew Colin Taibbi (1970-03-02) March 2, 1970 (age 54)New Brunswick, New Jersey, U.S.OccupationJournalistauthorpodcasterEducationNew York UniversityBard College (BA)SubjectsAmerican politicsmediafinancesportsYears active1991–present[1]Notable works Griftopia (2010) The Divide (2014) Insane Clown President (2017) I Can't Breathe (2017) Hate Inc. (2019) SpouseJeanne Taibbi[2]Children3RelativesMike…

Association football stadium in Al Rayyan, Qatar Education City Stadiumاستاد المدينة التعليمية (Arabic)Interior view of the stadium before the 2022 FIFA World Cup Group H match between South Korea and Portugal.Full nameEducation City StadiumLocationEducation City,Al Rayyan, QatarCoordinates25°18′39″N 51°25′28″E / 25.3108°N 51.4244°E / 25.3108; 51.4244Public transit Education City (المدينة التعليمية)OwnerQatar Foundatio…

Iglesia ortodoxa rusaРусская православная церковь Catedral de Cristo Salvador de MoscúFundador(es) Vladímir I de Kiev[1]​[2]​Fundación Cristianización de la Rus de Kiev (988)Autocefalia/Autonomía 15 de diciembre de 1448Reconocimiento 1589 por el Patriarcado Ecuménico de ConstantinoplaGobierno eclesiástico Santo SínodoPrimado actual CiriloSede Moscú, RusiaTerritorio principal  Rusia Ucrania Bielorrusia Kazajistán Azerbaiyán…

845

Calendar year This article is about the year 845. For the vacuum tube, see 845 (vacuum tube). Calendar year Millennium: 1st millennium Centuries: 8th century 9th century 10th century Decades: 820s 830s 840s 850s 860s Years: 842 843 844 845 846 847 848 845 by topic Leaders Political entities State leaders Religious leaders Categories Births Deaths Establishments 845 in various calendarsGregorian calendar845DCCCXLVAb urbe condita1598Armenian calendar294ԹՎ ՄՂԴAssyrian calen…

This article relies largely or entirely on a single source. Relevant discussion may be found on the talk page. Please help improve this article by introducing citations to additional sources.Find sources: South Western Football League – news · newspapers · books · scholar · JSTOR (April 2010) Football leagueSouth Western Football LeagueFounded1951CountryEnglandDivisions1Number of teams19Level on pyramid11Feeder toWestern League The South Western Football …

American mayor, politician and attorney Stephanie Rawlings-BlakeRawlings-Blake in 2013Secretary of the Democratic National CommitteeIn officeJanuary 22, 2013 – February 25, 2017ChairDebbie Wasserman SchultzDonna Brazile (acting)Preceded byAlice GermondSucceeded byJason Rae73rd President of the United States Conference of MayorsIn officeDecember 21, 2015 – July 22, 2016Preceded byKevin JohnsonSucceeded byMick Cornett50th Mayor of BaltimoreIn officeFebruary 4, 2010 –&#…

В Википедии есть статьи о других людях с именем Филипп. В Википедии есть статьи о других людях с именем Филипп Македонский. Филипп III Арридейдр.-греч. Φίλιππος Ἀῤῥιδαῖος Македонский царь 323 год до н. э — 317 год до н. э Предшественник Александр III Великий Преемник Александ…

Map all coordinates using OpenStreetMap Download coordinates as: KML GPX (all coordinates) GPX (primary coordinates) GPX (secondary coordinates) This list includes properties and districts listed on the National Register of Historic Places in Stokes County, North Carolina. Click the Map of all coordinates link to the right to view a Google map of all properties and districts with latitude and longitude coordinates in the table below.[1] Current listings         …