MediánA medián a statisztika egy nevezetes középértéke, úgynevezett helyzeti középérték: az az érték, amelytől mérve az elemek abszolút távolságainak összege minimális. Meghatározása: véges elemszámú sokaság esetén a medián a sorba rendezett adatok közül a középső érték, vagy másképpen: a medián az az érték, amely a sorba rendezett adatokat két egyenlő részre osztja. A gyakorlatban problémát jelent, ha páros számú adat vagy ismétlődő értékek vannak. Folytonos valószínűségi változó esetén a mediánnál húzott függőleges vonal a valószínűségsűrűségi függvény görbe alatti területét pont elfelezi. Ahhoz, hogy mediánt számíthassunk a populáció (sokaság) egy ismérvére vonatkozóan, az ismérvnek legalább ordinális mérési szintűnek (sorbarendezhetőnek) kell lennie. Ha a sokaság elemeinek száma páratlan és az értékek nem ismétlődnek, akkor az iménti meghatározás egyértelmű, mert akkor van egy középső adat, amely előtt ugyanannyi adat van, mint utána. Páros számú nem ismétlődő értékű elem esetén két középső adat van, ez esetben a kettő közötti bármelyik érték mediánnak tekinthető. A gyakorlatban a két érték számtani közepét szokták megadni. Néha a két középső értéket alsó, illetve felső mediánként adják meg. A két esetet egyszerre figyelembe véve a medián definíciója: az az érték, amelynél az adatok legfeljebb 50%-a kisebb és legfeljebb 50%-a nagyobb. A medián a kvantilisek közül a legegyszerűbb, vagyis statisztikai sokaságot kétfelé vágó érték. Az x valószínűségi változó mediánját vagy jelöli.[1] Példák
Egyenértékű megfogalmazásaiA medián valamely értékekre vonatkoztatva az az érték, aminél a többinek a fele nagyobb és a fele kisebb (természetesen páros elemszám esetén a számtani közepet kell venni). Például egy népesség életkorának a mediánja az az életkor, aminél a népességnek pont a fele idősebb és pont a fele fiatalabb. A medián az az x szám, melytől a sokaság elemeinek abszolút eltérés összege a legkisebb: A medián az a μ érték, ahol az eloszlásfüggvény: 1/2: F(μ)=1/2. Az exponenciális eloszlás mediánja: μ = (ln2)/λ. A medián minimáltulajdonsága: Ha x-nek létezik várható értéke, akkor az |x-c| várható értéke akkor minimális, ha c=μ (a medián): M(|x-c|)>=M(|x-μ|). Magasabb dimenzióbanA többdimenziós statisztikában az minimalizáló c vektorát centroidnak is nevezik,[2] ahol egy adott normában értendő. Ez megfelel az egydimenziós eset abszolútértékének. A centroid szót azonban más jelentésben is használják. Ha a centroidot az eloszlás egy leszűkítésére veszik, akkor medioidnak hívják. Ez a ponthalmaz származhat például egy másik eloszlásból. AlkalmazásaA kilógó adatokkal szembeni kis érzékenysége miatt jobban jellemzi a nem normális eloszlásokat, mint az átlag, vagy a várható érték. Példa: 10 személy közül egynek 1 000 000 a jövedelme, a többinek 1000. Ekkor az átlagjövedelem 100 900, míg a medián 1000. A képfeldolgozásban a monokróm bitképeken gyakran látható egy zajféleség, amiben minden pixel a szomszédoktól függetlenül egy adott kis valószínűség szerint lesz fehér, egy hasonlóan kis valószínűséggel lesz fekete, és egy egyhez közeli valószínűséggel változatlan marad. Az efféle zaj jól csökkenthető az adott pixelből és szomszédjaiból (3 x 3-as négyzet) kapott medián használatával. AlternatíváiA medián egy alternatívájaként Amartya Sen bevezette a jólléti függvényt a jövedelmek eloszlásának vizsgálatára. ÁltalánosításaA medián helyett n-kvantilisek is használhatók, amik az alapsokaságot n egyenlő részre osztják. A medián a második kvartilis, az ötödik decilis, és az ötvenedik percentilis. Néhány kvantilisnek latin eredetű, önálló neve van:
Általánosabban, az eloszlásfüggvény inverzét nevezik az adott eloszlás kvantilisfüggvényének. TörténeteGustav Fechner népszerűsítette a medián használatát a formális adatelemzésben, bár korábban Pierre-Simon de Laplace már használta.[3] Lásd mégJegyzetek
Források
További információk
|
Portal di Ensiklopedia Dunia