Стандартизована оцінкаУ статистиці стандартна оцінка — це кількість стандартних відхилень, на яку значення необробленої оцінки (тобто спостережуваного значення або точки даних) вище або нижче середнього значення того, що спостерігається або вимірюється. Необроблені бали вище середнього мають позитивні стандартні бали, а ті, що нижче середнього, мають негативні стандартні бали. Він розраховується шляхом віднімання середнього значення генеральної сукупності від індивідуального необробленого балу, а потім ділення різниці на стандартне відхилення генеральної сукупності. Цей процес перетворення необробленої оцінки в стандартну оцінку називається стандартизацією або нормалізацією (проте «нормалізація» може стосуватися багатьох типів співвідношень; див. Нормалізація для отримання додаткової інформації). Стандартні бали найчастіше називають z -балами; ці два терміни можуть використовуватися як взаємозамінні, як і в цій статті. Інші еквівалентні терміни, що використовуються, включають z-значення, z-статистику, нормальний бал, стандартизовану змінну та тягу у фізиці високих енергій.[1][2] Обчислення z-показника вимагає знання середнього значення та стандартного відхилення повної сукупності, до якої належить точка даних; якщо є лише вибірка спостережень із генеральної сукупності, то аналогічне обчислення з використанням вибіркового середнього та вибіркового стандартного відхилення дає t -статистику. РозрахунокЯкщо середнє значення сукупності та стандартне відхилення сукупності відомі, необроблений бал x перетворюється на стандартний бал за[3]
де:
Абсолютне значення z представляє відстань між необробленим показником x і середнім значенням сукупності в одиницях стандартного відхилення. z є негативним, якщо необроблений бал нижче середнього, позитивним, якщо вище. Обчислення z за цією формулою вимагає використання середнього значення сукупності та стандартного відхилення сукупності, а не середнього значення чи відхилення вибірки. Однак знання справжнього середнього значення та стандартного відхилення сукупності часто є нереалістичним очікуванням, за винятком таких випадків, як стандартизоване тестування, коли вимірюється вся сукупність. Якщо середнє значення сукупності та стандартне відхилення сукупності невідомі, стандартний бал можна оцінити за допомогою вибіркового середнього значення та стандартного відхилення вибірки як оцінки значень сукупності.[4][5][6][7] У цих випадках z -показник визначається як
де:
Хоча це завжди слід зазначати, різниця між використанням генеральної сукупності та вибіркової статистики часто не робиться. У будь-якому випадку чисельник і знаменник рівнянь мають однакові одиниці вимірювання, тому одиниці компенсуються діленням, а z залишається безрозмірною величиною. ДодаткиZ-тестZ-показник часто використовується в z-критерії стандартизованого тестування – аналогі t-критерію Стьюдента для сукупності, параметри якої відомі, а не оцінені. Оскільки знати всю популяцію дуже незвично, t-тест використовується набагато ширше. Інтервали прогнозуванняСтандартну оцінку можна використовувати для розрахунку інтервалів передбачення. Інтервал передбачення [L, U ], що складається з нижньої кінцевої точки, позначеної L, і верхньої кінцевої точки, позначеної U, — це такий інтервал, що майбутнє спостереження X буде лежати в інтервалі з високою ймовірністю. , тобто
Для стандартної оцінки Z від X це дає:[8]
Визначаючи квантиль z таким чином, що
це слідує:
Контроль процесівУ додатках керування процесом значення Z забезпечує оцінку ступеня, до якого процес працює не за призначенням. Порівняння балів, виміряних за різними шкалами: ACT і SATКоли оцінки вимірюються за різними шкалами, їх можна конвертувати в z-показники, щоб полегшити порівняння. Дітц та ін. [9] наводять наступний приклад, порівнюючи бали учнів на (старих) тестах SAT і ACT для середньої школи. У таблиці показано середнє значення та стандартне відхилення для загальних балів за SAT та ACT. Припустімо, що студент A набрав 1800 балів на SAT, а студент B набрав 24 бали на ACT. Хто зі студентів показав кращі результати порівняно з іншими учасниками тестування?
Z-бал для студента А є
Z-бал для студента Б становить
Оскільки студент A має вищий z-бал, ніж студент B, студент A показав кращі результати порівняно з іншими тестувальниками, ніж студент B. Відсоток спостережень нижче z-показникаПродовжуючи приклад балів ACT і SAT, якщо додатково можна припустити, що обидва бали ACT і SAT розподілені нормально (що є приблизно правильним), тоді z-бали можна використовувати для розрахунку відсотка учасників тестування, які отримали нижчі бали, ніж студенти А і Б. Кластерний аналіз і багатовимірне масштабування«Для деяких багатовимірних методів, таких як багатовимірне масштабування та кластерний аналіз, концепція відстані між одиницями в даних часто становить значний інтерес і важливе значення... Коли змінні в багатовимірному наборі даних мають різні масштаби, має сенс розрахувати відстані після певної форми стандартизації».[10] Аналіз головних компонентВ аналізі головних компонентів «змінні, виміряні на різних шкалах або на загальній шкалі з дуже різними діапазонами, часто стандартизовані».[11] Відносна важливість змінних у множинній регресії: стандартизовані коефіцієнти регресіїСтандартизація змінних перед множинним регресійним аналізом іноді використовується як допомога для інтерпретації.[12] (сторінка 95) зазначте наступне. «Стандартизований нахил регресії — це нахил у рівнянні регресії, якщо X і Y стандартизовані… Стандартизація X і Y здійснюється шляхом віднімання відповідних середніх значень із кожного набору спостережень і ділення на відповідні стандартні відхилення… У множинній регресії, де кілька Використовуються змінні X, стандартизовані коефіцієнти регресії кількісно визначають відносний внесок кожної змінної X». Однак Kutner et al.[13] (стор. 278) дають таке застереження: «… треба бути обережним щодо інтерпретації будь-яких коефіцієнтів регресії, незалежно від того, стандартизовані вони чи ні. Причина полягає в тому, що коли змінні предиктора корелюють між собою, … коефіцієнти регресії залежать від інші змінні предикторів у моделі... На величини стандартизованих коефіцієнтів регресії впливає не лише наявність кореляцій між змінними предикторів, але й інтервали спостережень за кожною з цих змінних. Іноді ці інтервали можуть бути досить довільними. Отже,, як правило, нерозумно інтерпретувати величини стандартизованих коефіцієнтів регресії як відображення порівняльної важливості змінних предикторів». Стандартизація в математичній статистиціУ математичній статистиці випадкова величина X стандартизується шляхом віднімання її очікуваного значення і ділення різниці на її стандартне відхилення
Якщо випадкова змінна, що розглядається, є вибірковим середнім для випадкової вибірки з X:
то стандартизована версія
Т-оцінкаВ освітньому оцінюванні Т-бал є стандартним балом Z, зміщеним і масштабованим, щоб мати середнє значення 50 і стандартне відхилення 10.[14][15][16] Він також відомий як хенсачі японською мовою, де ця концепція набагато ширше відома та використовується в контексті вступу до середньої школи та університету. При вимірюванні щільності кісткової тканини T-показник є стандартним показником вимірювання порівняно з популяцією здорових 30-річних дорослих, і має звичайне середнє значення 0 і стандартне відхилення 1.[17] Див. також
Примітки
Посилання |