uk %D0%86%D0%BD%D0%B4%D0%B5%D0%BA%D1%81 %D0%A1%D0%BE%D1%80%D0%B5%D0%BD%D1%81%D0%B5%D0%BD%D0%B0

Індекс Соренсена (Індекс подібності Соренсена) — статистичний коефіцієнт, який використовується для порівняння двох статистичних вибірок. Він був розроблений ботаніком Торвальдом Соренсеном в 1948 році.^[1]

Індекс Соренсена обраховується за наступною формулою

QS={\frac {2C}{A+B}}

,

де А і В число видів в зразках А і В, відповідно. С — число видів, які є спільними для двох зразків.

Цей вираз може бути розширеним для визначення поширеності видів замість кількості. Ця кількісна версія індексу Соренсена також відома як індекс Чекановського. Індекс Соренсена ідентичний до коефіцієнту Дайса^[2], який має межі [0, 1]. Індекс Соренсена також використовується для вимірювання відстані, 1 — QS, і в такій подачі є ідентичним до відстані Хелінгера і коефіцієнту Брея-Кертіса.

Коефіцієнт Соренсена найкорисніший для аналізу даних екологічних спільнот (див. Looman & Campbell, 1960^[3]) Арґументація щодо його використання є швидше емпірично, ніж теоретично підтвердженою (проте використання цього індексу може аргументуватись теоретично як перетин двох нечітких множин^[4]). Якщо порівнювати з відстанню Евкліда, то відстань Соренсена зберігає чутливість в більш гетерогенних наборах даних і дає меншу вагу точкам, які випадають із загальної картини (англ. outliers)^[5].

Див. також

Посилання

↑ Sørensen, T. (1948) A method of establishing groups of equal amplitude in plant sociology based on similarity of species and its application to analyses of the vegetation on Danish commons. Biologiske Skrifter /Kongelige Danske Videnskabernes Selskab, 5 (4): 1—34.
↑ Miguel Murguía & José Luis Villaseñor Estimating the effect of the similarity coefficient and the luster algorithm on biogeographic classifications [Архівовано 24 вересня 2015 у Wayback Machine.]// Ann. Bot. Fennici, 2003, 40: P. 415—421. — ISSN 0003-3847
↑ Looman, J. and Campbell, J.B. (1960) Adaptation of Sorensen's K (1948) for estimating unit affinities in prairie vegetation. Ecology 41 (3): 409—416.
↑ Roberts, D.W. (1986) Ordination on the basis of fuzzy set theory. Vegetatio 66 (3): 123—131.^{[недоступне посилання з червня 2019]}
↑ McCune, Bruce & Grace, James (2002) Analysis of Ecological Communities. Mjm Software Design; ISBN 0-9721290-0-6.

Це незавершена стаття зі статистики.
Ви можете допомогти проєкту, виправивши або дописавши її.

[1] Sørensen, T. (1948) A method of establishing groups of equal amplitude in plant sociology based on similarity of species and its application to analyses of the vegetation on Danish commons. Biologiske Skrifter /Kongelige Danske Videnskabernes Selskab, 5 (4): 1—34.

[2] Miguel Murguía & José Luis Villaseñor Estimating the effect of the similarity coefficient and the luster algorithm on biogeographic classifications [Архівовано 24 вересня 2015 у Wayback Machine.]// Ann. Bot. Fennici, 2003, 40: P. 415—421. — ISSN 0003-3847

[3] Looman, J. and Campbell, J.B. (1960) Adaptation of Sorensen's K (1948) for estimating unit affinities in prairie vegetation. Ecology 41 (3): 409—416.

[4] Roberts, D.W. (1986) Ordination on the basis of fuzzy set theory. Vegetatio 66 (3): 123—131.^{[недоступне посилання з червня 2019]}

[5] McCune, Bruce & Grace, James (2002) Analysis of Ecological Communities. Mjm Software Design; ISBN 0-9721290-0-6.

[1]

[2]

[3]

[4]

[5]