Български | English
 

 

 

 

 

За контакти: 

 

0877 / 10 30 08

 
 
 
 

Мерки на разсейване

Формата и централната тенденция на разпределението са две от тритехарактеристики, които описват това разпределение. Третата базова характеристика еизменчивостта или разсейването на измерванията в разпределението. Обратно намерките за централна тенденция, които са точки, мерките на разсейване са интервалиили разстояния върху измерителната скала, които показват как измерванията саразсеяни или концентрирани.Нужни са методи за определяне на степента на разсейване наразпределението. Тук ще опишем две мерки, приложими за рангови данни: размах и(полу-)квартилен размах и две мерки, които предполагат скалата да е най-малкоинтервална: дисперсия и стандартно отклонение.

Размахът е най-простата мярка на разсейване - разликата между най-голямата и най-малката измерени стойности. Даразгледаме двете разпределения по-долу:Разпределение 1 11 16 18 23 29 31 37 и Разпределение 2 18 19 21 23 24 26 29. Двете разпределения имат равни медиани (23), но размахът им не е равен. Запървото разпределение имаме размах (37-11 = 26), който е по-голям от този на второто  разпределение (29-18 = 11). Тогава говорим, че първото разпределението е по-силноизменчиво (вариабелно) от второто.Независимо, че размахът се изчислява лесно, той може да не дава адекватноописание на разсейването в популацията. Неговият най-сериозен недостатък е, че снарастването на брой на измерванията той се променя, като нараства, тъй като колкотопо-голяма е извадката, толкова повече екстремални стойности тя ще съдържа. Размахътне може да намалява. В случай на две извадки с неравен брой измервания технияразмах не може да бъде сравняван директно. Допълнително, рангът може да се повлияедаже от добавянето или отстраняването на едно отделно измерване.

Квартилно отклонение тъй като размахът се изчислява на базата на екстремалните измервания вразпределението, той очевидно е неустойчива мярка. Това ограничение може да бъдепреодоляно до известна степен чрез определянето на квартилното отклонение. Както размахът, така и квартилното отклонение са относително груби мерки наразсейванито. Те не разкриват много информация и не използват директно наредеността на наблюденията. Тяхното предимство е, че могат да бъдат изчислявани и зарангови скали. Съществуват мерки, които пряко използват всички наблюдения. Тези меркиобикновено описват отклонението на всяко наблюдение от дадена централна стойност.Най-честно тази централна стойност е аритметичната средна x . Отклонението отсредната за i-тото измерване е Д. Аритметичната средна на всичкиотклонения очевидно е 0. Следователно, подходящите мерки трябва да преодоляват горния ефект. Това може дабъде постигнато по един от двата начина:a) да се разглежда абсолютната стойност на отклоненията i D . Тогава знакът наразликите се пренебрегва и сумата е положително число.б) да се разглежда квадрата на отклоненията  D , който има винагиположителна стойност.

Средно отклонение  в термините на популацията (ако такава информация е достъпна) средното отклонениесе определя като аритметичната средна на абсолютните  стойности на индивидуалнитеотклонения, т.е. x Nпопулационната средна.Както беше отбелязано по-рано, на практика обикновено разполагаме едонствено сизвадка от наблюдения, по която можем само да оценим средното отклонение. Дисперсияпредпочитаната мярка на разсейването, когато измерванията са в интервална или скалана отношението е дисперсията. Дисперсията се определя като средна аритметична наквадратите на отклоненията. Ако дисперсията ни интересува единствено катоописателна статистика, то трябва само да повдигнем на квадрат всички отклонения отсредната, да ги сумираме и да ги разделим на броя им.Тъй като съществува известна разлика в изчисляването на дисперсията запопулацията и извадката, ще разглеждаме двата случая отделно. Ще означавамепараметъра дисперсия, т.е. популационната дисперсия със σ2, а статистиката дисперсия,т.е. извадковата дисперсия – със s2.