Orta Eğilim ile Dağılım Arasındaki Fark

Anonim

Merkez Eğilimi ve Dispozisyon

'na karşılık gelen bir veri setini tanımlamak için tanımlayıcı ve çıkarsama istatistiklerinde, merkeze karşılık gelen bir veri setini tanımlamak için birkaç indeks kullanılır eğilim, dağılma ve çarpıklık: bir veri kümesinin dağılımının göreli şeklini belirleyen en önemli üç özelliktir.

Merkezi eğilimler nedir?

Merkezi eğilim, değer dağılımının merkezini belirtir ve bulur. Ortalama, mod ve medyan, bir veri kümesinin merkezi eğilimini tanımlamada en sık kullanılan indekslerdir. Bir veri kümesi simetrik ise, veri kümesinin medyan ve ortalaması birbiri ile çakışır.

Veriler göz önüne alındığında, ortalama, tüm veri değerlerinin toplamı alınarak ve daha sonra veri sayısına bölünerek hesaplanır. Örneğin, 10 kişinin ağırlığı (kilogram cinsinden) 70, 62, 65, 72, 80, 70, 63, 72, 77 ve 79 olarak ölçülür. O zaman on kişinin (kilogram cinsinden) ortalama ağırlığı aşağıdaki şekilde hesaplanmıştır. Ağırlıkların toplamı 70 + 62 + 65 + 72 + 80 + 70 + 63 + 72 + 77 + 79 = 710'dur. Ortalama = (toplam) / (veri sayısı) = 710/10 = 71 (kilogram cinsinden). Aykırı değerlerin (normal eğilimden sapmış veri noktaları) ortalamayı etkilediği anlaşılmaktadır. Böylece, aykırı değerlerin varlığında, tek başına, veri kümesinin merkezi hakkında doğru bir resim vermez.

Ortanca, veri kümesinin tam ortasında bulunan veri noktasıdır. Orta değeri hesaplamanın bir yolu, veri noktalarını artan düzende sipariş etmek ve daha sonra ortadaki veri noktasını bulmaktır. Örneğin, bir kez sipariş verildiyse, önceki veri seti 62, 63, 65, 70, 70, 72, 72, 77, 79, 80 gibi görünür. Dolayısıyla (70 + 72) / 2 = 71 orta yerdedir. Bundan ortanca veri kümesinde olması gerekmediği görülüyor. Ortanca, sapkınlıkların varlığından etkilenmez. Bu nedenle, ortanca, sapkınlıkların varlığında merkezi eğilimin daha iyi bir ölçüsü olarak hizmet edecektir.

Mod, veri kümesindeki en sık rastlanan değerdir. Önceki örnekte, 70 ve 72 değerleri her ikisi de iki kez oluşur ve böylece her ikisi de modlardır. Bu, bazı dağıtımlarda, birden fazla modal değer bulunduğunu gösterir. Tek bir mod varsa, veri kümesinin tek modlü olduğu söylenir; bu durumda veri kümesi iki modeldir.

Dağılım nedir?

Dağılım, dağıtım merkeziyle ilgili verilerin yayılma miktarıdır. Aralık ve standart sapma dağılımı için en yaygın kullanılan önlemlerdir.

Aralık yalnızca en yüksek değeri eksi en düşük değerdir. Önceki örnekte, en yüksek değer 80 ve en düşük değer 62'dir, bu nedenle aralık 80-62 = 18'dir. Ancak aralık dağılım hakkında yeterli bir resim sağlamaz.

Standart sapmayı hesaplamak için önce veri değerlerinin ortalamadan sapmaları hesaplanır. Sapmaların kök kareli ortalaması, standart sapma olarak adlandırılır. Bir önceki örnekte ortalama ile ilgili sapmalar (70 - 71) = -1, (62 - 71) = -9, (65 - 71) = -6, (72 - 71) = 1, (80 - 71) = 9, (70-71) = -1, (63-71) = -8, (72-71) = 1, (77-71) = 6 ve (79-71) = 8 sapma kareleri (-1) 2 + (-9) 2 + (-6) 2 + 1 2 + 9 2 2 2 2 2 + (-8) 2 + 1 2 + 6 8 2

= 366. Standart sapma √ (366/10) = 6.50 (kilogram cinsinden). Veri seti büyük ölçüde çarpık olmadığı sürece, bu verilerin çoğunluğunun 71 ± 6 aralığında olduğu sonucuna varılabilir. 05 ve gerçekten de bu özel örnekte.

Merkezi eğilim ve dağılım arasındaki fark nedir?

• Merkezi eğilim, değer dağılımının merkezini belirtir ve yerini belirtir

• Dağılım, bir veri setinin merkezi etrafındaki verilerin yayılma miktarıdır.