T-TEST ve ANOVA Arasındaki Fark

Anonim

T-testi ve ANOVA

Ortalama elde etmek için istatistiksel verileri toplamak ve hesaplamak sıklıkla Uzun ve sıkıcı bir süreç. T-testi ve tek yönlü varyans analizi (ANOVA) bu amaçla kullanılan en yaygın iki testtir.

t-testi, boş hipotez destekleniyorsa, test istatistiğinin bir Öğrencinin t dağılımını izlediği istatistiksel hipotez testidir. Bu test, test istatistiği normal bir dağılım izlediğinde ve test istatistiğindeki ölçeklendirme teriminin değeri biliniyorsa uygulanır. Ölçeklendirme terimi bilinmiyorsa, daha sonra mevcut verilere dayanan bir tahmin ile değiştirilir. Test istatistiği bir Öğrencinin t-dağılımını izleyecektir.

William Sealy Gosset, 1908'de t-istatistiğini tanıttı. Gosset, İrlanda'daki Dublin'deki Guinness bira fabrikasında kimyagerdi. Guinness bira fabrikası, Oxford ve Cambridge'den en iyi mezunları seçerek, biyokimya ve istatistiklerin şirketin kurulu endüstriyel süreçlerine uygulanmasını sağlayanlar arasından seçme politikasına vardı. William Sealy Gosset de öyle mezun oldu. Bu süreçte, William Sealy Gosset, orijinal olarak şişenin kalitesini (bira fabrikasının ürettiği koyu bira) maliyet etkin bir şekilde izlemek için bir yöntem olarak tasarlanan t-testini geliştirdi. Gosset, testi 1908'de Biometrika'da 'Öğrenci' kalemi adı altında yayınladı. Şirketin istatistiklerini "ticari sır" ların bir parçası olarak kullanma politikalarını sürdürmek istediği için kalem adının nedeni Guinness'in ısrarıydı.

T-testi istatistikleri genel olarak T = Z / s formunu izler; burada Z ve s, verilerin fonksiyonlarıdır. Z değişkeni alternatif hipoteze duyarlı olacak şekilde tasarlanmıştır; Z değişkeninin büyüklüğü, alternatif hipotez doğru olduğunda daha etkilidir. Bu arada 's', T'nin dağılımına izin veren bir ölçeklendirme parametresidir. Bir t-testinin altında yatan varsayımlar, a) Z, sıfır hipotez altında bir standart normal dağılıma uymaktadır; b) ps2 boş hipotez altında p serbestlik derecesine sahip bir Ï ‡ 2 dağılımı izler (burada p pozitif bir sabittir); ve c) Z değeri ve s değeri bağımsızdır. Belli bir t-test türünün bu koşulları, araştırılan popülasyondan ve verilerin örneklenme yönteminin sonuçlanndan kaynaklanır.

Öte yandan, varyans analizi (ANOVA), istatistiksel modellerin bir toplamıdır. ANOVA ilkeleri, araştırmacılar ve istatistikçiler tarafından uzun zamandan beri kullanılmasına rağmen 1918 yılına kadar Sir Ronald Fisher, "Mendel Kalıtım Varsayımları Üzerinde Akrabalar Arasındaki Korelasyon" başlığını taşıyan bir makalede varyans analizini resmileştirmek için bir öneri sundu.O zamandan beri, ANOVA kapsamı ve uygulaması genişletildi. ANOVA aslında yanlış bir addır, çünkü varyans farklılıklarından değil, daha çok gruplar arasındaki farklardan türemiştir. Belirli bir değişkende gözlemlenen varyansın, farklı varyasyon kaynaklarına atfedilebilen bileşenlere bölünmesiyle ilgili prosedürleri içerir.

Esasen, bir ANOVA, birkaç grubun ortalamalarının hepsinin eşit olup olmadığını belirlemek için istatistiksel bir test sağlar ve sonuç olarak t testi iki grubun üzerinde genelleme yapar. Bir ANOVA, iki hatalı bir t-testinden daha yararlı olabilir, çünkü bir tip I hatasını yerine getirme şansı azdır. Örneğin, birden fazla iki örneklemli t-testine sahip olmak, ortalamayı elde etmek için ilgili değişkenlerin ANOVA'sından daha büyük bir hata yapma şansına sahip olacaktır. Model aynıdır ve test istatistiği F oranıdır. Daha basit terimlerle, t-testleri ANOVA'nın özel bir örneğidir: ANOVA yapmak, çoklu t-testlerinin aynı sonucuna sahip olacaktır. ANOVA modellerinin üç sınıfı vardır: a) Verilerin normal popülasyondan geldiğini varsayan sabit efekt modelleri, yalnızca araçlarında farklıdır; b) Verileri varsayan rasgele etkiler modelleri, farklılıkları hiyerarşi tarafından kısıtlanan çeşitli nüfus hiyerarşisini tanımlamaktadır; ve c) Hem sabit hem de rasgele efektlerin mevcut olduğu karışık efekt modelleri.

Özet:

  1. İki test ortalaması veya ortalamanın aynı veya farklı olup olmadığını belirlemek için t-testi kullanılır. ANOVA, üç veya daha fazla ortalamayı veya aracı karşılaştırırken tercih edilir.
  2. Bir t-testinin, daha fazla araç kullanıldığında hata yapmaya daha fazla ihtimali var, bu nedenle iki veya daha fazla aracı karşılaştırırken ANOVA kullanılır.