Kategorisel veri analizi ki-kare testi
Ki-kare testi ( χ 2 ) İki değişken arasında bir ilişki olup olmadığının testi Örnek: Kişiliğin deprosyonla bir ilişkisi var mıdır, yoksa bu iki değişken birbirinden bağımsızmıdır. Depresif mi? evethayır Kişilikdışadönük1020 içedönük2010 Not: Değişkenler kategorik Her katılımcı sadece bir hücrede gözükür hücreler
VERİ TÜRLERİ Veri KantitatifKualitatif SüreksizSürekli
Kualitatif Veri 1. 1.Kualitatif random değişkenler sınıflanabilen yanıtlar vermektedir. Örnek: cinsiyet (Erkek, Kız) 2.Ölçüm kategorideki veri sayısını yansıtır 3.Nominal yada Ordinal ölçek
Hipotez testleri Kualitatif Veri Kualitatif Veri Z Testi 2 Testi Oran Bağımsız 1 pop. 2 Testi 2 pop. 2 pop.
Ki-kare ( 2 ) Testi k oranları için
Hipotez testleri Kualitatif Veri Kualitatif Veri Z Testi 2 Testi Oran Bağımsız 1 pop. 2 Testi 2 pop. 2 pop.
Ki-kare ( 2 ) Testi k Oranları için 1.Oranların sadece eşitliklerini test eder. Örnek: p 1 = 0.2, p 2 =0.3, p 3 = Bir kaç seviyeli bir değişken 3.Varsayımlar Multinomial Deney Beklenen sayı 5 4.Bir yönlü olasılık tablasunu kullanmakta
Multinomial Deneyler 1.n sayıda benzer deneme 2.Her bir denemede k sayıda sonuç 3.Sabit sonuç oranları, p k 4.Bağımsız denemeler 5.Random değişken sayıdır, n k 6. 6.Örnek; 100 (n) kişiye 3(k) adaydan hangisine oy vereceklerini sormak
Tek yönlü olasılık tablosu 1.k sayıda bağımsız grup içindeki (sonuçlar veya değişken seviyeleri) gözlem sayılarını gösterir
Tek yönlü olasılık tablosu 1. k sayıda bağımsız grup içindeki (sonuçlar veya değişken seviyeleri) gözlem sayılarını gösterir Sonuçlar (k = 3) Yanıt sayısı ADAY AliVeliAycanToplam
1 1.Hipotezler H 0 : p 1 = p 1,0, p 2 = p 2,0,..., p k = p k,0 H a : p i lar birbirine eşit değildir. 2 Testi,k sayıda oran için Hipotezler ve istatistik Hipotez edilen olasılık
1.Hipotezler H 0 : p 1 = p 1,0, p 2 = p 2,0,..., p k = p k,0 H a : p i lar birbirine eşit değildiler 2.Test istatistiği 2 Testi,k sayıda oran için Hipotezler ve istatistik Gözlemlenen sayı Beklenen sayı Hipotez edilen olasılık 2 2 nEn En ii i af af
1.Hipotezler H 0 : p 1 = p 1,0, p 2 = p 2,0,..., p k = p k,0 H a : p i lar birbirine eşit değildiler 2.Test istatistiği 2 Testi,k sayıda oran için Hipotezler ve istatistik Gözlemlenen sayı Beklenen sayı Hipotez edilen olasılık 2 2 nEn En ii i af af 3. Serbestlik derecesi, df= k-1 k, veri sayısı
2 Testi Ana fikiri 1.Null hipotezi doğru ise gözlemlenen sayıyla beklenen sayıyı karşılaştırır. 2.Gözlemlenen sayı nekadar beklenen sayıya yaklaşırsa null hipotezinin doğru olma olasılığı o kadar fazladır Beklenen sayıyla arasındaki farkın karesi ile ölçülür. Büyük değerler reddedilir.
Kritik değerin bulunması Örnek k = 3, ve =0,05 için kritik 2 değeri nedir
Kritik değerin bulunması Örnek k = 3, ve =0,05 için kritik 2 değeri nedir ? 2 Tablo
Kritik değerin bulunması Örnek = Tablo Eğer n i = E(n i ), 2 = 0 H 0 reddedilmez 2 0 Red Üst kuyruk alanı df0.995…0.95… …0.004… …0.103…5.991 k = 3, ve α =0,05 için kritik x 2 değeri nedir?
Finding Critical Value Example = Tablo df= k - 1 = 2 Eğer n i = E(n i ), 2 = 0. H 0 reddedilmez k = 3, ve α =0,05 için kritik x 2 değeri nedir? Red Üst kuyruk alanı df0.995…0.95… …0.004… …0.103…5.991
İnsan kaynakları müdürü olarak, 3 farklı performans değerlendirme metodunun dürüstlük anlayışını test etmek istemetedir. 180 tane çalışan arasından, 63 ü 1. Methodu dürüst olarak; 45 i 2. Methodu dürüst olarak; 72 si ise 3. Methodu dürüst olarak değerlendirmiştir risk derecesinde, çalışanların metodların dürüstlük derecesini algılamada bir farklılık varmıdır? 2 Testi, k oranları içn Örnek
H 0 : H a : = n 1 = n 2 = n 3 = Kritik değer(ler): Test istattiği: Karar: Sonuç: 2 0 Red
2 Testi, k oranları içn Örnek H 0 : p 1 = p 2 = p 3 = 1/3 H a : en az biri farklıdır = 0.05 n 1 = 63 n 2 = 45 n 3 = 72 Kritik değer(ler): Test istatistiği: Karar: Sonuç: = Red
2 Testi, k oranları için Çözüm a f
H 0 : p 1 = p 2 = p 3 = 1/3 H a : en az biri farklıdır = 0.05 n 1 = 63 n 2 = 45 n 3 = 72 Kritik değer(ler): Test istatistiği: Karar: Sonuç: Null hipotezi reddedilir, =.05 Oranlar arasında bir farklılık olduğu delili mevcuttur. =.05 2 = Red
2 Testi, bağımsız
1.İki kualitatif değişken arasında bir ilişkinin mevcut olup olmadığını gösterir Bir örnek seçilir Sebeb sonuç ilişkisi göstermez 2.Varsayımlar Multinomial deney tüm sayılar 5 3.Çift yönlü olasılık tablosu kullanır
2 Test 2. değişken derecesi 1. değiken derecesi Ev lokasyonu Ev stiliŞehirKırsalToplam Apartman Çiflik Toplam
2 Testi, bağımsız Hipotezler & İstatistik 1.Hipotezler H 0 : Değişkenler bağımsız H a : Değişkenler birbiriyle ilişkili (Bağımlı) 2.Test İstatistiği Serbestlik derecesi: (r - 1)(c - 1) Satırlar Sütünlar Gözlenen sayı Beklenen sayı
2 Testi, bağımsız beklenen sayılar 1.İstatiksel olarak bağımsız demek, birleşik olasığın marjinal olasılıklarının çarpımına eşit olduğu analamına gelmektedir. 2.Marjinal olasılıklar hesaplanır ve birleşik olasılık hesabı için çarpılır 3. Beklenen sayı= veri sayısı x birleşik olasılığa eşittir.
Beklenen sayıhesaplaması Beklenensayı= Satır toplamSütün toplam Veri sayısı af *
Testi, bağımsız Örnek Diet Pepsi HayırEvet Diet Kola Gözl. Toplam Hayır Evet Toplam Birleşik olasılık = Marjinal olasılık Beklenen sayı = 286· =53.5
Pazarlama araştırması yapan bir analistsiniz.Rastgele seçtiğiniz 286 müşteri üzerinde yapacağınız araştırmada, müşterilere diet pepsi mi yada diet kola mı satın alıdıklarını soruyorsunuz.α=0.05 risk derecesinde,ikisi arasında bir ilişki olduğuna dair delil varmıdır? 2 Testi, bağımsız Örnek Diet Pepsi Diet KolaHayır EvetToplam Hayır Evet Toplam
2 Testi, bağımsız Çözüm H 0 : ilişki yok H a : ilişkili = 0.05 df = (2 - 1)(2 - 1) = 1 Kritik değer(ler): = Red
E(n ij ) 5 tüm hücrelerde 170· · · · Testi, bağımsız Çözüm Diet Pepsi HayırEvet Diet KolaGözl.Bekl.Gözl.Bekl.Toplam Hayır Evet Toplam
2 Testi, bağımsız Çözüm
H 0 : ilişki yok H a : ilişki var = 0.05 df = (2 - 1)(2 - 1) = 1 Kritik değer(ler): Test istatistiği: Karar: Sonuç: Null hipotezi reddedilir =0.05 Bir ilişki olduğuna dair delil var =.05 2 = Red