VERİ MADENCİLİĞİ Dersi Benzerlik ve Uzaklık Ölçüleri soru detayı:

PAYLAŞ:

SORU:

İki sonuçlu (binary) değişkenler için kullanılan yakınlık ölçülerinde neden kontenjans tablosu oluşturulmaktadır?


CEVAP:

Bu ölçüler temel olarak eşleştirmeye dayanan ölçüler olduklarından, hesaplama yapmadan önce kontenjans ya da diğer adıyla çapraz sınıflama tablosunun oluşturulması gerekir. İki yönlü sınıflama tablosu olarak da adlandırılan kontenjans tablosu, iki sonuçlu değişkenler içeren nesne çiftinin karşılıklı eşleşen değerlerinin tekrar sayılarından oluşan tablodur. Kontenjans tablosunda herhangi bir değişkenin varlığı “1” ya da “+” ile, yokluğu ise “0” ya da “–” ile gösterilir. Buna göre iki sonuçlu nesne çifti için düzenlenen kontenjans tablosu (S: 93, Tablo 4.5)’de verilmiştir. Burada,

a değeri: i ve j nesnelerinin her ikisinde de ilgilenilen değişkenin olmadığı yani yok olduğu durum (0-0 eşleşmesi) sayısını,

b değeri: ilgilenilen değişkenin i nesnesinde var olduğu ve j nesnesinde olmadığı durum (1-0 eşleşmesi) sayısını,

c değeri: ilgilenilen değişkenin i nesnesinde olmadığı ve j nesnesinde var olduğu durum (0-1 eşleşmesi) sayısını,

d değeri: i ve j nesnelerinin her ikisinde de ilgilenilen değişkenin var olduğu durum (1-1 eşleşmesi) sayısını,

p değeri: değişken sayısını göstermektedir.