VERİ MADENCİLİĞİ Dersi Benzerlik ve Uzaklık Ölçüleri soru detayı:
SORU:
Sıralayıcı nitelik bakımından iki nesnenin karşılaştırılması gerektiğinde nasıl bir uzaklık değeri kullanılabilir?
CEVAP:
Sıralayıcı nitelik bakımından iki nesne karşılaştırıldığında durum biraz daha karmaşıklaşır. Örneğin bir araştırmada üretilen bir ürünün kalitesinin {kötü, zayıf, orta, iyi, mükemmel} olarak değerlendirildiğini varsayalım. Bu şekilde nitelendirilen iki ürünün benzerliklerini ölçmek için ilk olarak niteliğin her bir sonucuna 0 veya 1’den başlamak suretiyle {kötü = 0, zayıf = 1, orta = 2, iyi = 3, mükemmel = 4} şeklinde tamsayı değerler atanır. İlgilenilen niteliğin ortaya çıkış biçimleri bu şekilde tam sayı değerlerle ifade edildikten sonra, nesneler arası uzaklık değeri
d(x, y) = |x – y|
eşitliği yardımıyla elde edilir. Elde edilen uzaklık değeri [0,1] aralığında değer alacak biçimde dönüştürülmek istendiğinde ise
d(x, y) = |x – y| / (n –1)
eşitliği kullanılır. Eşitlikte n, niteliğin ortaya çıktığı sonuç sayısıdır. Dönüşümler konusunda ele alındığı üzere, uzaklık değeri yardımıyla benzerlik değeri
s(x, y) = 1 – d
eşitliği yardımıyla hesaplanır.