VERİ MADENCİLİĞİ Dersi Kümeleme Analizi soru detayı:

PAYLAŞ:

SORU:

k-ortalamalar yöntemi ile küme sayısını belirlemek için kullanılabilecek yaklaşımlar nelerdir?


CEVAP:

Birimlerin k-ortalamalar yöntemi ile kümelenmesi için uzaklık matrisi ya da benzerlik matrisi hesaplamak gerekmemektedir. Verilerin kümelenmesinde kullanılacak olan küme sayısını önceden belirlemek yeterlidir. Küme sayısını belirlemek için ise farklı yaklaşımlar bulunmaktadır. Bunlar;

  • Aşamalı kümeleme yöntemlerinden elde edilen dendrogramları inceleyerek karar vermek,
  • Olasılıklı olarak başlangıç noktalarını rassal olarak belirlemek,
  • Ardışık olarak (Küme sayısı 2, 3, 4, ..., k biçiminde) her seferinde küme sayısını bir artırarak oluşan kümelemede birimlerin hangi kümeye ait olduğuna ilişkin küme üyeliklerini belirlemek. Yeni veri yapısına Ayırma (Discriminant) Analizi uygulamak ve en yüksek önemliliği bulunan Wilk’s Lamda değerine sahip olan küme sayısını, uygun kümeleme olarak kabul etmek,
  • İlk nb birimin değişkenlere ait ortalamalarını başlangıç ortalama vektörü olarak ele alıp birimleri bu kümelere atama yaklaşımlarından birini seçmek,
  • Farklı rastgele başlatma konfigürasyonları seçerek küme sayısını bulmak, mümkündür.