Veri Madenciliği Deneme Sınavı Sorusu #940488

Aşağıdakilerden hangisi K-Ortalamalar Kümeleme Yönteminde küme sayısını belirlemek için kullanılan yaklaşımlardan biri değildir?


Kümenin en küçük ve en büyük değeri arasındaki farkı eşit aralığa bölmek

Aşamalı kümeleme yöntemlerinden elde edilen dendrogramları inceleyerek karar vermek,

Olasılıklı olarak başlangıç noktalarını rassal olarak belirlemek,

İlk nb birimin değişkenlere ait ortalamalarını başlangıç ortalama vektörü olarak ele alıp birimleri bu kümelere atama yaklaşımlarından birini seçmek,

Farklı rastgele başlatma konfigürasyonları seçerek küme sayısını bulmak,


Yanıt Açıklaması:

K-Ortalamalar Kümeleme Yöntemi sadece birimleri kümelemekte kullanılan bir yöntemdir.

Birimlerin k-ortalamalar yöntemi ile kümelenmesi için uzaklık matrisi ya da benzerlik matrisi hesaplamak gerekmemektedir. Verilerin kümelenmesinde kullanılacak olan küme sayısını önceden belirlemek yeterlidir. Küme sayısını belirlemek için ise farklı yaklaşımlar bulunmaktadır. Bunlar;

Aşamalı kümeleme yöntemlerinden elde edilen dendrogramları inceleyerek karar vermek,

Olasılıklı olarak başlangıç noktalarını rassal olarak belirlemek,

Ardışık olarak (Küme sayısı 2, 3, 4, ..., k biçiminde) her seferinde küme sayısını bir artırarak oluşan kümelemede birimlerin hangi kümeye ait olduğuna ilişkin küme üyeliklerini belirlemek. Yeni veri yapısına Ayırma (Discriminant) Analizi uygulamak ve en yüksek önemliliği bulunan Wilk’s Lamda değerine sahip olan küme sayısını, uygun kümeleme olarak kabul etmek,

İlk nb birimin değişkenlere ait ortalamalarını başlangıç ortalama vektörü olarak ele alıp birimleri bu kümelere atama yaklaşımlarından birini seçmek,

Farklı rastgele başlatma konfigürasyonları seçerek küme sayısını bulmak,

Bu nedenle doğru yanıt a) seçeneğidir

Yorumlar
  • 0 Yorum