Veri Madenciliği Deneme Sınavı Sorusu #925285

Veri ambarlarında aykırı veriyi bulma ve düzeltme için, verilerdeki gürültünün temizlenmesi yaklaşımlarından hangisi kullanılır?


 Bölümleme yöntemi yaklaşımı

Sınır değerleri yaklaşımı

Kümeleme yöntemi yaklaşımı

Regresyon yöntemiyle yaklaşımı

Ayıklama yöntemi yaklaşımı


Yanıt Açıklaması:

Kümeleme yöntemi yaklaşımı: aykırı değerlerin ortaya çıkarılması ve düzeltilmesinde kullanılır. Buna göre, veri setinde yer alan veriler birbirlerine olan benzerlik ve yakınlıklarına göre kümelere ayrılır. Bu kümeleme işlemi sırasında uç değer olarak kabul edilen bazı veriler hiçbir küme içinde yer alamayacaktır. Bu şekilde belirlenen her bir aykırı değere, en yakın olduğu kümenin ortalama değeri veya en küçük ya da en büyük değeri atanarak aykırı veriler temizlenmiş olur.

Yorumlar
  • 0 Yorum