Veri Madenciliği Final 3. Deneme Sınavı

Toplam 20 Soru
PAYLAŞ:

1.Soru

Küresel ortalama ve medyan bağlantı kümeleme yöntemlerinin karma şekli hangi kümeleme yöntemidir?


Tek Bağlantı Kümeleme Yöntemi

McQuitty Bağlantı Kümeleme Yöntemi

Ward Bağlantı Kümeleme Yöntemi

Tam Bağlantı Kümeleme Yöntemi

k-ortalamalar Yöntemi


2.Soru

Bir alışveriş veritabanından oluşturulacak ilişki kuralları arasından işe yarayacak bilgiyi üretmek amacıyla kullanılacak ilişki kuralına ne denir?


Veri madenciliği

Pazar sepeti analizi

İlişki kuralları

İlginç kural

Enteresan kural


3.Soru

Bir banka müşteri veritabanında yer alan müşterilerin kredi riskleri kümesi R={iyi, kötü, kötü, iyi, iyi, kötü, iyi, iyi, kötü, iyi} olarak verilmiş olsun. Buna göre C1 iyi sonucunu, C2 kötü sonucunu temsil etmek üzere, risk niteliğinin olasılık dağılımı aşağıdakilerden hangisidir?


PR={6/10, 4/10}

PR={4/10, 6/10}

PR={10/6, 10/4}

PR={10/4, 10/6}

PR={6/100, 4/100}


4.Soru

Veri setine ilişkin uzaklık matrisini bulmak için aşağıda verilen komutlardan hangisi kullanılır?


>table(x$Ülke,results$cluster)

>plot(h,labels=x$Ülke)

>results$size

>x=read.csv(“c:/ulkeler.txt”)

ist.x=dist(x,method=”euclidean”)


5.Soru

Seçeneklerden hangisi web madencilğinin uygulama alanlarından birisidir?


Bankacılık

Pazarlama

Hukuk

Sigorta

Güvenlik soruşturması


6.Soru

aşağıdakilerden hangisi veri madenciliği sürecine ilişkin adımlardan biri değildir?


Verinin elde edilmesi

Verinin saklanması ve yönetim

Veri erişiminin sağlanması

Verinin analiz edilmesi

verilerin sosyal ağlarda tartışılması


7.Soru

'En basit karar ağacı oluşturma algoritmasıdır ve ayırma kriteri olarak kazanç ölçütünden yararlanılmaktadır' olarak tanımlanan algoritma aşağıdakilerden hangisinde doğru verilmiştir?


C4.5

CART

CHAID

ID3 

QUEST


8.Soru

Karar ağacı ile sınıflandırma sonucu iki küme oluşmuştur. Birinci kümenin olasılığı 0.57 ise, ikinci kümenin olasılığı kaçtır?


0.57

0.33

0.27

0.43

1


9.Soru

Aşağıdakilerden hangisi K-Ortalamalar Kümeleme Yönteminde küme sayısını belirlemek için kullanılan yaklaşımlardan biri değildir?


Kümenin en küçük ve en büyük değeri arasındaki farkı eşit aralığa bölmek

Aşamalı kümeleme yöntemlerinden elde edilen dendrogramları inceleyerek karar vermek,

Olasılıklı olarak başlangıç noktalarını rassal olarak belirlemek,

İlk nb birimin değişkenlere ait ortalamalarını başlangıç ortalama vektörü olarak ele alıp birimleri bu kümelere atama yaklaşımlarından birini seçmek,

Farklı rastgele başlatma konfigürasyonları seçerek küme sayısını bulmak,


10.Soru

Aşağıdakilerden hangisi veri dönüştürme işlemlerinden birisi değildir?


Düzeltme

Bir araya getirme

Genelleme

Özellik oluşturma

Veri küpü birleştirme


11.Soru

R'ye excel verisi aktarımı hangi komut yardımıyla yapılmaktadır?


dim()

head()

read.csv()

help()

library()


12.Soru

Bir rassal değişkenin seçtiğimiz modele göre parametrelerinin yerine konulması ile elde edilen değere ne denir?


Kestirim

Parametre

Örnekleme

İndeks

seçim


13.Soru

Bir alışveriş veritabanından oluşturulacak ilişki kuralları içerisinden işe yarayacak bilgiyi üretmek amacıyla kullanılacak ilişki kuralına ne denir?


Destek ölçütü kuralı

Güven ölçütü kuralı

İlk ölçüt kuralı

İlginç kural

Sonuç kural


14.Soru

Aşağıdakilerden hangisi aşamalı olmayan kümeleme yöntemleri arasındadır?


 Ortalama Bağlantı Kümeleme Yöntemi

k-Medoidler Kümeleme Yöntemi

Tam Bağlantı Kümeleme Yöntemi

McQuitty Bağlantı Kümeleme Yöntemi

Tek Bağlantı Kümeleme Yöntemi


15.Soru

Veri seti içerisinde yer alan kayıtların birbiriyle olan ilişkilerini inceleyerek, hangi olayların eş zamanlı olarak birlikte gerçekleşebileceklerini ortaya koymaya çalışan veri madenciliği yöntemleri seçeneklerden hangisidir?


Sınıflandırma

Karar ağaçları

Kümeleme analizi

Lojistik regresyon

Birliktelik kuralları


16.Soru

Sınıflandırma problemlerinde bir karar ağacının oluşturulması için farklı algoritmalardan yararlanılabilir. Aşağıdakilerden hangisi bu algoritmalardan biri değildir?  


QUEST

SLIQ

C4.5

ID3

ARENA


17.Soru

Tam bağlantı kümeleme yönteminde uzaklıklar aşağıdaki hangi eşitlikle hesaplanmaktadır?


dmj=min (dkj, dlj)

dmj=maks (dkj, dlj)

dmj= (Nkdkj + Nldlj)/Nm

dmj= (dkj + dlj)/2

dmj= (Nkdkj + Nldlj)/Nm- NkNldk1/N2m


18.Soru

R dilinde yazılmış olan aşağıdaki kullanıcı tanımlı fonksiyon dikkate alındığından aşağıdaki seçeneklerden hangisindeki ifade doğru değildir?

> ozetle<-function(veri)

{ # BU FONKSİYON VERİNİN ÖZETLEYİCİ İSTATİSTİKLERİNİ HESAPLAR VE GÖRÜNTÜLER

+ozet<-summary(veri)

+sapma<-var(veri)

+return(ozet,sapma)

+}


Fonksiyonun dışarıdan verilen parametresi “ozet” değişkeninde tutulmaktadır.

Fonksiyonun dışarıdan verilen parametresi “veri” değişkeninde tutulmaktadır.

Fonksiyon “ozet” ve “sapma” değerlerini döndürmektedir.

Fonksiyon “veri” değeri üzerinde “summary” ve “var” işlemlerini gerçekleştirmektedir.

Fonksiyonun adı “özetle” dir.


19.Soru

Birleştirici kümeleme yöntemlerinde ortalamalar üzerinden yapılan kümeleme yöntemleri düşünüldüğünde hangisi dışarıda kalır?


Ortalama Bağlantı Kümeleme Yöntemi

Küresel Ortalama Bağlantı Kümeleme Yöntemi

McQuitty Bağlantı Kümeleme Yöntemi

Medyan Bağlantı Kümeleme Yöntemi

Tek Bağlantı Kümeleme Yöntemi


20.Soru

Aşağıdakilerden hangisi veya hangileri nitel verilerde kullanılan ayırma kriteri belirleme metotlarından biridir?

I-Entropi indeksi
II-Twoing indeksi
III-En Küçük Kareler Sapması yöntemi


I

I-II

I-III

III

I-II-III