Veri Madenciliği Final 1. Deneme Sınavı

Toplam 20 Soru
PAYLAŞ:

1.Soru

Bir veri yığınındaki düzensizliğin, rassallığın miktarını ölçmek için kullanılan ölçüye ne ad verilir?


Gini indeksi

Entropi indeksi

Sınıflandırma hatası indeksi

Twoing ölçüleri

En küçük kareler sapması yöntemi


2.Soru

Aşağıdakilerden hangisi veritabanı yönetim sisteminin özelliklerinden biri değildir?


Veritabanı oluşturmak

Veritabanının bakımını yapmak

Veritabanının farklı kullanıcı yetkilerini belirlemek

Veritabanını görselleştirmek

Veritabanında işlem yapmak


3.Soru

Belirlenen destek ve güven eşik değerleri üzerinde destek ve güven değerine sahip ilişki kuralına ne denir?


Güven eşik değeri

Destek eşik değeri

Güven

Destek

Güçlü kural 


4.Soru

Aşağıdakilerden hangisi karar ağaçlarının avantajlarından birisi değildir?


Açıklanmalarının kolay olması

İnsani karar almayı daha iyi yansıtması

Grafiksel olarak gösterilebilir olması

Uzmanlar tarafından kullanılmaları

Nitel değişkenleri de işleyebiliyor olmaları


5.Soru

Yeni bir kümenin oluşumunda K. ve L. kümelerin J. küme ile olan uzaklıkları toplamının yarısı olarak hesaplanan birleştirici kümeleme yöntemi hangisidir?


Ortalama Bağlantı Kümeleme Yöntemi 

McQuitty Bağlantı Kümeleme Yöntemi

Küresel Ortalama Bağlantı Kümeleme Yöntemi

Medyan Bağlantı Kümeleme Yöntemi 

Ward Bağlantı Kümeleme Yöntemi


6.Soru

Kümeleme analiz sonuçlarının sunulduğu grafiksel yöntemlerin adı nedir?


Dendrogram

Birim

McQuitty Bağlantısı

Ward Bağlantısı

Ayırıcı aşama 


7.Soru

Nitelik değerlerinin sola ve sağa olmak üzere iki bölüme ayrılması işlemi hangi indeks yoluyla yapılabilmektedir?


Gini indeksi

Entropi indeksi

Sınıflandırma hatası indeksi 

Twoing ölçüleri

En küçük kareler sağması yöntemi


8.Soru

Bir ürünle ilgili olarak; Çok kötü=0, Kötü=1, Orta=2, İyi=3, ve Çok iyi=4 olmak üzere değerlendirilme yapılmıştır ve sırasıyla Kötü ve Çok iyi olarak iki ürün tespit edilmiştir. Buna göre bu iki ürün arasındaki uzaklık değeri aşağıdakilerden hangisidir?


0

1

2

3

4


9.Soru

Web içerik madenciliğinde; bilgiye erişim yaklaşımı temeline dayanan, bilgiye erişimi çok daha kolay hâle getiren enstrüman hangisidir?


Sunucusu

Arama motorları

OLAP

Veri tabanı

HTML


10.Soru

Herhangi web sitesinin yapısal özetini, yani kendi içerisindeki sayfalarla ve di­ğer sitelerle olan bağlantı yapılarını elde ederek, bu yapılardan yararlı bilginin ortaya çıkarılmasına ne denir?


Veri Madenciliği

Web Madenciliği

Web Yapı Madenciliği

Web Görüş Madenciliği

Web Tarama Madenciliği


11.Soru

Yukarıda verilen bilgilere göre hangisi doğrudur?


1. Kümede toplam 6 ülke yer almaktadır.

2 .Kümede toplam 5 ülke yer almaktadır.

3 Kümede yer alan ülkeler Bosna Hersek, Nijerya, Slovenya, Brezilya ve Türkiye'dir.

4.kümede toplam 4 ülke yer almaktadır. 

Bir kümede en fazla bulunan ülke sayısı 4. kümedir.


12.Soru

Aşağıdakilerden hangisi kümeleme analizinin özellikleri arasında sayılamaz?


Tahmin amaçlı kullanılmaz

Varsayımlarda bulunmaz

Genellikle dört aşamada gerçekleşir.

Uygulama aşamasında çok fazla varsayıma ihtiyaç duyar

Çoklu bağıntıya dikkat ister


13.Soru

Aşamalı olmayan kümele yöntemleri için aşağıdaki ifadelerden hangisi yanlıştır?


Aşamalı olmayan kümelemede hem birimler hem de değişkenler birbirleriyle farklı benzerlik düzeylerinde kümeler oluşturur.

Aşamalı olmayan kümelemede birbirleri ile benzer birimlerin aynı kümede toplanması koşuluyla veri setindeki n birimin k sayıda kümeye ayrılması amaçlanmaktadır

Eğer oluşturulacak küme sayısı ile ilgili olarak önsel bir bilgi var ise aşamalı olmayan kümeleme yöntemleri kullanmak daha çok tercih edilmektedir

Aşamalı olmayan kümeleme yöntemleri büyük veri setleri için daha uygundur

Aşamalı olmayan kümeleme yöntemleri veri setinde bulunan aşırı uç değerlerden daha az etkilenmektedir.


14.Soru

Apriori algoritmasının 1. Adımının ilk aşaması aşağıdakilerden hangisidir?


L1 sık görülen nesne setleri kümesi elemanlarının ikili kombinasyonları alın- mak suretiyle birbirinden farklı tüm 2 adet nesne içeren nesne setleri oluşturulur. Ve oluşturulan bu nesne setlerinin destek değerleri hesaplanır.

Hesaplanan destek değerleri içerisinden destek eşik değeri olarak verilen 0,50 değerinin üzerinde destek değerine sahip nesne setlerinden bir nesneli sık görülen nesne kümesi L1 oluşturulur.

I nesneler kümesindeki 1 adet nesne içeren nesne setleri belirle- nir ve belirlenen her bir nesne seti için destek değerleri hesaplanır.

2 adet nesne içeren nesne setleri için hesaplanan destek değerleri içerisinden verilen destek eşik değeri 0,50 değerine eşit veya üzerinde destek değerine sahip nesne setlerinden iki nesneli sık görülen nesne setleri kümesi L2 oluşturulur.

Bu aşama giderek artan hesap yükünü azaltabilmek ve tekrar hesaplamalardan kaçınmak adına önceki aşamalarda elde edilen önsel bilgilerin değerlendirildiği aşamadır ve birleştirme ve budama adımlarından oluşur.


15.Soru

Beş değişken sonucunda R programının verdiği sonuçlar aşağıdaki gibidir. Verilen bilgilere ögre aşağıdakilerden hangisi doğru olur? (9. ve 10. soruyu verilen bilgilere göre cevaplayınız). 

    


Türkiye 1. kümededir.

5 küme oluşmuştur.

Potekiz 2. kümededir.

İyalya 2.kümededir.

Avusturya 1. kümededir.


16.Soru

A⇒B şeklinde ifade edilen bir ilişki kuralının Destek (A⇒B) destek değeri; |A|, tüm işlemler içerisinde A nesne setini içeren işlem sayısını; |D|, işlemler veritabanındaki tüm işlemlerin sayısını; |AB|, tüm işlemler içerisinde hem A hem de B nesne set­lerini birlikte içeren işlem sayısını ifade ederken, , aşağıdaki eşitliklerden hangisi ile hesaplanır?


Destek(A⇒B)=| AB | / | D |

Destek(A⇒B)=| D | / | AB |

Destek(A⇒B)= |A | * | B | / |AB|

Destek(A⇒B)=| AB | / | A | * | B |

Destek(A⇒B)=| AB | * | D |


17.Soru

Kullanıcıların belirli bir zaman aralığındaki farklı oturumları arasında bir birini takip eden kullanıcı hareketleri arasındaki ilişkilerinin or­taya konulmasına ne denir?


İstatiksel Analiz

İlişki Kuralları:

Sınıflandırma Analizi

Sıralı Örüntüler

Kümeleme Analizi


18.Soru

'Bir rassal değişkenin seçtiğimiz modele göre parametrelerinin yerine konulması ile elde edilen değer' olarak ifade edilen kavram aşağıdakilerden hangisidir?


kestirim

sınıflandırma

girdi

nitelik değerler

gruplandırma


19.Soru

Aşağıdakilerden hangisi karar ağacı oluşturma algoritmalarından birisi değildir?


CHAID

QUEST

NAIVE BAYESIAN

SLIQ

C4.5


20.Soru

aşağıdakilerden hangisi web madenciliği uygulama alanlarından biridir?


Bankacılık

Pazarlama

İmalat

Sağlık

E-öğrenme