Veri Madenciliği Final 2. Deneme Sınavı

Toplam 20 Soru
PAYLAŞ:

1.Soru

Bir kaydı, önceden tanımlanmış çeşitli sınıflardan birine atayan bir mo­delin uygulanması işlemi aşağıdakilerden hangisidir?


Sınıflandırma

Sınıf kestirimi

Sınıflayıcı

Karar problemi

Ayırıcı belirleme


2.Soru

> library(“arules”)

> verideğişkeni <- list(…)

> işlemdeğişkeni <- as(verideğişkeni, “transactions”)

> sonuçdeğişkeni <- apriori(işlemdeğişkeni, parameter = list(supp=destekdeğeri, conf=güvendeğeri, minlen=3))

> inspect(sonuçdeğişkeni)

Yukarıda verilen, ilişki kuralları belirleme amacıyla oluşturulmuş R komutları kümesinde liste şeklinde girilmiş olan işlem verilerinin aprio­ri() fonksiyonu ile işlenebilmesi için gereken veri dönüşümünün yapıldığı atama ko­mutu hangisidir?


> işlemdeğişkeni <- as(verideğişkeni, “transactions”)

> inspect(sonuçdeğişkeni)

> sonuçdeğişkeni <- apriori(işlemdeğişkeni, parameter = list(supp=destekdeğeri, conf=güvendeğeri, minlen=3))

> verideğişkeni <- list(…)

> library(“arules”)


3.Soru

Müşterilerin daha önceden yapmış oldukları alışverişlerinden oluşan veritabanından her bir alışverişinde birlikte almış olduğu ürünler arasındaki ilişkilerden yola çıkılarak müşterilerin alışveriş alışkanlıklarının belirlenmesi yöntemi aşağıdakilerden hangisidir?


Pazar sepeti analizi

Benzerlik ölçülerini belirleme

Uzaklık ölçülerini belirleme

Web madenciliği

Regresyon ağaçları


4.Soru

Karar ağaçlarında  her biri bir sınıfı temsil eden ve karar ağacının son bölümü olan düğüm aşağıdakilerden hangisidir?


Yaprak düğüm

Kök düğüm 

Son düğüm

İç düğüm

T düğümü


5.Soru

Aşağıdakilerden hangisi Kümeleme Analizinin bir aşaması değildir?


Ayırma kriterlerinin belirlenmesi

Veri matrisinin oluşturulması

Benzerlik veya uzaklık matrislerinin hesaplanması

Kümelemede esas alı­nacak yöntemlerin belirlenmesi

Elde edilen sonuçların yorumlanması


6.Soru

Çoğu teknikte olduğu gibi karar ağacı oluşturulurken de, veritabanının bir kısmı modeli oluşturmak için kullanılırken, kalan kısım ise oluşturulan modelin test edilebilmesi için ayrılır. Veriyi ikiye ayırmanın amacı, kullanılan karar ağacı algoritmasının ortaya çıkardığı sınıflandırmanın test için saklanan veri ile tekrar denenerek, elde edilen sonuçlar arasında anlamlı bir farklılık olup olmadığının tespit edilmesidir. Aşağıdakilerden hangisi bu amaca yönelik olarak kullanılan tekniklerden biri değildir?


Çapraz-doğrulama tekniği

Hold-out tekniği

Out-come tekniği

Tekrarlı hold-out tekniği

Bootstrap tekniği


7.Soru

"Bağlantıların ortaya çıkarılması ve bunun bir kural olarak değerlendirilmesi ilişki analizi ile mümkün olmaktadır."

Yukarıdaki ilişki analizine literatürde ne ad verilmektedir?


Veri tabanı

Pazar sepeti analizi

İlişki analizi

İlişki kuralları analizi

Veri analizi


8.Soru

Büyük veri kü­meleri içerisinde belirli veriler arasındaki ilişkileri bulan ve olayların birlikte gerçekleş­me ihtimallerini geçmiş verileri analiz edip ortaya koyarak geleceğe yönelik çalışmaları destekleyen veri madenciliği yöntemi aşağıdakilerden hangisidir?


İlişki kuralları

Karar ağaçları

Kümeleme analizi

Sosyal medya madenciliği

Benzerlik ve uzaklık ölçüleri


9.Soru

Aşağıdakilerden hangisi veri madenciliğinde kullanılan tanımlayıcı modellerden biridir?


Karar ağaçları

Tanımlayıcı istatistik

Zaman serisi analizi

Hatayı geri yayma

Bayes sınıflandırması


10.Soru

İlginç olarak nitelendirilen ve bilgi üretmek amacıyla kullanılacak bir ilişki kuralının belirlenebilmesi için kullanılan ilk ölçüt hangisidir?


Kaldıraç 

Güven 

Apriori Algoritması 

Destek

Destek eşik değeri 


11.Soru

10 nesneli bir set içerisinden bir nesnenin destek değeri ne olur?


0,01

0,4

0,3

0,1

0,2


12.Soru

'Problemde bulunan her bir nitelik için karar ağacında yer alan ve böylece niteliğin test edilmesini sağlayan' aşağıdakilerden hangisidir?


seçenek

düğüm

dal

sınıf

seviye


13.Soru

Seçeneklerden hangisi web verisinin özelliklerinden birisidir?


Veri miktarının küçük olması

Veri yapısının homojen olması

Durağan olması

Yapılandırılmış olması

Verilerin dağınık olması


14.Soru

"C¸eşitli istatistiksel analizler için oluşturulan farklı nesnelerin bir araya getirilmesinde ........... faydalanılır."

Aşağıdakilerden hangisi boş bırakılan yere getirilmesi gereken uygun kavramdır?


Matrix

Mantık fonksiyonları

List nesneleri

Temel komutlar

Length


15.Soru

I. Aşamalı kümeleme yöntemlerinden elde edilen dendrogramları inceleyerek karar
vermek,

II. Olasılıklı olarak başlangıç noktalarını rassal olarak belirlemek,

III. Farklı rastgele başlatma konfigürasyonları seçerek küme sayısını bulmak

Yularıdakilerden hangisi ya da hangileri küme sayısını belirlemek için kullanılan yaklaşımlardandır?


I-II-III

II-III

Yalnız -I

I-III

Yalnız II


16.Soru

Bir ilişki kuralında, destek ve güven değerleri ile O ilişki kuralına ilişkin ne ölçümlenebilir?


Nesneler Kümesi

İlginç ilişki kuralı

İlişki kuralının gücü

Nesne Seti

Nesne Veri Tabanı


17.Soru

aşağıdakilerden hangisi veri erişimi dönemine(1980) ilişkin kullanılan teknolojilerden biridir?


Veri ambarları

Çok büyük veritabanları

Gelişmiş algoritmalar

Veri ambarları

Yapı sorgu dili (SQL)


18.Soru

aşağıdakilerden hangisi veri madenciliği döneminde (2000) kullanılan tekniklerden biridir?


Manyetik bantlar

Diskler

 Çok boyutlu veritabanları

Devasa ölçekli veritabanı

Gelişmiş algoritmalar


19.Soru

Aşağıdakilerden hangisi veri madenciliği uygulama alanlarından değildir?


Bankacılık

İmalat

Sağlık

E-Devlet

Hukuk


20.Soru

m = 6 adet nesne içeren bir I = {a, b, c, d, e, f} nesneler kümesinden farklı nesne sayılarına sahip, oluşturulması mümkün tüm nesne setlerinin sayısı kaçtı?


60

61

62

63

64