Veri Madenciliği Final 4. Deneme Sınavı

Toplam 20 Soru
PAYLAŞ:

1.Soru

Kaldıraç({A} ? {B}) =Güven({A} ? {B})/Destek{B} = 0,70/0,50  = 1,40 ifadesi için hangi yorum doğru olur?


B olduğunda  A' da olma olasılığı , sadece A olma olasılığından  %40 daha fazladır.

A olduğunda  B' de olma olasılığı , sadece B olma olasılığından  %40 daha fazladır.

A olduğunda  B' de olma olasılığı , sadece A olma olasılığından  %40 daha fazladır.

B olduğunda  A' da olma olasılığı , sadece A olma olasılığından  %40 daha fazladır.

A olduğunda  B' de olma olasılığı , sadece B olma olasılığından  %140 daha fazladır.


2.Soru

Aşağıdakilerden hangisi veya hangileri birleştirici aşamalı kümeleme yöntemlerindendir?

I. Tek bağlantı kümeleme yöntemi

II. Ortalama bağlantı kümeleme yöntemi

III. k-ortalamalar yöntemi


Yalnız I

Yalnız II

II ve III

I ve II

I, II ve III


3.Soru

Aşağıdakilerden hangisi 'ikili bölünmeye dayanan bir tekniktir ve hesaplanmasında nitelik değerlerinin sola ve sağa olmak üzere iki bölüme ayrılması işlemi' yürütülür?


entropi

statü niteliği

gini indeksi

ikili (binary) ayırma

kazanç oranı ölçütü


4.Soru

  1. Veri ön işleme
  2. Örüntü keşfi
  3. Örüntü analizi

İşlenmiş veriden önemli ve anlamlı bilgiyi ortaya çıkarabilmek adına istatistiksel analiz, ilişki kuralları, sınıflandırma analizi, kümeleme analizi. gibi veri madenciliği teknikleri kullanılması yukarıda verilen veri kullanım aşamalarının hangisi/hangileridir


I

II

III

II VE III

III


5.Soru

> x=read.csv(“c:/ulkeler.txt”)

> dist.x=dist(x,method=”euclidean”)

> dist.x

> h=hclust(dist.x,method=”single”)

> h

> clusters=cutree(h, k=3)

> clusters

> plot(h,labels=x$Ulke)

> rect.hclust(h, K=3)

Yukarıda Öklid Uzaklık Matrisi ile Tek Bağlantı Kümeleme Analizi işlemi gerçekleştiren R komut kümesinde kümeleme dendrogramını görüntüleyen komut satırı hangisidir?


> plot(h,labels=x$Ulke)

> clusters

> h$merge

> dist.x

> h


6.Soru

Aşağıdakilerden hangisi veri madenciliğinin uygulama ve kullanım sürecinde dezavantajlarından değildir?


Gizlilik sorunları

Güvenlik sorunları

URL’ler izlenerek veriye erişile bilinmesi

Bilginin kötüye kullanımı

Eksik bilgilendirmeler


7.Soru

Aşağıdakilerden hangisi yanlıştır?


Veri ambarında yer alan verilen üzerinde çok boyutlu, çok yönlü analiz ve sorgulama yapılmasını sağlayan sistemlerdir. 

Büyük miktardaki veri yığınları üzerinde analiz yaparak veriler arasında var olan ve geleceğin tahmin edilmesine yardımcı olacak anlamlı ve yararlı ilişki ve kuralların bilgisayar yazılımları aracılığıyla aranması faaliyetleridir.

Çeşitli analiz araçlarını kullanarak veriler arasındaki örüntü ve ilişkileri keşfederek bunları doğru tahminler yapmak için kullanan bir süreçtir. 

Veri analizi için gelişmiş ve karmaşık araçlar kullanarak yığın veri kümeleri içinden daha önceden bilinmeyen olgu ve olayları keşfetmek ve veriler arasındaki mantıklı ilişkileri ve kalıpları ortaya çıkarmak amacıyla yapılan çalışmalardır. 

İstatistiksel ve matematiksel tekniklerle birlikte örüntü tanıma teknolojilerini kullanarak çeşitli depolama ortamlarında kayıtlı bulunan veri yığınları üzerinde gerçekleştirilen elemeler sonucunda anlamlı yeni korelasyon, örüntü ve eğilimlerin keşfedilmesi sürecidir. 


8.Soru

R yazılımı ile ilgili olarak aşağıda verilen İfadelerden hangisi veya hangileri doğrudur?

I-R yazılımı büyük ve küçük harfe duyarlıdır.

II-R yazılımında vektör oluşturmak için c() fonksiyonu kullanılır.

III-Önceden tanımlanmış bir vektörün birim sayısını öğrenmek için length () fonksiyonu kullanılır.

IV-c() fonksiyonu karakter değişkenleri oluşturmak için kullanılır.


I-II-III-IV

Yanlız IV

II-III

II-III-IV

Yanlız I


9.Soru

Aşağıda verilen veri madenciliği uygulama konularından hangisi, eğitim alanında yapılan veri madenciliği uygulama konularından değildir?


Öğrenci verilerinin analiz edilmesi

 

Öğrenci başarı ve başarısızlık nedenlerinin tespit edilmesi

Üretim süreçlerinin kontrol edilmesi ve tespit edilmesi

Eğitim-öğretim ortamlarındaki aksaklıkların tespit edilmesi

Daha etkili eğitim-öğretim ortamlarının oluşturulması


10.Soru

Seçeneklerden hangisi günümüzde kullanılmakta olan sosyal medya hizmetlerini temel sınıflandırmasına dahil edilemez?


Arkadaş tabanlı

Bilgilendirici

Mesleki

Eğitim

Kötüye kullanma


11.Soru

Ahmet'in yöneylem dersinden aldığı not 65 ve karar kuramı dersinden aldığı not 80 iken Mehmet'in aldığı notlar sırasıyla 50 ve 90'dır.  Ayrıca yöneylem dersi varyansı   ve karar kuramı dersi varyansı  olduğu varsayıldığında Ahmet ile Mehmet arasındaki Karl Pearson uzaklığı kaçtır?


2,75

3,97

4,53

0,85

3,28


12.Soru

Hangi karar ağacının büyümesini durdurma kriteri, ayrılacak olan kayıtların sayısının belirli bir eşiğin altına düşmesi durumudur?


ID3

CART

CHAID

C4.5

SLIQ


13.Soru

Aşağıdakilerden hangisi nitel verilerin ayırma kriterleri için kullanılan indekslerden birisi değildir?


Entropi indeksi

Gini indeksi

Sınıflandırma hatası indeksi

Twoing ölçüleri

En küçük kareler sapması yöntemi


14.Soru

Benzerlik ve uzaklık değerleri ile ilgili olarak aşağıdakilerden hangisi doğrudur?


İki nesne arasındaki yüksek benzerlik değeri nesnelerin benzer olduklarını, yüksek uzaklık değeri ise nesnelerin benzer olmadıklarını ifade eder.

İki nesne arasındaki yüksek benzerlik değeri nesnelerin ayrık olduklarını, yüksek uzaklık değeri ise nesnelerin benzer olduklarını ifade eder.

Niteliksel olarak benzer olduklarını niceliksel olarak ayrık olduklarını ifade eder.

İki nesne arasındaki yüksek benzerlik değeri nesnelerin benzer olmadıklarını, yüksek uzaklık değeri ise nesnelerin benzer olduklarını ifade eder.

Niceliksel olarak benzer olduklarını niteliksel olarak ayrık olduklarını ifade eder.


15.Soru

Küresel ortalama ve medyan bağlantı kümeleme yöntemlerinin karma şekli olan ve küme içi varyansın minimum olduğu kümelerin belirlenip bu doğrultuda kümeleme işleminin yapıldığı birleştirici kümeleme yöntemi hangisidir?


Ortalama Bağlantı Kümeleme Yöntemi

McQuitty Bağlantı Kümeleme Yöntemi 

Tam Bağlantı Kümeleme Yöntemi 

Tek Bağlantı Kümeleme Yöntemi 

Ward Bağlantı Kümeleme Yöntemi


16.Soru

I. Daha önceden keşfedilmemiş,

II. Eyleme dönük, bir başka ifadeyle uygulanabilir,

III. Subjektif bir karar olabilir.

 Yukarıdaki ifadelerden hangisi ya da hangileri ilginç kuralın özellikleri arasında sayılabilir?


I-II

I-III

II-III

I-II-III

Yalnız II


17.Soru

"Büyük hacimli verilerin işlenmesi için geliştirilmiş algoritmalar ile geleneksel veri analiz yöntemlerinin karması olan teknolojiye ........... denir."

Yukarıdaki cümlede boş bırakılan yere uygun olan kavram hangisidir?


Veri analizi

Veri madenciliği

Veri modeli

Veri toplama

Veri inceleme


18.Soru

En yaygın olarak kullanılan uzaklık ölçüleri aşağıdakilerden hangisidir?


Lewinstein Uzaklık Ölçüsü

Öklid ve Karesel Öklid Uzaklık Ölçüleri

 Manhattan Uzaklığk Ölçüsü

Mahalanobis Uzaklık Ölçüsü

 Korelasyon Uzaklık Ölçüsü


19.Soru

Hesaplanan bir kaldıraç değerinin (A?B) = 0,70 olması durumunda aşağıdaki yorumlardan hangisi yapılabilir?


A ve B nesneleri arasındaki ilişkinin negatif olduğu

A ve B nesneleri arasındaki ilişkinin zayıf olduğu

A ve B nesneleri arasında bir ilişkinin olmadığı

A ve B nesneleri arasındaki ilişkinin güçlü olduğu

A ve B nesneleri arasındaki ilişkinin pozitif olduğu


20.Soru

R ile sınıflandırma ve regresyon ağacı oluşturabilmek için hangi paketinin R’de kurulu olması gerekmektedir?


data.frame

rpart

click

treeg

svrt