Veri Madenciliği Ara 2. Deneme Sınavı

Toplam 20 Soru
PAYLAŞ:

1.Soru

Aşağıdakilerden hangisi veri hazırlama süreçlerinden değildir?


Veri toplama

Veri temizleme

Veri dönüştürme

Veri birleştirme

Veri indirgeme


2.Soru

Aşağıdakilerden hangisi veri indirgeme yöntemlerinden değildir?


Veri küpü birleştirme

Boyut indirgeme

Gürültü indirgeme

Büyük sayıların indirgenmesi

Veri sıkıştırma


3.Soru

Aşağıdakilerden hangisi temel değişken tiplerinden değildir?


İkili Değişkenler

Sıra Gösteren Değişkenler

Normalleştirilmiş Değişkenler

İsimsel Değişkenler

Aralıklı Ölçümlendirilmiş Değişkenler


4.Soru

Veri tabanlarında bilgi keşfi sürecinin en fazla zaman alan aşaması aşağıdakilerden hangisidir?


Amacın tanımlanması

Veriler üzerinde ön işlemlerin yapılması

Modelin kurulması ve değerlendirilmesi

Modelin kullanılması ve yorumlanması

Modelin izlenmesi


5.Soru

  • L1 norm olarak da bilinir
  • Minkowski uzaklığının özel bir halidir.
  • Aykırı değerlere karşı hassasiyeti düşüktür.

Yukarıda özellikleri verilen uzaklık ölçüsü aşağıdakilerden hangisidir?


Manhattan uzaklığı

Karl Pearson uzaklığı

Öklid uzaklığı

Mahalanobis uzaklığı

Jaccard uzaklığı


6.Soru

Aşağıdakilerden hangisi iki sonuçlu değişkenler için kullanılan yakınlık ölçülerinden birisidir?


Karl Pearson uzaklığı

Manhattan uzaklığı

Minkowski uzaklığı

Açısal benzerlik

Jaccard uzaklığı


7.Soru

Veri madenciliğine etki eden disiplinler düşünüldüğünde verilerin tablo ve grafikler ile sunulmasını sağlayan disiplin seçeneklerden hangisidir?


Makine öğrenimi

İstatistik

Görselleştirme

Örüntü tanıma

Veritabanı sistemleri


8.Soru

R yazılımında bir matrisin (Örneğin, matris2 isimli bir matrisin) kendi evriği ile matris çarpımı aşağıdaki komutlardan hangisi ile elde edilebilir?


> matris2 %*% t(matris2)

> matris2 * t(matris2)

> matris2 %+% t(matris2)

> t(matris2) %*% matris2

> t(matris2) * matris2


9.Soru

R yazılımında veri seti içerisindeki faktör listeleri ve gözlem birimlerini bir araya getirmek için aşağıdakilerden hangisi kullanılır?


data.frame

list

matris

c()

seq


10.Soru

Aşağıda verilen ve veri madenciliğinde kullanılan modellerden hangisi, sınıflandırma modelleri arasında yer almaz?


Sıra Örüntü Analizi

Karar Ağaçları

Hatayı Geri Yayma

Yapay Sinir Ağları

Zaman Serisi Analizi


11.Soru

Düşük düzeydeki verinin kavram hiyerarşisi kullanılarak daha yüksek seviyeye dönüştürülmesi işlemine ne ad verilir?


Düzeltme

Bir araya getirme

Genelleme

Özellik oluşturma

Standartlaştırma


12.Soru

3x3 tipinde x ve y gibi iki kare matris çarpımı yapabilmek için ilgili satıra aşağıdakilerden hangisi yazılmalıdır?


x*y

x3**y3

x&*y

x%*%y

x.y


13.Soru

R yazılımında

> matrix(c(6,5,4,3,2,1,1,2,3,4,5,6),ncol=2)

Komutu ile oluşturulan matrisin görünümü aşağıdakilerden hangisi olacaktır?


[,1] [,2]

[1,] 6 1

[2,] 5 2

[3,] 4 3

[4,] 3 4

[5,] 2 5

[6,] 1 6

[,1] [,2]

[1,] 1 1

[2,] 2 2

[3,] 3 3

[4,] 4 4

[5,] 5 5

[6,] 6 6

[,1] [,2]

[1,] 1 6

[2,] 2 5

[3,] 3 4

[4,] 4 3

[5,] 5 2

[6,] 6 1

[,1] [,2]

[1,] 6 6

[2,] 5 5

[3,] 4 4

[4,] 3 3

[5,] 2 2

[6,] 1 1

[,1] [,2]

[1,] 1 4

[2,] 2 5

[3,] 3 6

[4,] 3 6

[5,] 2 5

[6,] 1 4


14.Soru

I. Yatay düzlem veri modeli

II. Hiyerarşik veri modeli

III. Perseptron veri modeli

IV. Ağ veri modeli

Yukarıdakilerden hangileri ilk veri modellerindendir?


Yalnız I

I ve II

I ve III

II ve IV

Yalnız III


15.Soru

Aşağıdakilerden hangisinde R yazılımın hangi görev için kullanıldığı doğru verilmiştir?


R yazılımının bir veri işleme ve grafik çizme programıdır.

R yazılımının bir analiz programıdır.

R yazılımının bir sohbet programıdır.

R yazılımının bir sayfa tasarım programıdır.

R yazılımının bir fotoğraf düzenleme programıdır


16.Soru

[50,130] kapalı aralığında hesaplanmış s = 70 benzerlik değerinin [0,1] aralığındaki karşılığı kaçtır?


0.35

0,60

0

0.75

0.25


17.Soru

R ile Öklid uzaklığı hesaplayabilmek için R’nin temel paketlerinden stats paketinde yer alan aşağıdakilerden hangi fonksiyondan yararlanılır?


Abs()

Log()

Dist()

Exp()

Sqrt()


18.Soru

I. Modelin kurulması

II. Amacın tanımlanması

III. Modelin izlenmesi

IV. Veriler üzerinde ön işlemlerin yapılması

Yukarıdakilerden hangileri veri madeciliği öncesinde gerçekleştirilen işlemlerdendir?


I ve II

II ve III

I ve III

II ve IV

III ve IV


19.Soru

Minimum değeri 100 olan bir değişkenin 300 değerinin enk-enb normalleştirme yöntemine göre dönüşümü sonucu 0,5 ise değişkenin maksimum değeri kaçtır?


400

500

600

800

1000


20.Soru

  1. Veri kalitesi probleminin farkına varılması ve doğrulanması ........... olarak adlandırılır.
  2. ..........., veri madenciliği tekniği ile analiz edilmek istenilen verilerdeki beklenen değerlerden sapan aykırı değerler veya hatalardır.

Yukarıda verilen ifadelerde boşluklara sırası ile aşağıdakilerden hangisi gelmelidir?


A:Veri hazırlama

B:Normalleştirme

A: Veri temizleme

B: Gürültü

A: Veri dönüştürme

B: Eksik veri

A: Veri birleştirme

B: Kirlilik

A:Veri sıkıştırma

B:Tutarsızlık