Veri Madenciliği Ara 8. Deneme Sınavı

Toplam 20 Soru
PAYLAŞ:

1.Soru

Aşağıda verilenlerden hangisi, kayıp verilerin neden olacağı olumsuzlukları ortadan kaldırmak amacıyla kullanılan yaklaşımlardan birisi değildir?


Kayıp veri içeren kaydı veri kümesinden çıkarmak

Kayıp verilerin olduğu düşünülen dosyayı silmek

Kayıp verilerin hepsi için aynı veriyi girmek

Kayıp veri yerine tüm verilerin ortalama değerinin girilmesi:

Kayıtlarda yer alan diğer değişkenler yardımıyla kayıp verilerin tahmin edilmesi


2.Soru

X* : Dönüştürülmüş değeri, X: Gözlem değerini, Xenk: Verideki en küçük gözlem değeri ve Xenb: Verideki en büyük değeri ifade ettiğine göre Enk-Enb Normalleştirme dönüşümü için aşağıdaki formüllerden hangisi kullanılır?


           X – Xenk

X*= -----------------

           Xenb – Xenk

           X – Xenk

X*= -----------------

         Xenk – Xenb

         X – Xenb

X*= -----------------

      Xenb – Xenk

           Xenk – X

X*= -----------------

         Xenb – Xenk

         Xenb – X

X*= -----------------

        Xenb – Xenk


3.Soru

R yazılımında iki sayının toplamını (örneğin 72+45) hesaplamak için komut satırına yazılması gereken ifade aşağıdakilerden hangisidir?


> 72 + 45

> 72 + 45 ?

> 72 + 45 = ?

> ? 72 + 45

> 72 + 45 > ?


4.Soru

I. Regresyon

II. Kümeleme 

III. İstisna analizi 

IV. Genetik algoritmalar

Yukarıdakilerden hangileri veri madenciliğinde kullanılan tahmin edici modellerdendir? 


I ve III

II ve III

I ve IV

III ve IV

Yalnız IV


5.Soru

 aralığında değerler alan ve d=60 olarak elde edilmiş uzaklık değerinin [0,1] aralığına düşen karşılığı nedir?


0,92

0,95

0,98

0,89

0,94


6.Soru

Aşağıdakilerden hangisi bir vektörü en basit şekliyle yaratmak için kullanılan komuttur?


D

X

C

B

S


7.Soru

Veri ambarında yer alan veriler üzerinde çok boyutlu, çok yönlü analiz ve sorgulama yapılmasını sağlayan sistemlere ne ad verilir?


Üst veri

Veri deposu

Veri madenciliği

Veri tabanı sistemleri

OLAP


8.Soru

Aşağıdakilerden hangisi Karl Pearson uzaklık ölçüsünün tanımıdır?


İki kareler toplamının farkdır.

Minkowski Uzaklığının kare köküdür.

Karesel öklid uzaklığının varyansının değişkene oranıdır.

Öklid uzaklığının değişkenin varyansına oranlanması ile elde edilen bir uzaklıktır.

Kareler arasındaki farkın kare köküdür.


9.Soru

İstatistik sınav notları ile değerlendirilen A ve B grupları arasındaki Pearson korelasyon katsayısı rAB = 0,4 olarak elde edilmiştir. Bu iki grup arasındaki korelasyon uzaklık değeri kaçtır?


0.2

0.50

0.15

0.65

0.3


10.Soru

Aşağıdakilerden hangisi eksik verinin tahmin edilmesinde kullanılması stratejilerden birisi değildir?


El ile doldurma

Genel sabitin kullanılması

Göz ardı etme

Özelliğin diğer veriler dikkate alınarak tamamlanması

En uygun değerin kullanılması


11.Soru

Bir ürünle ilgili olarak; Çok kötü=0, Kötü=1, Orta=2, İyi=3, ve Çok iyi=4, Mükemmel=5 olmak üzere değerlendirilme yapılmıştır ve sırasıyla Orta ve Mükemmel olarak iki ürün tespit edilmiştir. Buna göre bu iki ürün arasındaki uzaklık değerinin [0,1] aralığındaki ifadesi aşağıdakilerden hangisidir?


0,1

0,2

0,4

0,5

0,6


12.Soru

Nicel değişkenlerden elde edilen gözlem değerleri arasındaki yakınlığın belirlenmesinde aşağıdakilerden hangisinden yararlanılmaz?


Öklid Uzaklığı

 Manhattan Uzaklığı

Mahalanobis Uzaklığı

 Korelasyon Uzaklığı

Büyüklük Farkı


13.Soru

Veri madenciliği tekniği ile analiz edilmek istenilen verilerdeki beklenen değerlerden sapan aykırı değerlere veya hatalara aşağıdakilerden hangi ad verilir?


Eksik Veri

Gürültü

Tutarsız

Boş veri

Tutarsız Veri


14.Soru

Aşağıdakilerden hangisi bir veri dönüştürme işlemi değildir?


Ölçek oluşturma

Düzeltme

Bir araya getirme

Genelleme

Normalleştirme


15.Soru

Farklı kadife, keten, saten olmak üzere kumaş türleri üreten bir fabrikanın, önceki ay kadife kumaştan ne kadar satıldığını öğrenilebilmesi için veri sisteminde hangi sistemi kullanılması gerekmektedir?


Veritabanı sorgulaması

Veri ambarı incelemesi

OLAP sorgulama işlemi

Veri madenciliği

Veri çekme


16.Soru

Aşağıdakilerden hangisinde normalleştirmede kullanılan yöntemlerin hepsi verilmiştir?


Enk-enb normalleştirme, z-skor normalleştirme

Sayısal ölçekleme, enk-enb normalleştirme

Enk-enb normalleştirme ve ondalık ölçekleme

Z-skor normalleştirme, sayısal ölçekleme, enk-enb normalleştirme

Enk-enb normalleştirme, z-skor normalleştirme ve ondalık ölçekleme


17.Soru

Bir okuldaki erkek öğretmenlerin sayısı ne tür değişkene örnek olarak verilebilir?


Tam sayılı değişken

İkili değişken

Nominal değişken

Ordinal değişkeni

Aralıklı ölçümlendirilmiş değişken


18.Soru

Farklı özelliklerin ortaya çıkma sıklığı hakkındaki bilgiye ne ad verilir?


Sığ bilgi

Gizli bilgi

Çok boyutlu bilgi

Derin bilgi

Meta bilgi


19.Soru

Aşağıdakilerden hangisi veri madenciliğinde kullanılan temel değişken tiplerinden biri değildir?


Ölçümlendirilmemiş

Oranlı Ölçümlendirilmiş

Aralıklı Ölçümlendirilmiş

Sıra Gösteren

İsimsel


20.Soru

I. Sıralama

II. Açığa çıkarma

III. Keşfetme

IV. Çoğaltma

Yukarıdakilerin hangileri verinin bilgiye dönüşme sürecindeki aşamalardandır?


II ve IV

I ve IV

II ve III

III ve IV

Yalnız III