Veri Madenciliği Ara 6. Deneme Sınavı

Toplam 20 Soru
PAYLAŞ:

1.Soru

Aşağıdaki seçeneklerin hangisinde, R yazılımında 1'den 4'e kadar herbirinden kendi sayısı kadar olacak biçimde rakamlardan oluşan vektörü oluşturmak için yapılacak işlem doğru bir şekilde verilmiştir?


[1] 1 2 2 3 3 3 4 4 4 4 5 5 5 5 5 6 6 6 6 6 6

> rep(seq(4),c(1,2,3,4))

> rep(seq(5),rep(5,5))

> rep(1:5,4)
[1] 1 2 3 4 5 1 2 3 4 5 1 2 3 4 5 1 2 3 4 5

> rep(seq(1,6),2)
[1] 1 2 3 4 5 6 1 2 3 4 5 6


2.Soru

Farklı kaynaktan gelen verilerin eşleştirilmesi için aynı varlıkların belirlenmesi, fazla veri sorunları ve veri değer karmaşalarının belirlenmesi ve çözümlenmesi konularının ön plana çıktığı işlem aşağıdakilerden hangisidir?


Veri birleştirme

Veri indirgeme

Veri dönüştürme

Veri temizleme

Veri sıkıştırma


3.Soru

Veritabanlarında bilgi keşif sürecinde en fazla zaman alan aşama hangisidir?


Amacın tanımlanması

Modelin kurulması ve değerlendirilmesi

Veriler üzerinde ön işlemlerin yapılması

Modelin kullanılması ve yorumlanması

Modelin İzlenmesi


4.Soru

"İşletmelerde iç veri kaynakları ile dış veri kaynaklarının birleştirilmesi ve düzenlenmesi ile oluşturulmuş, üzerinde veri madenciliği işlemlerinin gerçekleştirileceği veriyi sağlar" ifadesi seçeneklerden hangisinin tanımıdır?


Veritabanı

Veritabanı sistemleri

Veri işleme

Makine öğrenmesi

Veri ambarı


5.Soru

Verinin bir anlam oluşturacak şekilde düzenlenmiş haline ne ad verilir?


Kümeleme

Veri Bankası

İstatistik

Enformasyon

Veri Düzeneği


6.Soru

Microsoft EXCEL programıyla hazırlanmış bir dosya, R yazılımı yardımıyla işlenmiş veri haline getirilerek gerekli sonuçlar elde edilmek istenmektedir. Bu EXCEL dosyasının R yazılımında çalışabilmesi için hangi uzantıya sahip olması gerekir?


exe

pdf

csv

png

djvu


7.Soru

R yazılımında çeşitli istatistiksel analizler için oluşturulan farklı nesnelerin bir araya getirilmesinde aşağıdaki komutların hangisinden faydalanılır?


list

data.frame

matris

c()

seq


8.Soru

Öklid ve karesel öklid uzaklığı ile ilgili aşağıda verilen ifadelerden hangisi yanlıştır?


Uzaklık ölçüleri arasında en yaygın kullanılan uzaklık ölçüleri Öklid ve Karesel Öklid
uzaklık ölçüleridir.

Öklid uzaklığı, i’inci ve j’inci nesnelerin p tane değişken için farklarının kareleri toplamının karekökü alınarak elde edilir.

Öklid uzaklık ölçüsü, değişkenlerin birbirinden bağımsız olduklarını varsayar.

Öklid uzaklığının hesaplanabilmesi için verilerin oransal ya da aralıklı ölçekle ölçülmüş olması gerekir.

Öklid uzaklığı "sıfır" ile "bir" arasında değerler alır yani tanım aralığı [0,1]’dir.


9.Soru

"Veriden örüntülerin çıkarılması amacıyla çeşitli algoritmaların uygulanmasıdır."

Yukarıdaki cümle hangi kavramı tanımlamaktadır?


OLAP

Veri

İç Kaynak

Dış Kaynak

Veri Madenciliği 


10.Soru

"İşletmelerde iç veri kaynakları ile dış veri kaynaklarının birleştirilmesi ve düzenlenmesi ile oluşturulmuş, üzerinde veri madenciliği işlemlerinin gerçekleştirileceği veriyi sağlayan daha geniş ve özel veritabanlarına verilen isimdir."

Yukarıda tanım hangi kavramı anlatmaktadır?


Veri ambarı

Veri madenciliği

Veri tabanı

Veri yönetimi

Veri girişi


11.Soru

R yazılımda matematik dersinde alınan notlar x vektöründe tanımlanmıştır. Notları 45 üzerinde olan öğrenci sayıları belirlenmek istenmektedir. Bunun için ilgili satıra yazılması gereken fonksiyon aşağıdakilerden hangisidir?


x[x>45]

x[x<45]

X[X>45]

lenght(x[x>45])

sort(x[x>45])


12.Soru

X=[199,211,359] değişkeninde gözlem değeri X1=199 için, ondalık ölçekleme normalleştirme yöntemi j=3 olacak şekilde dönüşümü aşağıdakilerden hangisidir?


-0,199

-1,99

0,0199

0,199

1,99


13.Soru

  1. Sıkıştırma
  2. Düzeltme
  3. Bir araya getirme
  4. İndirgeme
  5. Normalleştirme

Yukarıda verilenlerden hangileri veri dönüşümünde, verilerin veri madenciliği için uygun formlara dönüştürülmesi için kullanılan işlemlerdendir?


I, II ve III

I, III ve IV

II, III ve V

II, IV ve V

III, IV ve V


14.Soru

Benzerlik ve uzaklık ile ilgili aşağıdaki ifadelerden hangisi yanlıştır?


Uzaklık [-1,1] aralığında değer alır

Uzaklık farklılığın bir alt kümesidir

Benzerlik iki nesnenin birbirine benzeme derecesinin sayısal bir ölçüsüdür

Benzerlik [-1,1] aralığında değer alır

Yüksek uzaklık değeri nesnelerin benzer olmadıklarını ifade eder


15.Soru

Tesadüfi olarak seçilen bir değişkende her iki nesnenin de aynı özelliğe
sahip olma olasılığını veren bir katsayı aşağıdakilerden hangisidir?


Basit eşleştirme katsayısı

Alfa kesim noktası

Uzaklık katsayısı

Üyelik katsayısı

Referans katsayısı


16.Soru

Aşağıdakilerden hangisi R yazılımında gözlem değerlerinin aritmetik ortalamadan olan farklarının değişkene ilişkin standart sapmaya bölünmesini yapan işlevi tanımlar?


n0

n1

n2

n3

n4


17.Soru

İki nesne arasındaki yüksek uzaklık değeri bu iki nesne için neyi ifade eder?


Benzer olduklarını

Benzer olmadıklarını

İlişkisiz olduklarını

d(x,y)=0 ifadesini sağladığını

s(x,y)=1 ifadesini sağladığını


18.Soru

Veri madenciliğinin tarihsel süreci içerisinde düşünüldüğünde veri tabanı kavramı hangi amaçla ortaya çıkmıştır?


Veri düzeni

Eksik verileri tamamlama

Verilerin depolanması

Verilerin kayıt altına alınması

Veri aktarımı


19.Soru

İşletmelerin varlığını sürdürebilmesi için yöneticilerinin doğru kararları ve doğru stratejileri belirlemesi için bilgiyi hangi koşullarda elde etmelidir?


Doğru yer

Doğru zaman

Doğru kişi

Doğru karar

Doğru strateji


20.Soru

  1. Sınıflayıcı ölçek
  2. Sıralayıcı ölçek
  3. Aralıklı ve oransal ölçek

Yukarıdaki ölçeklerden hangisi/hangileri ile ölçülebilen değişkenler nicel değişkenler olarak adlandırılırlar?


Yalnız I

Yalnız II

Yalnız III

I ve II

I, II ve III