Veri Madenciliği Ara 7. Deneme Sınavı
Toplam 20 Soru1.Soru
Toplanan ham veri diğer bir deyişle işlenmemiş verinin veri madenciliğinde analize hazır duruma getirilmesi amacıyla yapılan işlemler bütününe aşağıdakilerden hangi ad verilir?
Veri Derleme |
Veri Oluşturma |
Veri Toplama |
Veri Hazırlama |
Veri Depolama |
Toplanan ham veri diğer bir deyişle işlenmemiş verinin veri madenciliğinde analize hazır duruma getirilmesi amacıyla yapılan işlemler bütününe veri hazırlama denir.
2.Soru
I. Veri işleme
II. Müşteri analizi
III. Dizi ve matris hesaplamaları
IV. Şirket adına pazar araştıması
Yukarıdakilerden hangileri R yazılımının sunduğu olanaklardandır?
Yalnız III |
II ve IV |
III ve IV |
I ve III |
Yalnız I |
R yazılımı çevre birimi kullanıcılara etkin bir veri işleme ve depolama olanağı, dizi ve matris hesaplamaları için komutlar grubu, veri analizi için ileri düzeyde teknikler topluluğu, verinin ekranda ya da basılı bir eserde görüntülenebilmesine olanak veren geniş grafiksel özellikler, kolay programlamaya uygun fakat karmaşık programlama dillerinin özelliklerine sahip bir programlama dilinin olanaklarını sunmaktadır.
3.Soru
R yazılımda;
x<-c(1,5,3,4)
y<-c(4,2,7,8)
z<-c(3,7,8,6)
vektörleri bir araya getirilmek istendiğinde aşağıdaki fonksiyonlardan hangisi kullanılmalıdır?
data.frame |
seq.data |
return |
boxplot |
scan |
R yazılımında veri seti içerisindeki faktör listeleri ve gözlem birimleri data frame olarak bir araya getirilirler.
Doğru cevap A şıkkıdır.
4.Soru
Veri madenciliği için ilk yazılım ne zaman geliştirilmiştir?
1992 |
1960 |
1952 |
1980 |
1990 |
Veri madenciliği için ilk yazılım, 1992 yılında geliştirilmiştir. Doğru cevap A'dır.
5.Soru
Satış tahmininin yapılması veri madenciliğinin hangi alandaki uygulamalarına bir örnektir?
Finans |
Sağlık |
Endüstri |
Eğitim |
Pazarlama |
Satış tahmininin yapılması veri madenciliğinin pazarlama alanındaki uygulamalarına örnek olarak verilebilir. Bu nedenle doğru cevap E'dir.
6.Soru
[30,200] kapalı aralığında hesaplanmış s = 100 benzerlik değerinin [0,1] aralığındaki karşılığını bulunuz?
0,17 |
0,25 |
0,36 |
0,41 |
0,57 |
s'=(s-enk(s))/(enb(s)-enk(s))
s'=(100-30)/(200-30)
=70/170
=0,41
7.Soru
Aylık temelde bulunan bir veri özelliğinin yıllık temele dönüştürülmesi işlemine ne ad verilir?
Düzeltme |
Genelleme |
Normalleştirme |
Bir araya getirme |
Özellik oluşturma |
Aylık temelde bulunan bir veri özelliğinin yıllık temele dönüştürülmesi işlemi bir araya getirmeye örnektir. Bu nedenle doğru cevap D seçeneğidir.
8.Soru
I. > (veya)
II. < (küçüktür)
III. & (ve)
IV. != (eşittir)
Yukarıdaki mantık operatörleri ve açıklamalarından hangileri doğru verilmiştir?
I ve II |
II ve III |
III ve IV |
Yalnız I |
I ve IV |
Operatör | Kullanımı |
< | Küçüktür |
> | Büyüktür |
<= | Küçük ya da eşittir |
>= | Büyük ya da eşittir |
== | Eşittir |
!= | Eşit değildir |
& | Ve |
| | Veya |
! | Değil |
9.Soru
R yazılımında değişkenlerin virgülle birbirinden ayrıldığı veri dosyalarını okumak için aşağıdaki işlevlerden hangisi kullanılır?
read.csv() |
scan() |
read.table() |
read.fwf() |
load |
Çoğunlukla veri setleri başka programlardan hazır olarak elde edilirler. Verinin R yazılımına okutulabilmesi için bir kaç farklı teknik bulunmaktadır. Bu işlem için kullanılabilecek fonksiyonlar sırasıyla; scan() düşük seviyeli veri okutma işlemi, read.table() dosyalardan formatlanmış data frame elde edilmesi işlemi, read.fwf() belirgin bir genişlik tanımlanmış veri dosyalarından okuma işlemi, read.csv() değişkenlerin virgülle ayrıldığı dosyalardan okuma işlemi olur. Özellikle Microsoft Excel dosyalarından okuma işlemleri gerçekleştirilirken, her bir çalışma sayfası “csv” dosyası olarak kaydedilerek daha sonra bunların her biri read.csv() fonksiyonu ile elde edilebilir. Bu nedenle doğru yanıt a) seçeneğidir.
10.Soru
Aşağıdaki R komutları uygulandığında ekranda hangi sonuç görüntülenir?
> isim <- c(“Defne”, “Kuzey”, “Alara”, “Miray”)
> yenix <- c(isim, 17, 22, 45)
> length(yenix)
[1] 7 |
[1] 3 |
[1] 4 |
[1] 8 |
[1] 12 |
R yazılımının en büyük özelliklerinden biri de değişkenler ile çalışılırken vektör ve matris kullanımına olanak tanımasıdır. En basit şekliyle bir vektörü oluşturabilmek için c() fonksiyonu kullanılmaktadır. Daha önce kullanılan x değişkenini 5 birimlik bir vektör hâline dönüştürme işlemi ve sonucu aşağıda verilmiştir.
> x <- c(1,2,3,4,5)
> x
[1] 1 2 3 4
5 Görüldüğü gibi burada ilk satırda x vektörüne 5 adet değer atanmakta ikinci satırda ise x’e ataması yapılan değerlerin görüntülenmesi komutu verilmektedir. Bu noktada önemli olan konu; R yazılımının büyük ve küçük harfe olan duyarlılığıdır. X ve x değişkenleri tamamen farklı değişkenlerdir. Önceden tanımlanmış bir vektörün birim sayısını öğrenmek için length() fonksiyonu kullanılır. Örnekteki birim sayısı aşağıdaki gibi öğrenilebilir.
> length(x)
[1] 5
c() fonksiyonu karakter değişkenleri yaratmak için de kullanılır. 4 isimden oluşan isim değişkenini c() fonksiyonunu kullanarak oluşturunuz. 4 isimden oluşan isim değişkeni aşağıdaki gibi oluşturulabilir.
> isim <- c(“Defne”, “Kuzey”, “Alara”, “Miray”)
> isim
[1] “Defne” “Kuzey” “Alara” “Miray”
Ayrıca, c() fonksiyonu birden fazla vektörün tek bir vektör olarak birleştirilmesinde ya da karakter değişkeninin sayılarla birleştirilmesinde de kullanılabilir. Yukarıdaki örnekteki isim değişkenine 17, 22, 45 rakamlarını ekleyerek yenix değişkenini oluşturmak için aşağıdaki işlemler yapılmalıdır.
> yenix <- c(isim, 17, 22, 45)
> yenix
[1] “Defne” “Kuzey” “Alara” “Miray” “17” “22” “45”
Elde edilen yenix dizisinin öğe sayısı 8 olmuştur.
> length(yenix)
Komutu ile
[1] 8
Sonucu elde edilecektir.
Bu nedenle doğru yanıt a) seçeneğidir.
11.Soru
Aşağıdakilerdir hangisi, veritabanlarında bilgi keşif sürecinde izlenmesi gereken temel aşamalardan birisi değildir?
Amacın tanımlanması |
Veriler üzerinde ön işlemlerin yapılması |
Modelin kurulması ve değerlendirilmesi |
Modelin kullanılması ve yorumlanması |
Verilerin yayımlanması |
Açıklama: Veritabanlarında Bilgi Keşfi sürecinde izlenmesi gereken temel aşamalar:
- Amacın tanımlanması
- Veriler üzerinde ön işlemlerin yapılması
- Modelin kurulması ve değerlendirilmesi
- Modelin kullanılması ve yorumlanması
- Modelin izlenmesi
12.Soru
Açısal benzerlik özellikle aşağıdakilerden hangisinde kullanılmaktadır?
Belge ve çoklu ortam nesnelerinin kıyaslanmasında ve metin madenciliğini uygulamalarında |
Harita uzaklığının hesaplanmasında |
Biçim farkınını içeren uygulamalarda |
Büyüklük farkını içeren uygulamalarda |
Resim işleme metodları ve yüz tanıma uygulamalarında |
Açısal benzerlik, özellikle belge ve çoklu ortam nesnelerinin kıyaslanmasında ve metin madenciliğinde kullanılmaktadır.
13.Soru
ki sonuçlu değişkenler içeren nesne çiftinin karşılıklı eşleşen değerlerinin tekrar sayılarından oluşan tablonun adı aşağıdakilerden hangisidir?
T-Kare tablosu |
Olasılık yoğunluk tablosu |
Jaccard Benzerlik tablosu |
Lawrance ve Williams Uzaklık tablosu |
Kontenjans/Çapraz Sınıflama |
ki yönlü sınıflama tablosu olarak da adlandırılan kontenjans tablosu, iki sonuçlu değişkenler içeren nesne çiftinin karşılıklı eşleşen değerlerinin tekrar sayılarından oluşan tablodur.
14.Soru
R programında komutların girilmesi için kullanılan bölgeye ne ad verilmektedir?
Download R for Windows |
Value |
Help |
R Console |
Generic Function |
Komutların girilmesi için kullanılan bölgeye “R Console” denir. Doğru cevap D'dir.
15.Soru
n sayıda birim ve p sayıda değişken ile çalışılırken birimler yada değişkenler arasındaki uzaklıkları hesaplamak için kullanılan genel bir uzaklık ölçüsüdür.”
Yukarıda tanımı yapılan uzaklık ölçüsü aşağıdakilerden hangisidir?
Levinstein Uzaklığı |
Öklid uzaklığı |
Minkowski uzaklığı |
Karl Pearson uzaklığı |
kullback leibler uzaklığı |
Minkowski Uzaklığı , n sayıda birim ve p sayıda değişken ile çalışılırken birimler yada değişkenler arasındaki uzaklıkları hesaplamak için kullanılan genel bir uzaklık ölçüsüdür.
16.Soru
Zaman içinde giderek büyüyen veri tabanlarının düzenlenmesi için üretilen, ilk basit veri modelleri hangileridir?
Hiyerarşik veri modeli ve hipodermik veri modeli |
Ağ veri modeli ve hiyerarşik veri modeli |
Hiyerarşik veri modeli ve ağ veri modeli |
Sıra örüntü analizi modeli ve veri madenciliği modeli |
Veri madenciliği modeli ve veri işçiliği modeli |
Zaman içinde giderek büyüyen veri tabanlarının organizasyonu, düzenlenmesi ve yönetimi de doğal olarak zorlaşmıştır. Bu zorlukların üstesinden gelebilmek amacıyla ise veri modelleme kavramı ortaya atılmıştır. Ilk veri modelleri; Hiyerarşik Veri Modeli ve Ağ Veri Modeli olarak adlandırılan basit veri modelleridir.
17.Soru
Aşağıdakilerden hangisi veri hazırlama işleminde yapılabilen bir işlem değildir?
Verinin temizlenmesi |
Verinin birleştirilmesi/bütünleştirilmesi |
Verinin indirgenmesi |
Verinin dönüştürülmesi(normalleştirme) |
Verinin şeffaflaştırılması/özgünleştirilmesi |
Veri hazırlamada verinin temizlenmesi, birleştirilmesi/bütünleştirilmesi, indirgenmesi, dönüştürülmesi (normalleştirme) kullanılır.
18.Soru
Aşağıdakilerden hangisi veri dönüşümünde verilerin veri madenciliği için uygun formlara dönüştürülmesi işlemleri arasında değildir?
Özellik oluşturma |
Sıkıştırma |
Genelleme |
Bir araya getirme |
Normalleştirme |
Veri dönüşümünde verilerin veri madenciliği için uygun formlara dönüştürülmesi düzeltme, bir araya getirme, genelleme, normalleştirme ve özellik oluşturma işlemleriyle gerçekleştirilir.
19.Soru
Ahmet'in yöneylem dersinden aldığı not 65 ve karar kuramı dersinden aldığı not 80 iken Mehmet'in aldığı notlar sırasıyla 50 ve 90'dır. Buna göre Ahmet ve Mehmet arasındaki öklid uzaklığı kaçtır?
18,02 |
11,25 |
35,73 |
27,16 |
15,93 |
Bu nedenle doğru cevap A'dır.
20.Soru
R yazılımda;
x<-matrix(c(6,3,2,1),nrow=2) 2x2 tipinde bir matris oluşturur.
x[1,2] yazılıp enter tuşuna basıldığında elde edilecek yeni satır değeri kaçtır?
1 |
3 |
6 |
NA |
2 |
x<-matrix(c(6,3,2,1),nrow=2) matrisi oluşturulurken, nrow=2 olarak girildiğinden iki satır olarak şekilde matris oluşturur. Bunu yaparken her defesında ve sırasıyla 2 eleman alarak satırlara atama yapar. İlk satır elemanları 6 ve 3 olurken; ikinci satır elemanları 2 ve 1 olur.
x[1,2] ifadesi, x matrisinin 1.satır 2.sutün elemanı olan 3 değerini verecektir.
Doğru cevap B şıkkıdır.
-
- 1.SORU ÇÖZÜLMEDİ
- 2.SORU ÇÖZÜLMEDİ
- 3.SORU ÇÖZÜLMEDİ
- 4.SORU ÇÖZÜLMEDİ
- 5.SORU ÇÖZÜLMEDİ
- 6.SORU ÇÖZÜLMEDİ
- 7.SORU ÇÖZÜLMEDİ
- 8.SORU ÇÖZÜLMEDİ
- 9.SORU ÇÖZÜLMEDİ
- 10.SORU ÇÖZÜLMEDİ
- 11.SORU ÇÖZÜLMEDİ
- 12.SORU ÇÖZÜLMEDİ
- 13.SORU ÇÖZÜLMEDİ
- 14.SORU ÇÖZÜLMEDİ
- 15.SORU ÇÖZÜLMEDİ
- 16.SORU ÇÖZÜLMEDİ
- 17.SORU ÇÖZÜLMEDİ
- 18.SORU ÇÖZÜLMEDİ
- 19.SORU ÇÖZÜLMEDİ
- 20.SORU ÇÖZÜLMEDİ