Veri Madenciliği Ara 4. Deneme Sınavı
Toplam 20 Soru1.Soru
C ve D değişkenleri için [-1,+1] aralığında değerler alan ve -0,65 olarak bulunan korelasyon katsayısı dikkate alındığında elde edilecek korelasyon uzaklığı değeri ne olur?
0,75 |
0,8 |
0,815 |
0,825 |
0,85 |
Bu nedenle doğru cevap D olmaktadır.
2.Soru
Açısal benzerlik, iki vektör arasındaki açı farkının kosinüsünün bu iki vektör arasındaki uzaklık olarak alınması suretiyle değişkenler arasındaki benzerliğin belirlenmesine yönelik bir benzerlik ölçüsüdür. İki vektör arasındaki açı farkının sıfır olması iki vektör için neyi ifade eder?
Benzer olduklarını |
Farklı olduklarını |
bağımsız olduklarını |
Birbirine dik olduklarını |
Kesiştiklerini |
İki vektör arasındaki açı farkı sıfır olduğunda yani vektörler birbirlerine paralel olduklarında kosinüs değeri 1 olurken bu iki vektör arasındaki açı farkı 90° olduğunda yani vektörler birbirlerine dik olduklarında kosinüs değeri 0 olur. Dolayısıyla elde edilen değerin 1 olması değişkenler arasında tam bir benzerliğin olduğunun, 0 olması ise değişkenlerin hiç benzerliğin olmadığının göstergesi olmaktadır.
3.Soru
Aşağıdakilerden hangisi en çok kullanılan veri dönüştürme işlemidir?
Düzeltme |
Bir araya getirme |
Genelleme |
Normalleştirme |
Özellik oluşturma |
Normalleştirme veya standartlaştırma en çok kullanılan veri dönüştürme işlemidir.
4.Soru
Aşağıdaki seçeneklerden hangisi yanlıştır?
R yazılımının bir veri işleme ve grafik çizme programıdır. |
Matematiksel bir ifadenin hesaplanması için meydana çıkan komutlar temel komutlardır. |
R ile çalışırken herhangi bir fonksiyon hakkında yardım almak için value komutu kullanılır. |
R console komut girrilmesi için kullanılan bölgedir. |
Windows işletim sistemi için derlenmiş program Download R for Windows linkinde yer almaktadır. |
R ile çalışırken herhangi bir fonksiyon ya da kitaplık hakkında yardım almak için help komutunu kullanılır. Doğru cevap C'dir.
5.Soru
- En büyük özelliği yokluk anlamına gelen belirli bir sıfır değerini barındırıyor olmasıdır.
- Sıfır başlangıç noktası tüm ölçüm araçları için aynı anlamı taşır.
Yukarıda özellikleri belirtilen dğişken tipi aşağıdakilerden hangisidir?
İkili (Binary) Değişkenler |
İsimsel (Nominal) Değişkenler |
Sıra Gösteren (Ordinal) Değişkenler |
Aralıklı Ölçümlendirilmiş (Interval-Scaled) Değişkenler |
Oranlı Ölçümlendirilmiş (Ratio-Scaled) Değişkenler |
Oranlı Ölçümlendirilmiş (Ratio-Scaled) Değişkenler soruda belirtilen özellikleri taşıyan değişkenlerdir.
6.Soru
Uzaklık iki nesne arasındaki aşağıdakilerden hangi niteliğin bir ölçüsünü ifade etmektedir?
Mantıksallığın |
Nesnenin benzerliğinin |
Özelliğinin |
Düzensizliğin ve bozukluğun |
Ayrışmanın |
İki nesne arasındaki düzensizliğin veya bozukluğun bir ölçüsü olan uzaklık, farklılığın özel bir sınıfı, alt kümesidir.
7.Soru
Dosyalardan formatlanmış data frame elde edilmesi için hangi fonksiyon kullanılabilir?
scan() |
read.fwf() |
Install Package(s) |
read.csv() |
read.table() |
read.table() dosyalardan formatlanmış data frame elde edilmesi işlemi için kullanılan fonksiyondur. Doğru cevap E'dir.
8.Soru
R yazılımında rep() fonksiyonu hangi işlev için kullanılmaktadır?
Matris oluşturma |
Bir değişkenin kareköküni hesaplama |
Vektör oluşturmada |
Belirli bir düzene sahip verilerin oluşturulmasında |
Önceden tanımlanmış bir vektörün birim sayısını öğrenmek için |
Belirli bir düzene sahip verilerin oluşturulması için rep () fonksiyonu kullanılır.Doğru cevap D'dir.
9.Soru
Aşağıdaki seçeneklerden hangisinde ek kütüphanelerin güncellenmesi için yapılması gereken işlem doğru bir biçimde verilmiştir?
“Packages” menüsü “update packages” |
“update packages” |
update- ek kütüphane |
file-update |
view-update |
“Packages” menüsü “update packages” yardımıyla kütüphanelerde meydana gelen değişimler güncellenebilir. Doğru cevap A'dır.
10.Soru
Ahmet'in yöneylem dersinden aldığı not 65 ve karar kuramı dersinden aldığı not 80 iken Mehmet'in aldığı notlar sırasıyla 50 ve 90'dır. Buna göre Ahmet ve Mehmet arasındaki Manhattan uzaklığı kaçtır?
15 |
35 |
25 |
45 |
40 |
Bu nedenle doğru cevap C olmaktadır.
11.Soru
I. Felsefe
II. Ekonomi
III. İstatistik
IV. Görselleştirme
Yukarıdakilerden hangileri veri madenciliğine etki eden disiplinlerdendir?
I ve III |
II ve III |
III ve IV |
I ve IV |
Yalnız III |
Veri madenciliğine doğrudan etki eden disiplinler istatistik, makine öğrenimi, görselleştirme, veri tabanı sistemleri ve örüntü tanımadır.
12.Soru
[30,60] kapalı aralığında hesaplanmış s=45 benzerlik değerinin [0,1] aralığındaki karşılığı nedir?
0,35 |
0,4 |
0,45 |
0,5 |
0,55 |
s=45 için s'=(45-30)/(60-30)=(15/30)=0,5 olur. Bu nedenle doğru yanıt D olmaktadır.
13.Soru
Veri matrisi olarak girilen x değişkenine ait nesneler arasındaki belirli uzaklık ölçüm değerlerini R ile hesaplamak için hangi fonksiyon kullanılmaktadır?
stats |
data.frame |
sqrt |
sim |
dist |
dist() fonksiyonu yardımıyla veri matrisi olarak girilen x değişkenine ait nesneler arasındaki belirli uzaklık ölçüm değerleri hesaplanabilir.
Doğru cevap E şıkkıdır.
14.Soru
Veri madenciliğine etki eden disiplinler düşünüldüğünde verilerin düzenli ve sistematik bir biçimde sıralanmasını saptayan disiplin seçeneklerden hangisidir?
Örüntü tanıma |
Makine öğrenimi |
İstatistik |
Veritabanı sistemleri |
Görselleştirme |
Örüntü, olaylar ve nesneler arasında düzenli ve sistematik bir biçimde tekrarlanan ilişki modellerini ifade etmek için kullanılan bir kavramdır. Örüntü tanıma teknolojisi ise daha önceden tanımlanmış, bir model olarak düşünülebilen çok boyutlu bir örüntünün veritabanındaki benzerlerini ya da en benzerini arama ve bulma amacına yönelik yazılımları ifade eder. Örüntünün konusu yazılı bir metin olabileceği gibi parmak izi, ses, yüz tanıma, kan hücrelerinin karşılaştırılması, el yazılarının belirlenmesi gibi alanlar da olabilir. Verilen son örneklerde örüntü, el, yüz, resim, çizim ve ses gibi nesnelerin bilgisayar ortamlarında sayısal olarak ifade edilmesi anlamındadır.
15.Soru
Birimler arasında özellik farklarının matematiksel olarak belirlendiği değişken türüne ne ad verilir?
Tam sayılı değişken |
Aralıklı ölçümlendirilmiş değişken |
Sıra gösteren değişken |
İkili değişken |
Nominal değişken |
Birimler arasında özellik farklarının matematiksel olarak belirlendiği değişken türüne aralıklı ölçümlendirilmiş değişken denir. Bu nedenle doğru cevap B seçeneğidir.
16.Soru
R yazılımında sıfırdan sekize kadar 2’er artan rakamlardan oluşan vektörü oluşturmak için aşağıdaki komutlardan hangisi kullanılır?
> seq(0, 8, 2) |
> rep(0, 8, 2) |
> c(0, 8, 2) |
> sqrt(0, 8, 2) |
> seq(rep(0, 8, 2)) |
Sıfırdan sekize kadar 1’er artan rakamlardan oluşan vektör için aşağıdaki işlemler yapılır.
> seq(0, 8, 1)
[1] 0 1 2 3 4 5 6 7 8
Dörtten on altıya kadar 4’er artan rakamlardan oluşan vektör için aşağıdaki işlemler yapılır.
> seq(4, 16,4)
[1] 4 8 12 16
Bu nedenle doğru yanıt a) seçeneğidir.
17.Soru
Aşağıdaki seçeneklerden hangisinde kütüphanelerde meydana gelen değişimlerin güncellenmesi için kullanılan doğru kavram verilmiştir?
matrix |
update packages |
scan |
return |
Install packages |
Zaman zaman bu kütüphanelerde meydana gelen değişimlerin güncellenmesi faydalı olacaktır. Bu işlemde yine “Packages” menüsü “update packages” seçeneği yardımıyla gerçekleştirilebilir.
18.Soru
1990'lardan sonra, ilgilenilen verinin yığınlar içinden çekilip çıkarılması ve analizinin yapılarak kullanımına hazır hale getirilmesi sürecinde veri madenciliğine büyük katkıları olmuştur.
Yukarıda bahsedilen disiplin aşağıdakilerden hangisidir?
Makine öğrenimi |
Veritabanı sistemleri |
İstatistik |
Görselleştirme |
Örüntü Tanıma |
İstatistik, verilerin analizi ve değerlendirilmesi konusunda geçmişten günümüze yoğun bir biçimde kullanılan bir disiplindir. İstatistiksel çalışmaların bilgisayar desteğiyle daha güçlü biçimde yapılması, daha önce gerçekleştirilmesi çok mümkün olmayan istatistiksel araştırmaları ve analizleri yapılabilir ha^le getirmiştir. Bu anlamda 1990’lardan sonra, ilgilenilen verinin yığınlar içinden çekilip çıkarılması ve analizinin yapılarak kullanıma hazır ha^le getirilmesi sürecinde istatistik, veri madenciliği ile ortak bir platformda ve sıkı bir çalışma birlikteliği içinde olmuştur. Doğru cevap C'dir.
19.Soru
"R yazılımında veri seti içerisindeki faktör listeleri ve gözlem birimleri .......... olarak bir araya getirilirler."
Aşağıdakilerden hangisi boş bırakılan yere gelmesi uygun olan kavramdır?
"R yazılımında veri seti içerisindeki faktör listeleri ve gözlem birimleri .......... olarak bir araya getirilirler."
Aşağıdakilerden hangisi boş bırakılan yere gelmesi uygun olan kavramdır?
Data frame |
Matrix |
List nesneler |
sqrt |
Mantıksal operatörler |
R yazılımında veri seti içerisindeki faktör listeleri ve gözlem birimleri data frame olarak bir araya getirilirler.
20.Soru
Nesneler arasında 1 hiç benzerlik olmadığını, 100 ise tam benzerlik olduğunu göstermek üzere elde edilmiş olan 25 benzerlik değerinin [0,1] aralığına düşecek şekilde dönüşümü yapılmış karşılığı aşağıdakilerden hangisidir?
0,17 |
0,24 |
0,33 |
0,45 |
0,49 |
s=25 için
s'=(s-enk(s))/(enb(s)-enk(s))
s'=(25-1)/(100-1)=24/99=0,24
-
- 1.SORU ÇÖZÜLMEDİ
- 2.SORU ÇÖZÜLMEDİ
- 3.SORU ÇÖZÜLMEDİ
- 4.SORU ÇÖZÜLMEDİ
- 5.SORU ÇÖZÜLMEDİ
- 6.SORU ÇÖZÜLMEDİ
- 7.SORU ÇÖZÜLMEDİ
- 8.SORU ÇÖZÜLMEDİ
- 9.SORU ÇÖZÜLMEDİ
- 10.SORU ÇÖZÜLMEDİ
- 11.SORU ÇÖZÜLMEDİ
- 12.SORU ÇÖZÜLMEDİ
- 13.SORU ÇÖZÜLMEDİ
- 14.SORU ÇÖZÜLMEDİ
- 15.SORU ÇÖZÜLMEDİ
- 16.SORU ÇÖZÜLMEDİ
- 17.SORU ÇÖZÜLMEDİ
- 18.SORU ÇÖZÜLMEDİ
- 19.SORU ÇÖZÜLMEDİ
- 20.SORU ÇÖZÜLMEDİ