Veri Madenciliği Ara 5. Deneme Sınavı
Toplam 20 Soru1.Soru
Aşağıdakilerden hangisi veri indirgeme yöntemlerinden biri değildir?
Ölçeklendirme |
Veri küpü birleştirme |
Boyut indirgeme |
Veri sıkıştırma |
Büyük sayıların indirgenmesi |
Veri indirgeme yöntemleri olarak veri küpü birleştirme, boyut indirgeme, veri sıkıştırma ve büyük sayıların indirgenmesi yöntemleri ortaya çıkar.
2.Soru
İki sonuçlu değişkenler içeren gözlem çiftleri arasındaki yakınlığın belirlenmesinde aşağıdakilerden hangisinden yararlanılmaz?
Büyüklük Farkı (Size Difference) |
Karl Pearson Uzaklık Ölçüsü |
Biçim Farkı (Shape Difference) |
Lance ve Williams Uzaklık Ölçüsü |
Örüntü Farkı (Pattern Difference) |
İki sonuçlu değişkenler içeren gözlem çiftleri arasındaki yakınlığın belirlenmesinde Öklid, Karesel Öklid, Büyüklük Farkı (Size Difference), Örüntü Farkı (Pattern Difference), Lance ve Williams Uzaklık Ölçüsü, Biçim Farkı (Shape Difference) ve Jaccard Benzerliği (Jaccard Similarity) gibi birçok benzerlik ya da uzaklık ölçülerinden yararlanılmaktadır.
3.Soru
X = {251, 148, 166, 244, 472, 356, 379} kümesi verilsin. Enk-Enb Normalleştirme dönüşümü uygulandığında 251 değerinin dönüşmüş biçimi aşağıdakilerden hangisidir?
1 |
0 |
0,056 |
0,296 |
0,318 |
X = {251, 148, 166, 244, 472, 356, 379} kümesinde 472 değerini dönüştürmek için Enk-Enb Normalleştirme dönüşümünün aşağıdaki formülü uygulandığında;
X – Xenk 472 - 148
X*= ----------------- = ------------ = 1
Xenb – Xenk 472 - 148
Elde edilir. Bu nedenle doğru yanıt a) seçeneğidir.
4.Soru
[0,1] kapalı aralığında benzerlik değeri 0.60 olarak hesaplanmış bir nesnenin uzaklığı değeri kaçtır?
0.60 |
0.50 |
1 |
0.40 |
0 |
Benzerlik değerlerinin [0,1] sonlu aralığında olduğu ilk durumda, ilgili uzaklık değerleri,
d = 1 –s
eşitliği yardımıyla elde edilebilir.
d=1-0.60=0.40
Doğru cevap D şıkkıdır.
5.Soru
Bir veri ambarında yer alan veriler hakkındaki bilgiler hangi ögeden elde edilmektedir?
İç kaynak |
Üst veri |
Veri |
Veri deposu |
OLAP |
İngilizce karşılığı meta data olan üst veri, veri ambarında yer alan veriler hakkındaki tanımlamalar olup veri ambarına ilişkin veri kataloğu olarak düşünülebilir. Doğru cevap B'dir.
6.Soru
X=[120,150,180,190] gözlem değerleri verilen değişkende 150 değeri için z-skor normalleştirme yöntemine göre dönüşüm değeri kaçtır?
0,255 |
0,478 |
-0,505 |
-0,316 |
-0,229 |
X*=(X-Xaort)/s Xaort: değişken değerlerin aritmetik ortalaması, s: standart sapma)
Xaort=(120+150+180+190)/4 =160 ve s=[((120-160)²+(150-160)²+(180-160)²+(190-160)²)/3]1/2
s=31,62
150 değeri için; (150-160)/31,62=-0,316
7.Soru
Aşağıdakilerden hangisi veritabanlarında bilgi keşif sürecinde izlenmesi gereken temel aşamalardan birisi olan; veriler üzerinde yapılan ön işlemlerin aşamalarından birisi değildir?
Verilerin toplanması ve birleştirilmesi |
Verilerin ortak havuzdan çekilmesi |
Kayıp veriler için işlem yapılması |
Verilerdeki gürültünün temizlenmesi |
Verilerin yeniden yapılandırılması |
Veriler Üzerinde Yapılan Ön İşlemler
- Verilerin toplanması ve birleştirilmesi
- Verilerin temizlenmesi
- Kayıp veriler için işlem yapılması
- Verilerdeki gürültünün temizlenmesi
- Verilerin yeniden yapılandırılması
- Verilerin normalizasyonu
- Verilerin azaltılması
- Verilerin dönüştürülmesi
8.Soru
İnsan beyninde yer alan sinir hücrelerinin ilk yapay modeline ne ad verilir?
Perseptron |
Hiyerarşik veri modeli |
Ağ veri modeli |
Veritabanlarında bilgi keşfi |
SQL |
İnsan beyninde yer alan sinir hücrelerinin ilk yapay modeline perseptron denilir. Bu nedenle doğru cevap A'dır.
9.Soru
Olaylar ve nesneler arasında düzenli ve sistematik bir biçimde tekrarlanan ilişki modellerini ifade etmek için kullanılan kavrama ne ad verilir?
İstatistik |
Veritabanı |
Örüntü |
Makine öğrenimi |
Veri ambarı |
Olaylar ve nesneler arasında düzenli ve sistematik bir biçimde tekrarlanan ilişki modellerini ifade etmek için kullanılan kavrama örüntü denilmektedir. Bu nedenle doğru cevap C seçeneğidir.
10.Soru
Öklid uzaklığının değişkenin varyansına oranlanması ile elde edilen uzaklık aşağıdakilerden hangisidir?
Mahalonobis Uzaklığı |
Mahalanobis Uzaklığı |
Açısal Uzaklık |
Karl Pearson uzaklığı |
Jaccard uzaklığı |
Karl Pearson uzaklığı, Öklid uzaklığının değişkenin varyansına oranlanması ile elde edilen bir uzaklıktır. Bu özelliğinden dolayı standartlaştırılmış Öklid uzaklığı olarak da bilinmektedir.
Doğru cevap D şıkkıdır.
11.Soru
Sıfır başlangıç noktasının tüm ölçüm araçlarında aynı anlamı taşıdığı değişken türüne ne ad verilir?
İkili değişken |
Sıra gösteren değişken |
Tam sayılı değişken |
Oranlı ölçümlendirilmiş değişken |
Aralıklı ölçümlendirilmiş değişken |
Sıfır başlangıç noktasının tüm ölçüm araçlarında aynı anlamı taşıdığı değişken türüne oranlı ölçümlendirilmiş değişken denir. Bu nedenle doğru cevap D olmaktadır.
12.Soru
Mantık operatörleri ile ilgili olarak verilen ifadelerden hangisi veya hangileri doğrudur?
I-Doğru ve yanlış olmak üzere iki mantıksal değer vardır.
II-& operatörü "Ve" anlamına gelir.
III-Mantık fonksiyonları yardımı ile ilgilenilen değişkenin bir karakter değişkeni mi yoksa sayısal bir değişken mi olduğu anlaşılabilir.
IV-Mantık operatörleri, karşılaştırma yaparken ve vektörler ile matrislerin belirli elemanlarını belirlerken kullanılmaktadır.
V->= operatörü "büyüktür" anlamına gelir.
I-II-III-IV-V |
I-III-IV |
I- |
II-IV-V |
I-II-III-IV |
>= operatörü "büyük ya da eşittir " anlamına gelir.Doğru cevap E'dir.
13.Soru
Veri toplama sürecinde yanlış araçların kullanması, veri girişinde hataların yapılması ve veri toplama aşamasında sorulara eksik cevap verilmesi sonucu ortaya çıkan veriye ne ad verilir?
İşlenmiş veri |
Depolanmış veri |
Dönüştürülmüş veri |
Normalizasyonu yapılmış veri |
Kayıp veri |
Kayıp veri, veritabanlarındaki kayıtlarda eksik olan verilerdir. Veri toplamada yanlış araçların kullanılması, veri girişinde hata yapılması yada veri toplama aşamasında sorulara eksik cevap verilmesi bu nedenlerden bazılarıdır.
14.Soru
Aşağıdakilerden hangisi bir veri temizleme temel yöntemlerinden biridir?
Gürültülü veri |
Kirli veri |
Aşırı veri |
Anlamsız veri |
Karışık veri |
Veri temizleme için temel yöntemler eksik veri, gürültülü veri ve tutarsızlık olmak üzere üç temel başlıkta gruplanabilir.
Bu nedenle doğru yanıt a) seçeneğidir.
15.Soru
Veri madenciliğinin tarihsel gelişiminde 1980'lerin önemi nedir?
İlk bilgisayarlar ortaya çıkmıştır |
Büyük miktarda veri içeren veri tabanları geliştirilmiştir |
Tüm alanlar için veri madenciliği uygulamaları ortaya çıkmıştır |
Veri madenciliği için ilk yazılım geliştirilmiştir |
İlişkisel Veritabanı Yönetim Sistemleri geliştirilmiştir |
1980'lerde büyük miktarda veri içeren veri tabanları ve SQL soru dili geliştirilmesi veri madenciliğinin tarihsel gelişimindeki önemli gelişmelerdir. Doğru cevap B'dir.
16.Soru
Özellikle ekolojik araştırmalarda belirli bir nesnenin farklı bölgelerde var olup olmadığının belirlenmesinde kullanılan ölçü aşağıdakilerden hangisidir?
Jaccard benzerlik katsayısı |
Açısal benzerlik (cosine similarity) |
Mahalanobis uzaklığı |
Basit eşleştirme katsayısı |
Binary Öklid uzaklığı |
Jaccard benzerlik katsayısı özellikle ekolojik araştırmalarda belirli bir nesnenin farklı bölgelerde var olup olmadığının belirlenmesinde kullanılmaktadır.
17.Soru
Aşağıdakilerden hangisi bilginin elde edilmesinde verinin işlenmesi ve dönüştürülmesi sürecinde yapılacak işlemlerden birisi değildir?
Özetleme |
Çoğaltma |
Analiz |
Temizleme |
Sıralama |
Bilginin elde edilmesinde verinin işlenmesi ve dönüştürülmesi sürecinde yapılacak işlemler veri üzerinde kaydetme, sınıflama, sıralama, hesaplama, özetleme, çoğaltma, analiz ve raporlamadır. Bu nedenle doğru cevap D'dir.
18.Soru
Aşağıdakilerden hangisi veri indirgeme yöntemlerinden birisi değildir?
Boyut indirgeme |
Veri sıkıştırma |
Büyük sayıların indirgenmesi |
Veri küpü birleştirme |
Normalizasyon |
Veri indirgeme yöntemleri şu şekilde sıralanmaktadır: veri küpü birleştirme, boyut indirgeme, veri sıkıştırma ve büyük sayıların indirgenmesi. Bu nedenle doğru cevap E seçeneğidir.
19.Soru
R yazılımında;
matrix(c(2,3,4,3,2,7,1,2,9,8,7,4,5,6,8),x))
matrisinin 3 satırdan oluşması için x ile gösterilen ifadenin yerine ne yazılmalıdır?
ncol=3 |
nrow=3 |
nrow=5 |
3 |
5 |
R yazılımında matris oluşturmak için matrix() fonksiyonu kullanılır. Bu fonksiyonun genel
yazılımı;
matrix(veri, nrow(satırsayısı), ncol(sütünsayısı) şeklindedir. x yerine; nrow=3 veya ncol=5 yazılması durumunda 3 satırdan oluşan bir matris elde edilebilir.
Doğru cevap B şıkkıdır.
20.Soru
Aşağıdakilerden hangisi nicel değişkenlerden elde edilen gözlem değerleri arasındaki yakınlığın belirlenmesinde yararlanılan ölçülerden biri değildir?
Karl Pearson Uzaklığı |
Thales Uzaklığı |
Öklid Uzaklığı |
Manhattan Uzaklığı |
Mahalanobis Uzaklığı |
Thales uzaklığı, nicel değişkenlerden elde edilen gözlem değerleri arasındaki yakınlığın belirlenmesinde yararlanılan ölçülerden biri değildir.
-
- 1.SORU ÇÖZÜLMEDİ
- 2.SORU ÇÖZÜLMEDİ
- 3.SORU ÇÖZÜLMEDİ
- 4.SORU ÇÖZÜLMEDİ
- 5.SORU ÇÖZÜLMEDİ
- 6.SORU ÇÖZÜLMEDİ
- 7.SORU ÇÖZÜLMEDİ
- 8.SORU ÇÖZÜLMEDİ
- 9.SORU ÇÖZÜLMEDİ
- 10.SORU ÇÖZÜLMEDİ
- 11.SORU ÇÖZÜLMEDİ
- 12.SORU ÇÖZÜLMEDİ
- 13.SORU ÇÖZÜLMEDİ
- 14.SORU ÇÖZÜLMEDİ
- 15.SORU ÇÖZÜLMEDİ
- 16.SORU ÇÖZÜLMEDİ
- 17.SORU ÇÖZÜLMEDİ
- 18.SORU ÇÖZÜLMEDİ
- 19.SORU ÇÖZÜLMEDİ
- 20.SORU ÇÖZÜLMEDİ