Veri Madenciliği Ara 1. Deneme Sınavı
Toplam 8 Soru1.Soru
Minkowski uzaklığı, n sayıda birim ve p sayıda değişken ile çalışılırken birimler yada değişkenler arasındaki uzaklıkları hesaplamak için kullanılan genel bir uzaklık ölçüsüdür. Minkowski uzaklığı L? norm olarak da bilinir. ?=1 olarak alınırsa hangi uzaklığa dönüşür?
Öklid Uzaklığı |
Karl Pearson Uzaklığı |
Manhattan (City-Block) Uzaklığı |
Jaccard Benzerlik Uzaklığı |
Mahalanobis Uzaklığı |
Minkowski uzaklık formülünde ?=1 olarak alınırsa Manhattan (City-Block) Uzaklığına dönüşür.
Doğru cevap C şıkkıdır.
2.Soru
I. İşlemsel veri tabanı
II. Veri
III. Veri ambarı
IV. Veri tabanı
Yukarıdakilerden hangileri veri madenciliği çalışmaları yapmak için var olması gereken temel ögelerdir?
II ve IV |
II ve III |
I ve II |
Yalnız III |
I ve IV |
Veri madenciliği çalışmaları yapmak için var olması gereken iki temel öge veri ve veri- tabanıdır. Bununla birlikte burada sözü edilen veritabanı, işletmelerin günlük kayıtlarının yer aldığı ve işlemsel veritabanı olarak adlandırılan veri tabanları değildir.
3.Soru
R yazılımında
x<-c(1,3,(t+v),ist,%,3^5) olarak tanımlanan vektörde;
>lenght(x) fonksiyonu yazıldığında elde edilecek değer kaçtır?
5 |
6 |
7 |
8 |
9 |
Önceden tanımlanmış bir vektörün birim sayısını öğrenmek için length () fonksiyonu kullanılır.
length (x)=6
Doğru cevap B şıkkıdır.
4.Soru
Elde var olan mevcut sınıflanmış veriler kullanarak yeni bir verinin mevcut sınıflardan herhangi birine girme olasılığını hesaplayan yönteme ne ad verilir?
Genetik algoritmalar |
Zaman serisi analizi |
Yapay sinir ağları |
Bayes sınıflandırması |
Karar ağaçları |
Elde var olan mevcut sınıflanmış veriler kullanarak yeni bir verinin mevcut sınıflardan herhangi birine girme olasılığını hesaplayan yönteme bayes sınıflandırması denilmektedir. Bu nedenle doğru cevap D seçeneğidir.
5.Soru
Aşağıdakilerden hangisi veri madenciliğinde temel değişken tipleri arasında değildir?
İsimsel(Nominal) |
İkili(Binary) |
Komplex (Complex) |
Sıra Gösteren(Ordinal) |
Tamsayılı(Integer) |
Veri madenciliğinde temel değişken tipleri; İsimsel (Nominal), İkili (Binary), Sıra Gösteren (Ordinal), Tamsayılı (Integer), Aralıklı Ölçümlendirilmiş (IntervalScaled), Oranlı Ölçümlendirilmiş (Ratio-Scaled) değişkenler olmak üzere gruplandırılabilir.
6.Soru
I. Büyük miktarda veri içerisinden anlamlı ve yararlı ilişki kurallarını ortaya çıkarmak
II. Elde edilen bilgi ile kâr sağlamak
III. Veriler arasındaki örüntüleri ve ilişkileri keşfetmek
IV. Topluma faydalı olacak verileri ortaya koyabilmek
Yukarıdakilerden hangileri veri madenciliğinin tanımını oluşturan özelliklerdendir?
I ve IV |
II ve III |
I ve III |
III ve IV |
Yalnız IV |
- Veri madenciliği, büyük miktardaki veri yığınları üzerinde analiz yaparak veriler ara- sında var olan ve geleceğin tahmin edilmesine yardımcı olacak anlamlı ve yararlı ilişki ve kuralların bilgisayar yazılımları aracılığıyla aranması faaliyetleridir.
- Veri madenciliği, çeşitli analiz araçlarını kullanarak veriler arasındaki örüntü (desen) ve ilişkileri keşfederek, bunları doğru tahminler yapmak için kullanan bir süreçtir.
- Veri madenciliği, veri analizi için, gelişmiş ve karmaşık araçlar kullanarak yığın veri kümeleri içinden daha önceden bilinmeyen olgu ve olayları keşfetmek ve veriler arasındaki mantıklı ilişkileri ve kalıpları ortaya çıkarmak amacıyla yapılan çalışmalardır.
- Veri madenciliği, istatistiksel ve matematiksel tekniklerle birlikte örüntü tanıma tekno- lojilerini kullanarak çeşitli depolama ortamlarında kayıtlı bulunan veri yığınları üzerinde gerçekleştirilen elemeler sonucunda anlamlı yeni korelasyon, örüntü ve eğilimlerin keş- fedilmesi sürecidir.
- Yığın veri içinden anlamlı ilişkiler çıkarma ve yararlı bilgilere dönüştürme işlemine zaman içerisinde; bilgi çıkarımı, enformasyon keşfi, enformasyon hasadı, veri arkeolojisi, veri örüntü işleme, veri şablon işleme gibi farklı isimler verilmiştir.
- Burada belirtilmesi gereken diğer bir nokta, veri madenciliği kavramı ile veritabanla- rında bilgi keşfi kavramının zaman zaman aynı anlamda kullanıldığıdır. Ancak bu doğru bir kullanım değildir. C¸ünkü veri madenciliği, veritabanlarında bilgi keşfi sürecinin yalnızca bir adımıdır.
7.Soru
Veri madenciliğine etki eden disiplinler düşünüldüğünde verilerin işlenmesinde algoritmalar aracılığıyla sonuçlar elde edilmesi işlemlerini gerçekleştiren disiplin seçeneklerden hangisidir?
İstatistik |
Veritabanı sistemleri |
Görselleştirme |
Örüntü tanıma |
Makine öğrenimi |
Makine öğrenimi bilgisayarların kendisine algoritmalar yoluyla verilen kuralları uygulaması ve büyük veri kümeleri içinden örnekler çıkararak verileri bu kurallara göre sınıflamaları, tanımlamaları ve dolayısıyla öğrenmeleri olarak ifade edilebilir. Bu öğrenmeler sonucunda çıkarımlarda bulunarak geçmiş veri örnekleri yardımıyla gelecekte daha iyi sonuçlar üretme konusunda veri madenciliği uygulamasına katkıda bulunurlar.
8.Soru
Bilgisayarların bazı işlemlerden çıkarsamalar yaparak yeni işlemler üretmesine ne ad verilmektedir?
İstatistik |
Makine öğrenimi |
Görselleştirme |
Veritabanı sistemleri |
Örüntü tanıma |
Bilgisayarların bazı işlemlerden çıkarsamalar yaparak yeni işlemler üretmesine makine öğrenimi denilir. Bu nedenle doğru cevap B olmaktadır.