Veri Madenciliği Final 1. Deneme Sınavı
Toplam 20 Soru1.Soru
Bir veri yığınındaki düzensizliğin, rassallığın miktarını ölçmek için kullanılan ölçüye ne ad verilir?
Gini indeksi |
Entropi indeksi |
Sınıflandırma hatası indeksi |
Twoing ölçüleri |
En küçük kareler sapması yöntemi |
Entropi, bir veri yığınındaki düzensizliğin, rassallığın miktarını ölçmek için kullanılan bir ölçüdür.
2.Soru
Aşağıdakilerden hangisi veritabanı yönetim sisteminin özelliklerinden biri değildir?
Veritabanı oluşturmak |
Veritabanının bakımını yapmak |
Veritabanının farklı kullanıcı yetkilerini belirlemek |
Veritabanını görselleştirmek |
Veritabanında işlem yapmak |
Veritabanını görselleşmek, veritabanı yönetim sisteminin özelliklerinden biri değildir. Doğru cevap D'dir.
3.Soru
Belirlenen destek ve güven eşik değerleri üzerinde destek ve güven değerine sahip ilişki kuralına ne denir?
Güven eşik değeri |
Destek eşik değeri |
Güven |
Destek |
Güçlü kural |
Belirlenen destek ve güven eşik değerleri üzerinde destek ve güven değerine sahip ilişki kuralına güçlü kural denir. Doğru cevap E'dir.
4.Soru
Aşağıdakilerden hangisi karar ağaçlarının avantajlarından birisi değildir?
Açıklanmalarının kolay olması |
İnsani karar almayı daha iyi yansıtması |
Grafiksel olarak gösterilebilir olması |
Uzmanlar tarafından kullanılmaları |
Nitel değişkenleri de işleyebiliyor olmaları |
Karar ağaçları, karar vericinin içinde bulunduğu karar verme probleminde ortaya çıkabilecek tüm durumları ve karar vericinin karşılaşabileceği tüm senaryoları bir arada gösterebilen bir grafiksel yaklaşımdır. Karar ağaçlarının bazı avantajları,
• Açıklanmalarının kolay olması,
• İnsani karar almayı diğer yaklaşımlara göre daha iyi yansıtması,
• Grafiksel olarak gösterilebilir olması,
• Uzman olmayan kişiler tarafından da kolaylıkla yorumlanabilir olması,
• Temsili değişkenlere ihtiyaç duymadan nitel değişkenleri de işleyebiliyor olmalarıdır
5.Soru
Yeni bir kümenin oluşumunda K. ve L. kümelerin J. küme ile olan uzaklıkları toplamının yarısı olarak hesaplanan birleştirici kümeleme yöntemi hangisidir?
Ortalama Bağlantı Kümeleme Yöntemi |
McQuitty Bağlantı Kümeleme Yöntemi |
Küresel Ortalama Bağlantı Kümeleme Yöntemi |
Medyan Bağlantı Kümeleme Yöntemi |
Ward Bağlantı Kümeleme Yöntemi |
McQuitty bağlantı kümeleme yönteminde; m. kümenin oluşumunda k. ve l. kümelerin j.
küme ile olan uzaklıkları toplamının yarısı (ortalaması) hesaplanır. Ağırlıksız ortalama
bağlantı yöntemi ismi ile de literatürde sıklıkla kullanılmaktadır.
6.Soru
Kümeleme analiz sonuçlarının sunulduğu grafiksel yöntemlerin adı nedir?
Dendrogram |
Birim |
McQuitty Bağlantısı |
Ward Bağlantısı |
Ayırıcı aşama |
Kümeleme analizinde sonuçlar dendrogram (ağaç diyagramı) adı verilen grafiksel yöntemle sunulurlar. Dendrogramlarda bağlantılar, uzaklıklar ve birimlerin bağlanma düzeyleri bir ağaç biçiminde ele alınarak şekillendirilir ve kümelenme süreci bu şekilde ayrıntılı bir biçimde özetlenir.
7.Soru
Nitelik değerlerinin sola ve sağa olmak üzere iki bölüme ayrılması işlemi hangi indeks yoluyla yapılabilmektedir?
Gini indeksi |
Entropi indeksi |
Sınıflandırma hatası indeksi |
Twoing ölçüleri |
En küçük kareler sağması yöntemi |
Gini indeksi, ikili bölünmeye dayanan bir tekniktir. Bu indeksin hesaplanmasında nitelik değerlerinin sola ve sağa olmak üzere iki bölüme ayrılması işlemi yürütülür.
8.Soru
Bir ürünle ilgili olarak; Çok kötü=0, Kötü=1, Orta=2, İyi=3, ve Çok iyi=4 olmak üzere değerlendirilme yapılmıştır ve sırasıyla Kötü ve Çok iyi olarak iki ürün tespit edilmiştir. Buna göre bu iki ürün arasındaki uzaklık değeri aşağıdakilerden hangisidir?
0 |
1 |
2 |
3 |
4 |
d(x,y)=|x-y|=|1-4|=3
9.Soru
Web içerik madenciliğinde; bilgiye erişim yaklaşımı temeline dayanan, bilgiye erişimi çok daha kolay hâle getiren enstrüman hangisidir?
Sunucusu |
Arama motorları |
OLAP |
Veri tabanı |
HTML |
Arama motorları:Arama motorları ise klasik bilgiye erişimi çok daha kolay hâle getiren,bilgiye erişim yaklaşımı temeline dayanan web içerik madenciliğinin vazgeçilmez bir enstrümanıdır.
10.Soru
Herhangi web sitesinin yapısal özetini, yani kendi içerisindeki sayfalarla ve diğer sitelerle olan bağlantı yapılarını elde ederek, bu yapılardan yararlı bilginin ortaya çıkarılmasına ne denir?
Veri Madenciliği |
Web Madenciliği |
Web Yapı Madenciliği |
Web Görüş Madenciliği |
Web Tarama Madenciliği |
Web Yapı Madenciliği: Web yapı madenciliği, web sitesinin yapısal özetini yani kendi içerisindeki sayfalarla ve diğer sitelerle olan bağlantı yapılarını elde ederek, bu yapılardan yararlı bilginin ortaya çıkarılması olarak tanımlanabilir
11.Soru
Yukarıda verilen bilgilere göre hangisi doğrudur?
1. Kümede toplam 6 ülke yer almaktadır. |
2 .Kümede toplam 5 ülke yer almaktadır. |
3 Kümede yer alan ülkeler Bosna Hersek, Nijerya, Slovenya, Brezilya ve Türkiye'dir. |
4.kümede toplam 4 ülke yer almaktadır. |
Bir kümede en fazla bulunan ülke sayısı 4. kümedir. |
Yanıt C' devierlen küme ve ülke doğru verilmiştir.
12.Soru
Aşağıdakilerden hangisi kümeleme analizinin özellikleri arasında sayılamaz?
Tahmin amaçlı kullanılmaz |
Varsayımlarda bulunmaz |
Genellikle dört aşamada gerçekleşir. |
Uygulama aşamasında çok fazla varsayıma ihtiyaç duyar |
Çoklu bağıntıya dikkat ister |
Uygulamada aşamasındaki temel varsayımların karşılanmasına gerek yoktur.
13.Soru
Aşamalı olmayan kümele yöntemleri için aşağıdaki ifadelerden hangisi yanlıştır?
Aşamalı olmayan kümelemede hem birimler hem de değişkenler birbirleriyle farklı benzerlik düzeylerinde kümeler oluşturur. |
Aşamalı olmayan kümelemede birbirleri ile benzer birimlerin aynı kümede toplanması koşuluyla veri setindeki n birimin k sayıda kümeye ayrılması amaçlanmaktadır |
Eğer oluşturulacak küme sayısı ile ilgili olarak önsel bir bilgi var ise aşamalı olmayan kümeleme yöntemleri kullanmak daha çok tercih edilmektedir |
Aşamalı olmayan kümeleme yöntemleri büyük veri setleri için daha uygundur |
Aşamalı olmayan kümeleme yöntemleri veri setinde bulunan aşırı uç değerlerden daha az etkilenmektedir. |
Aşamalı olmayan kümeleme yöntemleri birimlerin kendi içinde homojen ve kendi aralarında heterojen olan kümelere ayrılmasını hedefleyen ve elde edilen kümeler aracılığı ile alt toplum yapılarına ilişkin tahmin yapmayı amaçlayan yöntemlerdir. Aşamalı kümelemede hem birimler hem de değişkenler birbirleriyle farklı benzerlik düzeylerinde kümeler oluştururken, aşamalı olmayan kümeleme yöntemlerinde sadece birimler kümelenmektedir. Birbirleri ile benzer birimlerin aynı kümede toplanması koşuluyla veri setindeki n birimin k sayıda kümeye ayrılması amaçlanmaktadır. Bu yöntemlerde küme sayısı önceden belirlenir. Diğer bir ifadeyle, eğer oluşturulacak küme sayısı ile ilgili olarak önsel bir bilgi var ise aşamalı olmayan kümeleme yöntemleri kullanmak daha çok tercih edilmektedir. Örneğin; kabul gören sağlık veya ekonomik göstergeler bakımından ülkeler 4 farklı kümeye ayrılmak istenilebilir. Bu kümeler ise, geri kalmış, az gelişmiş, gelişmekte olan, gelişmiş ülkeler olarak isimlendirilebilir.
Aşamalı kümeleme yöntemleri daha çok küçük veri setleri için uygundur. Buna karşılık aşamalı olmayan kümeleme yöntemleri ise daha çok büyük veri setlerine uygulanmaktadır. Bunun nedeni aşamalı olmayan kümeleme yöntemlerinde başlangıçta benzerlik ve uzaklık matrislerinin hesaplanmamasıdır. Ayrıca aşamalı olmayan kümeleme yöntemleri veri setinde bulunan aşırı uç değerlerden daha az etkilenmektedir.
Aşamalı olmayan Kümeleme Yöntemleri arasında en yaygın kullanılan yöntem K-ortalamalar kümeleme (k-means clustering, MacQueens’ Method) yöntemidir. Bu yöntem birçok istatistik hazır yazılımda bulunmaktadır. Bunun dışında Medoid kümeleme ve Fuzzy kümeleme gibi aşamalı olmayan kümeleme yöntemleri de bulunmaktadır.
Bu nedenle doğru yanıt a) seçeneğidir
14.Soru
Apriori algoritmasının 1. Adımının ilk aşaması aşağıdakilerden hangisidir?
L1 sık görülen nesne setleri kümesi elemanlarının ikili kombinasyonları alın- mak suretiyle birbirinden farklı tüm 2 adet nesne içeren nesne setleri oluşturulur. Ve oluşturulan bu nesne setlerinin destek değerleri hesaplanır. |
Hesaplanan destek değerleri içerisinden destek eşik değeri olarak verilen 0,50 değerinin üzerinde destek değerine sahip nesne setlerinden bir nesneli sık görülen nesne kümesi L1 oluşturulur. |
I nesneler kümesindeki 1 adet nesne içeren nesne setleri belirle- nir ve belirlenen her bir nesne seti için destek değerleri hesaplanır. |
2 adet nesne içeren nesne setleri için hesaplanan destek değerleri içerisinden verilen destek eşik değeri 0,50 değerine eşit veya üzerinde destek değerine sahip nesne setlerinden iki nesneli sık görülen nesne setleri kümesi L2 oluşturulur. |
Bu aşama giderek artan hesap yükünü azaltabilmek ve tekrar hesaplamalardan kaçınmak adına önceki aşamalarda elde edilen önsel bilgilerin değerlendirildiği aşamadır ve birleştirme ve budama adımlarından oluşur. |
İlk aşamada I nesneler kümesindeki 1 adet nesne içeren nesne setleri belirle- nir ve belirlenen her bir nesne seti için destek değerleri hesaplanır. Doğru cevap C'dir.
15.Soru
Beş değişken sonucunda R programının verdiği sonuçlar aşağıdaki gibidir. Verilen bilgilere ögre aşağıdakilerden hangisi doğru olur? (9. ve 10. soruyu verilen bilgilere göre cevaplayınız).
Türkiye 1. kümededir. |
5 küme oluşmuştur. |
Potekiz 2. kümededir. |
İyalya 2.kümededir. |
Avusturya 1. kümededir. |
Verilere göre İtalya 2. kümede yer almaktadır.
16.Soru
A⇒B şeklinde ifade edilen bir ilişki kuralının Destek (A⇒B) destek değeri; |A|, tüm işlemler içerisinde A nesne setini içeren işlem sayısını; |D|, işlemler veritabanındaki tüm işlemlerin sayısını; |A∪B|, tüm işlemler içerisinde hem A hem de B nesne setlerini birlikte içeren işlem sayısını ifade ederken, , aşağıdaki eşitliklerden hangisi ile hesaplanır?
Destek(A⇒B)=| A∪B | / | D | |
Destek(A⇒B)=| D | / | A∪B | |
Destek(A⇒B)= |A | * | B | / |A∪B| |
Destek(A⇒B)=| A∪B | / | A | * | B | |
Destek(A⇒B)=| A∪B | * | D | |
Bir nesne seti için destek değeri hesaplanabileceği gibi, benzer mantıkla A⇒B şeklinde ifade edilen bir ilişki kuralı için de destek değeri hesaplanabilir. Bir ilişki kuralının destek değeri, D işlemler veritabanında A ve B nesne setlerini birlikte içeren işlem sayısının veritabanındaki tüm işlemlerin sayısına oranı şeklinde elde edilir ve
Destek(A⇒B)=|A∪B|/|D|
eşitliği ile hesaplanır. Eşitlikte |A∪B|, tüm işlemler içerisinde hem A hem de B nesne setlerini birlikte içeren işlem sayısını ifade eder. Aslında bir ilişki kuralının destek değeri, o kuralın öncül (A) ve sonuç (B) kısmındaki nesne setlerinin birlikte gözlenme olasılığıdır ve P(A∪B) şeklinde ifade edilir.
Bu nedenle doğru yanıt a) seçeneğidir.
17.Soru
Kullanıcıların belirli bir zaman aralığındaki farklı oturumları arasında bir birini takip eden kullanıcı hareketleri arasındaki ilişkilerinin ortaya konulmasına ne denir?
İstatiksel Analiz |
İlişki Kuralları: |
Sınıflandırma Analizi |
Sıralı Örüntüler |
Kümeleme Analizi |
Sıralı Örüntüler: Sıralı örüntüler ile kullanıcıların belirli bir zaman aralığındaki farklı oturumları arasında birbirini takip eden kullanıcı hareketleri arasındaki ilişkilerinin ortaya konulmasıdır.
18.Soru
'Bir rassal değişkenin seçtiğimiz modele göre parametrelerinin yerine konulması ile elde edilen değer' olarak ifade edilen kavram aşağıdakilerden hangisidir?
kestirim |
sınıflandırma |
girdi |
nitelik değerler |
gruplandırma |
Kestirim, bir rassal değişkenin seçtiğimiz modele göre parametrelerinin yerine konulması ile elde edilen değerdir.
19.Soru
Aşağıdakilerden hangisi karar ağacı oluşturma algoritmalarından birisi değildir?
CHAID |
QUEST |
NAIVE BAYESIAN |
SLIQ |
C4.5 |
Sınıflandırma problemlerinde bir karar ağacının oluşturulması için farklı algoritmalardan yararlanılabilir. Bu algoritmalara örnek olarak ID3, C4.5, CART, CHAID, QUEST, SLIQ, SPRINT ve MARS verilebilir.
20.Soru
aşağıdakilerden hangisi web madenciliği uygulama alanlarından biridir?
Bankacılık |
Pazarlama |
İmalat |
Sağlık |
E-öğrenme |
E-öğrenme
-
- 1.SORU ÇÖZÜLMEDİ
- 2.SORU ÇÖZÜLMEDİ
- 3.SORU ÇÖZÜLMEDİ
- 4.SORU ÇÖZÜLMEDİ
- 5.SORU ÇÖZÜLMEDİ
- 6.SORU ÇÖZÜLMEDİ
- 7.SORU ÇÖZÜLMEDİ
- 8.SORU ÇÖZÜLMEDİ
- 9.SORU ÇÖZÜLMEDİ
- 10.SORU ÇÖZÜLMEDİ
- 11.SORU ÇÖZÜLMEDİ
- 12.SORU ÇÖZÜLMEDİ
- 13.SORU ÇÖZÜLMEDİ
- 14.SORU ÇÖZÜLMEDİ
- 15.SORU ÇÖZÜLMEDİ
- 16.SORU ÇÖZÜLMEDİ
- 17.SORU ÇÖZÜLMEDİ
- 18.SORU ÇÖZÜLMEDİ
- 19.SORU ÇÖZÜLMEDİ
- 20.SORU ÇÖZÜLMEDİ