Veri Madenciliği Final 9. Deneme Sınavı
Toplam 20 Soru1.Soru
6 adet nesne içerisinden oluşturulabilecek nesne set sayısı kaç olur
64 |
65 |
63 |
66 |
31 |
nesne setlerinden bir tanesi boş kümedir ve boş küme ilişki kuralı belirlemek amacıyla kullanılamayacağından dolayı ilişki kuralı belirlemede kullanılacak nesne seti sayısı
2m-1 tane olur. Sonuç 26-1=63 tane nesne setidir.
2.Soru
I. Hangi kümeye ait olduğu bilinmeyen bir grup verinin, sınıflandırılarak anlamlandırılması,
II. Benzer olanları farklı olandan ayırmak,
III. Doğal grup yapılarını belirlemek, homojen alt gruplara ayırabilmek,
Yularıdakilerden hangisi ya da hangileri kümeleme analizinin temel amaçları şeklinde ifade edilebilir?
Yalnız II |
I-III |
I-II-III |
Yalnız III |
II-III |
Verilen ifadelerin tamamı kümeleme analizi amaçları arasındadır.
3.Soru
Aşamalı olmayan Kümeleme Yöntemleri arasında en yaygın kullanılan yöntem aşağıdakilerden hangisidir?
K-ortalamalar kümeleme |
Medoid kümeleme |
Fuzzy kümeleme |
Medyan bağlantı kümeleme |
Ward bağlantı kümeleme |
Aşamalı olmayan Kümeleme Yöntemleri arasında en yaygın kullanılan yöntem K-ortalamalar kümeleme (k-means clustering, MacQueens’ Method) yöntemidir. Bu yöntem birçok istatistik hazır yazılımda bulunmaktadır. Bunun dışında Medoid kümeleme ve Fuzzy kümeleme gibi aşamalı olmayan kümeleme yöntemleri de bulunmaktadır.
Bu nedenle doğru yanıt a) seçeneğidir
4.Soru
Aşağıdakilerden hangisi pazar sepeti analizinin faydalarından biri değildir?
Müşterinin kişisel tercihlerinin belirlenmesine yarar |
Müşteri portföyünün genişlemesine yarar |
Birlikte satışa sunulacak ürünlerin belirlenmesini sağlar |
Ürün satış raflarının tasarlanmasına yardım eder |
Promosyon düzenlemelerine imkan verir |
Pazar sepeti analizi, müşteri portföyünün genişlemesine olanak sağlamaz. Doğru cevap B'dir.
5.Soru
aşağıdakilerden hangisi veri toplama döneminde (1960) kullanılan teknolojilerden biridir?
İnternet |
Devasa ölçekli veritabanı |
Çok büyük veritabanları |
Gelişmiş algoritmalar |
Bilgisayar |
Bilgisayar
6.Soru
Aşağıdakilerden hangisi kümeleme analizi uygulamasının ilk basamağını oluşturur?
Benzerlik matrislerinin hesaplanması |
Kümelemede esas alınacak yöntemlerin belirlenmesi |
Elde edilen sonuçların yorumlanması |
Veri matrisinin oluşturulması |
Uzaklık matrislerinin hesaplanması |
Kümeleme analizi genellikle dört aşamada uygulanmaktadır. Bunlar; veri matrisinin oluşturulması, benzerlik veya uzaklık matrislerinin hesaplanması, kümelemede esas alınacak yöntemlerin belirlenmesi ve elde edilen sonuçların yorumlanmasıdır.
7.Soru
İki obje arasındaki benzerliği ölçmede en yaygın kullanılan uzaklık ölçüsü olup iki obje arasına çizilecek bir doğrunun uzunluğunu temel alan ölçüye ne ad verilir?
Karesel Pearson uzaklığı |
Manhattan (City-Blok) Uzaklığı |
Korelasyon uzaklığı |
Açısal uzaklık |
Öklid uzaklığı |
Öklid uzaklığı iki obje arasındaki benzerliği ölçmede en yaygın kullanılan uzaklık ölçüsü olup iki obje arasına çizilecek bir doğrunun uzunluğunu temel alır.
8.Soru
“Web bağlantı yapılarının modellenmesi” hangi web madenciliği
sınıfının temel amacıdır?
Sosyal medya madenciliği |
Web yapı madenciliği |
Web profil madenciliği |
Web içerik madenciliği |
Web kullanım madenciliği |
Web yapı madenciliği, web sitesinin yapısal özetini yani kendi içerisindeki sayfalarla ve diğer
sitelerle olan bağlantı yapılarını elde ederek, bu yapılardan yararlı bilginin ortaya çıkarılması
olarak tanımlanabilir. Bu sayede web sayfaları sınıflandırılabilir ve farklı web siteleri
arasındaki benzerlik ve ilişkiler ortaya çıkarılabilir. Böylece web sitelerinin verimlilik
ve kullanışlılık değerlendirmeleri yapılabilir. Web yapı madenciliği ile internet ortamında
birçok insan tarafından başvurulan ve alanında otorite olarak nitelendirilen önemli web
sayfaları da belirlenebilmektedir.
9.Soru
Apriori algoritması ile ilişki kuralı oluşturma adımları içerisinde hangi adımda birleştirme ve budama işlemleri gerçekleştirilir?
Aşama 1 |
Aşama 2 |
Aşama 4 |
Aşama 5 |
Aşama 6 |
Bu aşama giderek artan hesap yükünü azaltabilmek ve tekrar hesaplamalardan kaçınmak adına önceki aşamalarda elde edilen önsel bilgilerin değerlendirildiği aşamadır ve birleştirme ve budama adımlarından oluşur.
10.Soru
aşağıdakilerden hangisi web madenciliğinin sürecinin temel adımlarından biri değildir?
Kaynakların Tespiti |
Bilgi Seçimi ve Ön İşleme |
Genelleştirme |
Analiz |
Uzmanların Tespiti |
Uzmanların Tespiti
11.Soru
bir veri yığınındaki düzensizliğin, rassallığın miktarını ölçmek için kullanılan ve en iyi ayırıcı niteliğin seçilmesi için kullanılan ölçü aşağıdakilerden hangisidir?
Sınıflandırma hatası indeksi |
Gini İndeksi |
Entropi İndeksi |
Twoing indeksi |
En Küçük Kareler Sapması yöntemi |
Entropi, bir veri yığınındaki düzensizliğin, rassallığın miktarını ölçmek için kullanılan bir ölçüdür. Entropisi 0 olan bir grubun tam homojen bir grup, entropisi 1 olan grubun ise tam heterojen olduğu söylenebilir.
Doğru cevap C şıkıdır.
12.Soru
Hem veri madenciliğinin temeli olarak değerlendirilen hem de veri hazırlama aracı olarak kullanılan veri madenciliği yöntemi hangisidir?
Sınıflandırma |
Kümeleme analizi |
Birliktelik kuralları |
Pazar sepeti analizleri |
Faktör analizi |
Sınıflandırma, veri madenciliğinde sıklıkla kullanılmaktadır. Üzerinde çalışılan veritabanının bir kısmı eğitim seti olarak ele alınır ve buradan hareketle sınıflandırma kuralları oluşturulur. Bu kurallar yardımıyla yeni bir durum ortaya çıktığında nasıl karar verileceği belirlenir. Veri madenciliği yönteminin sınıflandırma grubu içerisinde en sık kullandığı teknik “karar ağaçları”dır. Aynı zamanda lojistik regresyon, diskriminant analizi, sinir ağları ve fuzzy setleri de sıklıkla kullanılmaktadır. İnsanlar yüzyıllardır verileri sınıflandırdıkları, kategorize ettikleri ve derecelendirdikleri için sınıflandırma, işlemi hem veri madenciliğinin temeli olarak hem de veri hazırlama aracı olarak kullanılmaktadır.
13.Soru
Sık görülen nesne setleri elde etmek için aşağıdaki işlemlerden hangisi uygulanır?
Karar verici tarafından belirlenen destek eşik değerine eşit ya da daha yüksek destek değerine sahip nesne setleri belirlenir. |
Karar verici tarafından belirlenen destek eşik değerinden daha küçük destek değerine sahip nesne setleri belirlenir. |
Karar verici tarafından belirlenen güven eşik değerine eşit ya da daha yüksek destek değerine sahip nesne setleri belirlenir. |
Karar verici tarafından belirlenen güven eşik değerinden daha küçük güven değerine sahip nesne setleri belirlenir. |
Karar verici tarafından belirlenen kaldıraç değerine eşit ya da daha yüksek kaldıraç değerine sahip nesne setleri belirlenir. |
İlginç ilişki kuralı elde edebilmek için öncelikle nesne setlerinin destek değerleri he- saplanır. Belirlenen destek eşik değerine eşit ya da bu değerin üzerinde destek değerine sahip nesne setleri ilişki kuralları oluşturmada kullanılacak nesne setleridir. Destek eşik değerini geçen ve kural oluşturmada kullanılacak nesne setleri sık görülen nesne setleri (frequent itemset) olarak adlandırılır.
Bu nedenle doğru yanıt a) seçeneğidir.
14.Soru
Düğüm ve dal bileşenlerinden oluşan grafiksel tekniğe ne ad verilir?
Karar ağacı |
Tableau yazılımı |
Entropi indeksi |
Ayırma kriteri |
Gini indeksi |
Sınıflandırma tekniklerinden birisi de karar ağaçlarıdır. Karar ağaçları ile ilgili bazı kavramların detaylı bir şekilde ele alınmasında büyük fayda bulunmaktadır. En basit anlamıyla karar ağacı, düğüm ve dal bileşenlerinden oluşan ve Şekil 6.1’de yer alan ağaca benzer bir yapıya sahip grafiksel bir tekniktir.
15.Soru
Aşağıdakilerden hangisinde yaprak düğümlerinde bir sınıf kestirimi yerine sayısal bir değer kestirimini içeren regresyon ağacı da oluşturulabilmektedir?
ID3 |
C4.5 |
CHAID |
CART |
QUEST |
CART algoritmasının önemli bir işlevi ise, yaprak düğümlerinde bir sınıf kestirimi yerine sayısal bir değer kestirimini içeren regresyon ağacı da oluşturabilmesidir.
16.Soru
aşağıda veri madenciliğine ilişkin verilen bilgilerden hangisi doğrudur?
amacı web belgelerinden bilgi çıkarsamaktır |
Çevrimiçi veriler kullanılır |
Web içerik madenciliği tekniğini kullanır |
Web yapı madenciliği tekniğini kullanır |
Yapay sinir ağlarını kullanır |
Yapay sinir ağlarını kullanır
17.Soru
Aşağıdakilerden hangileri veri miktarının sürekli katlanarak arttığı veri tabanları içinden, faydalı bilgilerin nasıl çıkarılabileceği konusunda gerçekleştirilen çalışmaların ilki olarak öne çıkmaktadır?
Aşağıdakilerden hangileri veri miktarının sürekli katlanarak arttığı veri tabanları içinden, faydalı bilgilerin nasıl çıkarılabileceği konusunda gerçekleştirilen çalışmaların ilki olarak öne çıkmaktadır?
KPP |
ERP |
CRM |
KDD |
ERA |
1990’lara gelindiğinde ise artık araştırma konusu; veri miktarının sürekli katlanarak arttığı veri tabanları içinden, faydalı bilgilerin nasıl çıkarılabileceği konusudur. Bu amaç- la pek çok çalışma ve yayın yapılmıştır. Bu çalışmalardan en önemlisi, 1989’da yapılan KDD (Knowledge Discovery in Database) IJCAI-89 Veri Tabanlarında Bilgi Keşfi C¸alışma Grubu toplantısıdır. 1991 yılında ise KDD (IJCAI)-89’un sonuç bildirgesi sayılabilecek “Knowledge Discovery in Real Databases: A Report on the IJCAI-89 Workshop” makalesi ile Bilgi Keşfi ve Veri Madenciliği ile ilgili temel tanım ve kavramlar ortaya konmuştur.
18.Soru
Aşağıdakilerden hangisi web madenciliği sürecinin, Veri Ön İşleme aşamasının adımlarından birisi değildir?
Verinin Temizlenmesi |
Kullanıcı Bilgisinin Belirlenmesi |
Oturum Bilgisinin Belirlenmesi |
İz (Yol) Tamamlama |
Verileri XML dosyası olarak depolama, bu konuyla lakalı değildir. |
Verileri XML dosyası olarak depolama bu konuyla alakalı değildir.
19.Soru
Aşağıdakilerden hangisi birleştirici aşamalı kümeleme yöntemlerinden biri değildir?
Macqueens k-ortalamalar kümeleme yöntemi |
Tek bağlantı kümeleme yöntemi |
Tam bağlantı kümeleme yöntemi |
Ortalama bağlantı kümeleme yöntemi |
Mcquitty bağlantı kümeleme yöntemi |
Birleştirici aşamalı kümeleme yöntemlerinde, birimlerin birbirleri ile birleştirilmesinde farklı yöntemler kullanılmaktadır. Bunlardan sıklıkla kullanılan ve genel kabul görmüş olanları aşağıdaki gibi sayılabilir.
- Tek Bağlantı Kümeleme Yöntemi (TekBKY, SINGLE Linkage [SLINK], En Yakın Komşuluk, Nearest Neighbour Method)
- Tam Bağlantı Kümeleme Yöntemi (TamBKY, COMPLETE linkage Method [CLINK], Furthest Neighbor Method)
- Ortalama Bağlantı Kümeleme Yöntemi (OrtBKY, AVERAGE Linkage Method, [ALINK])
- McQuitty Bağlantı Kümeleme Yöntemi (McQuitty linkage Method)
- Küresel Ortalama Bağlantı Kümeleme Yöntemi (KOBKY, CENTROID linkage Method)
- Medyan Bağlantı Kümeleme Yöntemi (MBKY, MEDIAN linkage Method)
- Ward Bağlantı Kümeleme Yöntemi (WBKY, WARD linkage Method, En Küçük Varyans Kümeleme Yöntemi)
Bu nedenle doğru yanıt a) seçeneğidir
20.Soru
İkili (binary) karar ağacı yapısından dolayı diğer algoritmalardan farklılık gösteren; ayırma kriteri için Entropi, Gini ve Twoing indekslerinden, karar ağacını budamak için ise maliyet-karmaşıklığı kriterinden faydalananan; yaprak düğümlerinde bir sınıf kestirimi yerine sayısal bir değer kestirimini içeren regresyon ağacını da oluşturulabilmesini sağlayan; 1984 yılında Breiman, Friedman, Olshen ve Stone tarafından önerilen sınıflandırma ve regresyon ağaçları algoritması aşağıdakilerden hangisidir?
CART |
CHAID |
QUEST |
ID3 |
C4.5 |
Kısaca CART olarak adlandırılan sınıflandırma ve regresyon ağaçları algoritması, ikili (binary) karar ağacı yapısından dolayı diğer algoritmalardan farklılık göstermektedir. Karar ağacındaki her bir düğüm yanlızca iki dala ayrılır. Ayırma kriteri için Entropi, Gini ve Twoing indekslerinden, karar ağacını budamak için ise maliyet-karmaşıklığı kriterinden faydalanılır. CART algoritmasının önemli bir işlevi ise, yaprak düğümlerinde bir sınıf kestirimi yerine sayısal bir değer kestirimini içeren regresyon ağacının da oluşturulabilmesidir. Bu durumda, ayırma kriteri olarak en küçük kareler sapması kriterine başvurulmaktadır. 1984 yılında Breiman, Friedman, Olshen ve Stone tarafından önerilmiştir.
Bu nedenle doğru yanıt a) seçeneğidir.
-
- 1.SORU ÇÖZÜLMEDİ
- 2.SORU ÇÖZÜLMEDİ
- 3.SORU ÇÖZÜLMEDİ
- 4.SORU ÇÖZÜLMEDİ
- 5.SORU ÇÖZÜLMEDİ
- 6.SORU ÇÖZÜLMEDİ
- 7.SORU ÇÖZÜLMEDİ
- 8.SORU ÇÖZÜLMEDİ
- 9.SORU ÇÖZÜLMEDİ
- 10.SORU ÇÖZÜLMEDİ
- 11.SORU ÇÖZÜLMEDİ
- 12.SORU ÇÖZÜLMEDİ
- 13.SORU ÇÖZÜLMEDİ
- 14.SORU ÇÖZÜLMEDİ
- 15.SORU ÇÖZÜLMEDİ
- 16.SORU ÇÖZÜLMEDİ
- 17.SORU ÇÖZÜLMEDİ
- 18.SORU ÇÖZÜLMEDİ
- 19.SORU ÇÖZÜLMEDİ
- 20.SORU ÇÖZÜLMEDİ