Veri Madenciliği Final 8. Deneme Sınavı
Toplam 20 Soru1.Soru
aşağıdakilerden hangisi web kullanım madenciliğinin temel uygulama alanlarından biri değildir?
Kişiselleştirme |
Sistem Geliştirme |
Web Sitesi Güncelleme |
İş Zekası |
veri tabanı güncelleme |
veri tabanı güncelleme
2.Soru
I = {a, b, c, d, e} şeklinde verilen beş nesne kümesi için {c} ve {c, d} sık görülen kümeler değil ise ve destek bazlı budama özelliğine göre bu nesne kümesi için ilişki kuralı oluşturulduğunda aşağıdakilerden hangisi bu nesne setinde değerlendirme dışında bırakılmaz?
{a, b, c} |
{a, b, c, d} |
{b, c, d, e} |
{a, d, e} |
{a, c, d, e} |
M = 5 adet nesne içeren bir I={a, b, c, d, e} nesneler kümesinden ilişki kuralı oluşturmada kullanılacak nesne seti sayısı 2m-1=32-1=31 tanedir.
Tüm bu 31 nesne seti içerisinden {c} ve {c, d} nesne setlerinin sık görülen nesne setleri olmadığı bilindiğine göre destek bazlı budama özelliğine göre bu 31 nesne seti içerisinden de {c} nesnesini içeren nesne setleri ve {c, d} nesnelerini içeren nesne setleri budanır ve değerlendirme dışı bırakılır. Dolayısıyla bu durumda {a, d, e} nesne seti {c} ve {c, d} nesne setlerinden birini içermediği için nesne seti olarak kalır.
3.Soru
R yazılımında function() komutu hngi komut ile sonlandırılır?
boxplot() |
return() |
hist() |
par(mfrow=c()) |
> ozetle() |
function() komutu, return() komutu ile sonlandırılır. Doğru cevap B'dir.
4.Soru
Aşağıdakilerden hangisi web madenciliği uygulama alanlarından değildir?
Bankacılık |
E-Öğrenme |
Dijital Kütüphaneler |
Elektronik Ticaret |
E- Devlet |
Bankacılık web madenciliğinin uygulama alanlarından birisi değildir.
5.Soru
Karar vericinin içinde bulunduğu karar verme probleminde ortaya çıkabilecek tüm durumları ve karar vericinin karşılaşabileceği tüm senaryoları bir arada gösterebilen bir grafiksel yaklaşıma nedir?
Kavram haritası |
Histogram |
Karar ağaçları |
Çoklu karşılaştırma yöntemleri |
Bireysel seçim teorisi |
Karar ağaçları, karar vericinin içinde bulunduğu karar verme probleminde ortaya çıkabilecek tüm durumları ve karar vericinin karşılaşabileceği tüm senaryoları bir arada gösterebilen bir grafiksel yaklaşımdır. Karar ağaçlarının bazı avantajları,
• Açıklanmalarının kolay olması,
• İnsani karar almayı diğer yaklaşımlara göre daha iyi yansıtması,
• Grafiksel olarak gösterilebilir olması,
• Uzman olmayan kişiler tarafından da kolaylıkla yorumlanabilir olması,
• Temsili değişkenlere ihtiyaç duymadan nitel değişkenleri de işleyebiliyor olmalarıdır.
Doğru cevap C şıkkıdır.
6.Soru
Aşağıdakilerden hangisi iletişim sektöründe, veri madenciliği ilişki kurallarının kullanıldığı alanlardan biridir?
Ek hizmet paketleri |
Hastalık ve tedavi geçmişinin belirlenmesi |
Yatırım ürünleri |
Krediler |
Sigorta dolandırıcılığı tedbiri |
İletişim sektöründeki müşterilerin isteğe bağlı olarak satın aldıkları telesekreter, çağrı aktarma, ilave süre, internet hızı ve internet kotası vb. gibi ek hizmet kullanımları, hizmet paketleri oluşturmak amacıyla kullanılabilir. Doğru cevap A'dır.
7.Soru
Ana hedefi şirket performansını artırmak ve pazarda rekabet avantajı sağlamak için insanların doğru kararlar almalarına yardımcı olmak olan web madenciliği sınıflandırması hangisidir?
Kişiselleştirme |
İş zekası |
Kullanım karakteristiği |
Örüntü analizi |
Sistem geliştirme |
İş zekasının ana hedefi şirket performansını artırmak ve pazarda rekabet avantajı sağlamak için insanların doğru kararlar almalarına yardımcı olmaktır. Web kullanım madenciliği müşteri davranışları hakkında bilgileri ayıklamak ve yararlı ve etkili bir veritabanı oluşturmak için uygun bir tekniktir. İnternet üzerinden yapılan ürün ve hizmet satışları için müşteri potansiyelini arttırmak, var olan müşterinin devamlılığını sağlamak, daha çok satış gerçekleştirebilmek ve daha etkin bir lojistik ve stok yönetimi gerçekleştirebilmek için web kullanım madenciliği sonuçlarından yararlanılabilir.
8.Soru
Veri madenciliğinin tarihsel süreci göz önünde bulundurulduğunda seçeneklerden günümüzde web madenciliğinde kullanılan bir teknolojidir?
Gelişmiş algoritmalar |
Çok işlemcili bilgisayarlar |
Çok büyük veritabanları |
İnternet |
Manyetik bantlar |
İnternet günümüzde kullanılan veri madenciliği teknolojilerinden birisidir. Diğer teknolojiler tarihsel süreçte önceden kullanılan teknolojilerdendir.
9.Soru
En yüksek kazancı sağlayan nitelik, ayırıcı nitelik olarak tanımlanır. Ancak, Entropi ve Gini indeksleri gibi indeksler belli değerleri çok sayıda bulunduran nitelikleri tercih etme eğilimindedirler. Dolayısıyla ayırma sayısı fazla olacaktır. Bu durumun sonucu aşağıdakilerden hangisini getirir?
Elde edilen veriler kesin sonuçlardır. |
Elde edilen sınıflar çok küçük sınıflar olacaktır. |
Araştırmacı güvenilir kestirimlere ulaşır. |
Ayırmanın ne kadar iyi olduğunu belirlemek için kullanılır. |
Kazanç oranı ölçütün hesaplanması izleyen eşitlik yardımıyla yürütülür. |
En yüksek kazancı sağlayan nitelik, ayırıcı nitelik olarak tanımlanır. Ancak, Entropi ve Gini indeksleri gibi indeksler belli değerleri çok sayıda bulunduran nitelikleri tercih etme eğilimindedirler. Dolayısıyla ayırma sayısı fazla olacağından elde edilen sınıflar çok küçük sınıflar olacaktır.
10.Soru
Bir A nesne setinin Destek(A) destek değeri, |A|, tüm işlemler içerisinde A nesne setini içeren işlem sayısını, |D| ise işlemler veritabanındaki tüm işlemlerin sayısını ifade ederken, aşağıdaki eşitliklerden hangisi ile hesaplanır?
Destek(A) = | A | / | D | |
Destek(A) = | D | / | A | |
Destek(A) = | A | * | D | / | A∪D | |
Destek(A) = | A | / | A∪D | |
Destek(A) = |D | / | A∪D | |
Bir A nesne setinin destek değeri, D işlemler veritabanında A nesne setini içeren işlem sayısının veritabanındaki tüm işlemlerin sayısına oranı şeklinde elde edilir ve
Destek(A) = | A |/ | D |
eşitliği yardımıyla hesaplanır. Eşitlikte |A|, tüm işlemler içerisinde A nesne setini içeren işlem sayısını, |D| ise işlemler veritabanındaki tüm işlemlerin sayısını ifade eder. Aslında bir A nesne setinin destek değeri, A nesne setindeki nesnelerin veritabanındaki işlemler içerisindeki bulunma olasığını ifade eder ve P (A) şeklinde gösterilir. Destek değeri [0,1] aralığında değer alır ve yüzde olarak yorumlanır.
Bu nedenle doğru yanıt a) seçeneğidir.
11.Soru
aşağıdakilerden hangisi web içerik madenciliğinin uygulama alanlarından biri değildir?
Kümeleme |
Sınıflandırma |
Örüntü ve kural çıkarımı |
Kullanıcı modellemesi |
Pazarlama |
Pazarlama
12.Soru
Destek bazlı budama yöntemi nedir?
Öncül(A) ve sonuç(B) nesne setleri arasındaki ilişkinin(korelasyonun) belirlenmesi temeline dayanarak hesaplanan kaldıraç(lift) değeri |
Belirlenen destek eşik değerini geçemeyen az elemanlı kümelerin üst kümeleri de destek eşik değerini geçemeyeceği için değerlendirme dışı bırakılması |
Belirlenen destek ve güven eşik değerleri üzerinde destek ve güven değerine sahip ilişki kuralı |
Destek eşik değerini geçen ve kural oluşturmada kullanılacak nesne setleri |
Kural için hesaplanacak destek ve güven değerleri ile ölçümü |
Apriori özelliğinin aksine, “Eğer bir alt küme sık görülen nesne kümesi değil ise, onun
bütün üst kümeleri de sık görülen nesne kümesi değildir” temel yaklaşımına sahiptir. Böylece belirlenen destek eşik değerini geçemeyen az elemanlı kümelerin üst kümeleri de destek eşik değerini geçemeyeceği için değerlendirme dışı bırakılır. Bu yönteme destek-bazlı
budama (support based pruning) denir.
13.Soru
“Eğer k nesneden oluşan nesne setleri kümesi en küçük destek kriterini sağlıyorsa, bu kümenin alt kümeleri de en küçük destek kriterini sağlar” özelliği aşağıdakilerden hangisidir?
Apriori özelliği |
Destek bazlı budama özelliği |
Kaldıraç kuralı özelliği |
Sık görülen nesne setleri özelliği |
Güven eşik değeri özelliği |
İlişki kuralı oluşturabilmek için geliştirilen algoritmalar içerisinde en çok bilinen ve en sık kullanılan algoritmadır. Apriori algoritması, 1994 yılında Agrawal ve Srikant tarafından geliştirilmiştir. Algoritmanın ismi, sık görülen nesne kümelerin önsel bilgisini kullanmasından, diğer bir ifadeyle bilgileri bir önceki adımdan almasından dolayı bir önceki (prior) anlamına gelen “apriori” dir.
Apriori özelliği
Apriori algoritmasının temel yaklaşımı, “Eğer k nesneden oluşan nesne setleri kümesi en küçük destek kriterini sağlıyorsa, bu kümenin alt kümeleri de en küçük destek kriterini sağlar.” şeklindedir.
Örneğin; I={a,b,c,d} nesne kümesi için, şayet {a,b,c} nesne kümesi bir sık görülen nesne kümesi ise, onun tüm alt kümeleri olan Ø, {a}, {b}, {c}, {a, b}, {a, c} ve {b, c} kümeleri de sık görülen nesne kümeleridir. Bu özelliğe apriori özelliği adı verilir.
Destek Bazlı Budama Özelliği
Apriori özelliğinin aksine, “Eğer bir alt küme sık görülen nesne kümesi değil ise, onun bütün üst kümeleri de sık görülen nesne kümesi değildir” temel yaklaşımına sahiptir. Böylece belirlenen destek eşik değerini geçemeyen az elemanlı kümelerin üst kümeleri de destek eşik değerini geçemeyeceği için değerlendirme dışı bırakılır. Bu yönteme destek-bazlı budama (support based pruning) denir.
Örneğin; I={a,b,c,d} nesne kümesi için, şayet {c, d} nesne kümesi bir sık görülen nesne kümesi değil ise, bu kümenin elemanlarını içeren tüm üst kümeleri olan {a, c, d}, {b, c, d} ve {a, b, c, d} kümeleri de sık görülen nesne kümeleri değildir.
Bu nedenle doğru yanıt a) seçeneğidir.
14.Soru
Aşağıdaki eşlemelerden hangisi yanlıştır?
Tam bağlantı kümeleme-en uzak komşuluk |
Ortalama bağlantı kümeleme-ortalama uzaklıklar |
McQuitty bağlantı kümeleme-uzaklıkları toplamının yarısı |
Medyan bağlantı kümeleme- en yakın uzaklık |
Ward bağlantı kümeleme- küme içi varyans |
McQuitty bağlantı kümeleme yönteminin farklı bir biçimidir. Bu yöntemde m. ve j. kümeler arasındaki uzaklık; dmj= (dkj + dlj)/2 - dkl/4 formülü yardımıyla hesaplanır.
15.Soru
Aşağıdakilerden hangisi karar ağaçlarının bazı avantajlarından birisi değildir?
Açıklanmalarının kolay olması |
İnsani karar almayı diğer yaklaşımlara göre daha iyi yansıtması |
Grafiksel olarak gösterilebilir olması |
Uzman olmayan kişilerce de kolaylıkla yorumlanabilmesi |
Sadece nicel değişkenleri işleyebiliyor olmaları |
Karar ağaçlarının bazı avantajları,
• Açıklanmalarının kolay olması,
• İnsani karar almayı diğer yaklaşımlara göre daha iyi yansıtması,
• Grafiksel olarak gösterilebilir olması,
• Uzman olmayan kişiler tarafından da kolaylıkla yorumlanabilir olması,
• Temsili değişkenlere ihtiyaç duymadan nitel değişkenleri de işleyebiliyor olmalarıdır
16.Soru
Ayırma kritesi olarak kazanç ölçütünden yararlanan; durdurma kriteri olarak tüm kayıtların tek bir sınıfa ait olması veya kazanç ölçütünün sıfırdan büyük olmaması durumunu kullanan; karar ağacına herhangi bir budama uygulamayan; sayısal nitelikleri ve kayıp veriyi işleyemeyen; 1983 yılında Ross Quinlan tarafından önerilen karar ağacı oluşturma algoritması aşağıdakilerden hangisidir?
ID3 |
C4.5 |
CART |
CHAID |
QUEST |
ID3 karar ağacı oluşturma algoritması en basit karar ağacı oluşturma algoritmasıdır. Ayırma kriteri olarak kazanç ölçütünden yararlanılmaktadır. Karar ağacının büyümesini durdurma kriteri ise tüm kayıtların tek bir sınıfa ait olması veya kazanç ölçütünün sıfırdan büyük olmaması durumudur. ID3 algoritmasında, karar ağacına herhangi bir budama işlemi uygulanmaz, ek olarak bu algoritma sayısal (ölçüm düzeyi nicel) nitelikleri ve kayıp veriyi işleyememektedir. 1983 yılında Ross Quinlan tarafından önerilmiştir.
Bu nedenle doğru yanıt a) seçeneğidir.
17.Soru
3 nesne içeren nesneler kümesinden toplam kaç adet ilişkiler kümesi oluşturulur?
63 |
64 |
66 |
68 |
65 |
3m-2m+1+1 formülü uygulandığında; 34-23+1+1=66
18.Soru
Aşağıdakilerden hangisi web ortamında bulunan verilerin standart veri tabanı yönetim sistemleri verilerinden farklı olarak kendine özgü özelliklerinden değildir?
Web ortamındaki veri miktarı aşırı büyüklüktedir |
Web ortamındaki veri dağınık ve heterojen bir yapıdadır. |
Web ortamındaki veri yapılandırılmamıştır. |
Web ortamındaki veri dinamiktir. |
Web ortamındaki veriler sadece belirli bir konudadır |
Web ortamındaki veriler sadece belirli bir konuda olması web ortamında bulunan verilerin standart veri tabanı yönetim sistemleri verilerinden farklı olarak kendine özgü özelliklerinden değildir?
19.Soru
5 farklı nesne içeren bir sette (A, B, C, D, E) 2 nesne setinin (A,E) destek değeri kaç olur?
0,40 |
0,60 |
0,20 |
0,80 |
1 |
Destek değerlerini hesaplayabilmek için öncelikle m=5 nesne içeren nesneler kümesinden iki nesneden oluşan nesne setlerinin (k=2) belirlenmesi gerekir. İki nesne içeren
nesne seti sayısı= 5!/2!*3!= 10'dur. Destek {A, E}= 2/5= 0,40
20.Soru
Karar verme sürecinde tüm seçeneklerin ve bunlara bağlı olarak elde edilecek tüm sonuçların rakamsal olarak takip edilmesi önemlidir. Bu durum pek çok karar verici için aşağıdakilerden hangisine neden olmaktadır?
kararları eleme |
farklı yöntemlere başvurma |
daha fazla iş yükü |
yanlış karar verme |
karardan şüphe etme |
Karar verme sürecinde, seçeneklerin, alınacak kararı etkileyen etmenlerin çokluğu ve hızlı karar verme gerekliliğinin getirdiği karmaşıklık, karar vericinin vereceği kararlarda olumsuz bir etkiye sahip olabilmektedir. Olası tüm seçeneklerin ve bunlara bağlı olarak elde edilecek tüm sonuçların rakamsal olarak takip edilmesi, pek çok karar vericinin daha fazla iş yüküyle karşılaşmasına neden olabilmektedir.
-
- 1.SORU ÇÖZÜLMEDİ
- 2.SORU ÇÖZÜLMEDİ
- 3.SORU ÇÖZÜLMEDİ
- 4.SORU ÇÖZÜLMEDİ
- 5.SORU ÇÖZÜLMEDİ
- 6.SORU ÇÖZÜLMEDİ
- 7.SORU ÇÖZÜLMEDİ
- 8.SORU ÇÖZÜLMEDİ
- 9.SORU ÇÖZÜLMEDİ
- 10.SORU ÇÖZÜLMEDİ
- 11.SORU ÇÖZÜLMEDİ
- 12.SORU ÇÖZÜLMEDİ
- 13.SORU ÇÖZÜLMEDİ
- 14.SORU ÇÖZÜLMEDİ
- 15.SORU ÇÖZÜLMEDİ
- 16.SORU ÇÖZÜLMEDİ
- 17.SORU ÇÖZÜLMEDİ
- 18.SORU ÇÖZÜLMEDİ
- 19.SORU ÇÖZÜLMEDİ
- 20.SORU ÇÖZÜLMEDİ