İŞLETME ANALİTİĞİ Dersi İşlemtabloları ile Veri Madenciliği soru cevapları:

Toplam 34 Soru & Cevap
PAYLAŞ:

#1

SORU:

 Microsoft Excel ve SQL Server Analysis Services (SSAS)in veri madenciliğindeki önemi nedir?


CEVAP:

Microsoft Excel ile yapılan veri madenciliği işlemlerinde SQL Server Analysis Services (SSAS) arka planda veri madenciliği sihirbazlarının çalışmasına yardımcı olan bir motor görevi görürken Excel, veri madenciliği (data mining) eklentisi sayesinde bir istemci görevi görmektedir.


#2

SORU:

Microsoft Excel üzerinden veri madenciliği işlemlerini yapabilmek için kaç tane temel yazılıma ihtiyaç duyulmaktadır?


CEVAP:

Bunlar; 2007 ve sonrası sürüme sahip bir Microsoft Ofis yazılımı, Microsoft SQL Server 2005 ya da sonrası bir sürümü ve Microsoft Excel’in Data Mining eklentisidir. Bu ünitede Microsoft Excel 2013, Microsoft SQL Server 2012 ve Microsoft SQL Server 2012 Data Mining eklentisi kullanılacaktır.


#3

SORU:

Microsoft SQL Server 2012 Data Mining Eklentisi Kurulumunun başarılı bir şekilde gerçekleştirilmesi için hangi hususlara dikkat edilmelidir?


CEVAP:

Kurulumun başarılı bir şekilde gerçekleşebilmesi için kurulum yapılacak olan ofis sürümüne uygun olan eklentinin edinilmesi gerekmektedir. 32 bit olan bir ofis sürümü üzerine 64 bit olan bir eklenti kurulumu yapılamayacaktır.


#4

SORU:

Microsoft SQL Server 2012 Data Mining Eklentisi Kurulumunun aşamaları nelerdir?


CEVAP:

1. Öncelikle Microsoft’tan ücretsiz olarak edinilebilecek “Microsoft SQL Server 2012 Data Mining Add-ins for Office” eklentisinin indirilmesi gerekmektedir.

2. İndirilen dosya çalıştırılarak kuruluma başlanacaktır.

3. Kurulum sırasında ilerlemek için Next (İleri) düğmesinin kullanılması gerekmektedir. Bir sonraki adımda lisans sözleşmesinin “I accept the terms in the licence agreement” seçeneği seçilerek kabul edilmeli ve Next düğmesine basılmalıdır.

4.Kurulması gereken özelliklerin seçilmesi gerekmektedir. Bu bölümde “Table Analysis Tools for Excel”, “Data Mining Client for Excel” ve “Server Configuration Utility” kesinlikle seçilmelidir.

5.Next düğmesine tıklanarak yükleme işlemine hazır hâle gelinecektir ve bir sonraki adımda Install (Yükle) düğmesi aracılığı ile yükleme işlemi başlayacaktır.  Yükleme işlemi bittikten sonra Finish (Bitir) düğmesi ile kurulum tamamlanacaktır.

6. Kurulum başarılı bir şekilde tamamlanmış ise Microsoft Excel 2013 programı çalıştırıldığında Data Mining sekmesinin Excel sekmeleri arasına eklendiği görülecektir.

7.Data Mining eklentisi, Microsoft SQL Server 2012 Analysis Services’ın herhangi bir sürümü ile bağlantı kurmaya ihtiyaç duymaktadır.


#5

SORU:

Microsoft SQL Server 2012 Enterprise Edition’ın edinilmesi ve Analysis Services’ın yapılandırılmasına nereden ve nasıl başlanır?


CEVAP:

Excel’e eklenmiş olan Data Mining sekmesi altındaki Help bölümünde bulunan “Getting Started” aracı kullanılabilir. Bu araca aynı zamanda başlat menüsü altından da erişim mümkündür.


#6

SORU:

Microsoft SQL Server 2012 Kurulumu ve Analysis Services’ın (SSAS) Yapılandırılmasında Getting Started aracının sunduğu seçenekler nelerdir?


CEVAP:

Getting Started aracı bize yapılandırma konusunda üç farklı seçenek sunmaktadır. Eğer kullanılmakta olan sistem üzerinde daha önceden kurulmuş olan bir SSAS bulunmakta ise “Use an existing instance of Microsoft SQL Server 2008 (or later) Analysis Services that I administer” seçeneği ya da “Connect to a Microsoft SQL Server 2008 (or later) Analysis Services instance to which I have non-administrative access” seçeneği yardımı ile kurulum adımları atlanarak yapılandırma işlemine geçilebilir.


#7

SORU:

Microsoft SQL Server 2012 Enterprise Evaluation Edition Kurulumunun adımları nelerdir?


CEVAP:

1. .iso uzantılı olarak indirilen program herhangi bir DVD’ye yazdırılarak ya da bir sanal sürücü yardımı ile kullanılmalıdır.

2. Setup.exe dosyası çalıştırılarak kuruluma başlanacaktır.

3. Microsoft SQL Server 2012 Enterprise Evaluation Edition kurulumu için Installation (kurulum) bölümü altında bulunan “New SQL Server Standalone Installation or add features to an existing installation” seçeneği seçilmelidir.

4. Seçim yapıldıktan sonra kurulum sihirbazı, kurulum için gerekli olan yazılımları kontrol edecektir ve bu kontrolü tamamladıktan sonra bir rapor sunacaktır. Kontrol işleminde herhangi bir sorun tespit edilmesi durumunda kuruluma devam edebilmek için sorun bulunan kısımların düzeltilmesi gerekmektedir. Sorunlar düzeltildikten sonra OK (Tamam) düğmesine basılarak kuruluma başlanır.

5. Kurulum başlarken bir lisans anahtarına sahip olunup olunmadığı sorulacaktır. Bu ünite kapsamında ücretsiz deneme sürümü kullanılacağı için “Specify a free edition” bölümünden “Evaluation” sürümünün kullanılacağı belirtilmeli ve Next düğmesine basılmalıdır. Her ne kadar değerlendirme sürümü kullanılacak olsa da bu sürüm yazılımın gerekli bütün özelliklerini 180 gün boyunca ücretsiz olarak sunmaktadır.

6. License Terms adımında karşımıza bir lisans sözleşmesi çıkacaktır. Kuruluma devam edebilmek için “I accept the license terms” seçeneği seçilerek bu sözleşmenin kabul edilmesi ve daha sonra Next düğmesine basılması gerekmektedir.

7. Product Updates adımında yüklenebilecek güncellemelerin listesi sunulmaktadır. “Include SQL Server product updates” seçeneğinin seçilmesi ve Next düğmesine basılması gerekmektedir. Gerekli dosyalar indirildikten sonra kurulum başlayacaktır.


#8

SORU:

Microsoft SQL Server 2012 Enterprise Evaluation Edition Kurulumu sırasında işlemlerin sağlıklı bir şekilde yapılabilmesi için neye dikkat etmek gerekir?


CEVAP:

Eğer kurulum sırasında Multidimensional and Data Mining Mode yerine Tabular Mode seçilirse Excel üzerinden veri madenciliği işlemleri sağlıklı bir şekilde yapılamayacaktır.


#9

SORU:

Excel Data Mining eklentisi için SSAS’in yapılandırılmasının aşamaları nelerdir?


CEVAP:

1. Sihirbaz çalıştırılarak yapılandırmaya başlanılacaktır. Next düğmesine basılmalıdır.

2. Yapılandırma dört farklı adımdan oluşmaktadır. Birinci adımda Data Mining eklentisinin bağlanacağı sunucu bilgisi sorulmaktadır. SSAS aynı sistem üzerinde kurulu olduğu için bu alan “localhost” olmalıdır. Next düğmesine basılarak yapılandırmaya devam edilir.

3. Sunucuya erişim kontrol edildikten sonra ikinci adıma geçilir. Bu adımda geçici madencilik modellerinin kullanılıp kullanılamayacağı izni sorulmaktadır. Geçici madencilik modellerinin kullanılabilmesi için “Allow creating temporary mining models” seçili iken Next düğmesine basılmalıdır.

4. Üçüncü adımda kullanılacak olan veritabanının seçilmesi gerekmektedir.

a. Eğer ilk kez SSAS kullanılacak ise yeni bir veritabanı oluşturulması gerekir. Bunun için “Create new database” bölümünden oluşturulacak veritabanına bir isim verilmelidir. Varsayılan olarak önerilen “DMAddinsDB” adını kullanmakta herhangi bir sakınca yoktur. Next düğmesine basılmalıdır.

b. Eğer daha önceden oluşturulmuş bir veritabanı mevcut ise “Use existing database” seçeneği seçilerek ilgili listeden kullanılmak istenen veritabanı seçilebilir. Next düğmesine basılmalıdır.

5. Dördüncü adımda ise veritabanı erişimi için kullanıcı yetkilendirmesi yapılmaktadır. Bu kısım güvenlik ve verinin yönetimi açısından büyük önem taşımaktadır ve yetkilendirme işlemi titiz bir şekilde yapılmalıdır. Yapılandırma sihirbazı bu bölümde SSAS kurulumu sırasında yetki verilmiş olan kullanıcı listesini varsayılan olarak sunacaktır. Eğer bu listede değişiklik yapılmak istenirse “Add” ve “Remove” düğmeleri kullanılabilir. Finish düğmesi yardımı ile yapılandırma sonlandırılacaktır.

6. Yapılandırma tamamlandıktan sonra yapılandırma sırasında yapılan işlemlerin raporu sunulacaktır. Close düğmesine basılarak yapılandırma sihirbazı kapatılacaktır.


#10

SORU:

Excel Data Mining eklentisi için SSAS’in yapılandırılmasının son aşaması nedir?


CEVAP:

Son olarak veri madenciliği işlemlerinde istemci görevi görecek olan Microsoft Excel ile önceki adımlarda yapılandırılmış olan SSAS arasında bir bağlantı kurulması gerekmektedir. 


#11

SORU:

Microsoft Excel 2013’ün yapılandırılmasını açıklayınız?


CEVAP:

Microsoft Excel 2013’ü açarak Data Mining sekmesi altındaki Connection bölümünden Analysis Services Connections listesi açılarak New (yeni) düğmesi aracılığı ile yeni bir bağlantı oluşturulmalıdır. Server name olarak yapılandırma sırasında belirttiğimiz “localhost” kullanılmalıdır. Catalog name altında sunulan listeden yapılandırma sırasında oluşturulan yeni veritabanının ismi seçilmelidir. Bu işlemden sonra Friendly name otomatik olarak oluşturulacaktır. “OK” düğmesi yardımı ile yeni bağlantı kurulmuş olur ve artık Microsoft Excel 2013 Veri Madenciliği işlemlerine başlamak için hazır durumdadır.


#12

SORU:

Excel’in veri madenciliği eklentisinin önemi nedir?


CEVAP:

Excel’in veri madenciliği eklentisi, SSAS’ın veri madenciliği işlemleri konusundaki gücünü ortaya çıkarmaktadır. Bu eklenti, Excel tablolarındaki veriler ile SSAS altında bulunan birçok gelişmiş veri madenciliği algoritmalarını, yapılarını ve görüntüleyicilerini kullanarak veri madenciliği işlemlerinin yapılmasını sağlamaktadır. Bu eklenti yardımı ile karmaşık veri setlerinin analizi ve kestirimler kolaylıkla yapılabilmektedir. Ayrıca verilerin ve çıkarımların Excel’de tutulması sayesinde veri desenleri istenildiği zaman kolaylıkla belgelendirilebilmektedir


#13

SORU:

Excel veri madenciliği eklentisi altında bulunan sihirbazlar nelerdir?


CEVAP:

Excel veri madenciliği eklentisi altında bulunan sihirbazlar Data Preparation, Data Modeling, Accuracy and Validation, Model Usage, Management, Connection ve Help olmak üzere yedi bölüme ayrılmaktadır.


#14

SORU:

Excel veri madenciliği eklentisi altında bulunan sihirbazlardan Data Preparation nedir vehangi sihirbazları barındırmaktadır?


CEVAP:

Data Preparation, yani verinin hazırlanması bölümü madencilik işlemlerinin sağlıklı bir şekilde yapılabilmesi için büyük önem taşımaktadır. Excel veri madenciliği eklentisi altında bulunan Data Preparation bölümü, veri madenciliği işlemleri için kullanılacak olan verinin gözden geçirilmesi ve temizlenmesi işlemlerinde yardımcı olacak bazı sihirbazları barındırmaktadır.


#15

SORU:

Explore Data sihirbazı nedir?


CEVAP:

Explore Data sihirbazı, kullanılmak istenen veri setinde seçilmiş olan herhangi bir alan (sütun) için dağılımı ve değerleri grafiklerle ifade ederek veri setinde bulunan verilerin türünün ve miktarının daha belirgin bir şekilde anlaşılmasını sağlamaktadır.


#16

SORU:

Clean Data altında bulunan sihirbazların görevi nedir?


CEVAP:

Clean Data altında bulunan sihirbazlar, veri madenciliği işlemleri için kullanılmak istenen veri seti içerisindeki anormallikleri tespit etmeyi, yapılan tespitler sonucu veri setini tekrar organize etmeyi ve böylelikle kullanılmak istenen veri setini veri madenciliği işlemleri için hazır hâle getirmeyi sağlamaktadır.


#17

SORU:

Bir değeri aykırı olarak nitelendirebilme ölçütleri nelerdir?


CEVAP:

Bunlar:

- Değerin, beklenilen aralığın dışında olma durumu

- Verinin yanlış yazılmış olma ihtimali

- Değerin yazılmamış olma durumu

- Verinin boşluk karakterinden ya da boş bir dizinden (NULL string) oluşması

- Değerin, model dağılımını ciddi şekilde etkileme durumudur.


#18

SORU:

Verinin Örneklendirilmesi (Sample Data) nedir?


CEVAP:

Excel’in veri madenciliği eklentisinde bulunan Sample Data sihirbazı, veri setini yeniden örneklendirerek istenilen amaca daha uygun yeni bir veri seti oluşturmakta ya da bir model için kullanılacak olan veriyi istenilen oranda iki farklı gruba ayırabilmektedir. Bu gruplardan birisinde bulunan veri, desenleri incelenerek model oluşturulma aşamasında kullanılmakta, diğer grupta bulunan veri ise oluşturulacak olan modelin test edilmesi aşamasında kullanılabilmektedir.


#19

SORU:

Rastgele Örnekleme (Random Sampling) nedir?Açıklayınız.


CEVAP:

Excel tablolarında ya da dış bir veri kaynağında bulunan verileri Sample Data sihirbazının random sampling özelliği ile rastgele örneklemek mümkündür. Rastgele örnekleme yöntemi, oluşturulmuş bir model ile test edilen verilerin, modelin oluşturulması sırasında kullanılmış olan verileri açık bir şekilde temsil ettiğini göstermenin en iyi yoludur.


#20

SORU:

Amaçlı Örnekleme (Oversampling) nedir? Açıklayınız.


CEVAP:

Excel tablolarında bulunan verileri Sample Data sihirbazının oversampling özelliği ile istenilen kriterlere göre örneklemek mümkündür. Veri tablosunu oversampling özelliği ile istenilen oranda yeniden örneklendirerek tablo içerisinde nadir olan bir değerin oluşturulacak yeni örneklemde daha sık yer alması sağlanabilmektedir ve böylece seçilmiş olan verinin örneklem içerisindeki temsil yeteneği arttırılmış olacaktır.


#21

SORU:

Verinin Modellenmesi (Data Modeling) nedir?


CEVAP:

Data modeling, Data preparation işlemi sonrası hazırlanmış olan verilerin veri madenciliği fonksiyonları ve algoritmaları ile değerlendirilerek verilerin trendlerinin ve desenlerinin belirlendiği veri madenciliği adımıdır. 


#22

SORU:

Verinin Modellenmesi (Data Modeling) bölümünde bulunan sihirbazlar nelerdir?


CEVAP:

Sınıflandırma (Classify),Tahminleme (Estimate),Kümeleme (Cluster), Birliktelik (Associate),Öngörüleme (Forecast), İleri Düzey Yapılandırma ve Modelleme (Advanced)dir.


#23

SORU:

Tahminleme modeli ne zaman kullanılabilir?


CEVAP:

Tahminleme modeli, sonuç değerlerinin miktar, para birimi, tarih ya da zaman gibi sayısal değerler olduğu durumlarda kullanılabilmektedir.


#24

SORU:

Kümeleme modeli ne zaman kullanılabilmektedir?


CEVAP:

Kümeleme modeli her tür veri desenini araştırmak için kullanılabilmektedir.


#25

SORU:

Bağıl önem nedir?


CEVAP:

Bağıl önem, birbiriyle ilişkili olan ögeler arasındaki ilişkinin önemini ifade etmektedir.


#26

SORU:

Associate sihirbazının kullanılabilmesi neye bağlıdır?


CEVAP:

Associate sihirbazının kullanılabilmesi için kaynak veri tablosu kesinlikle bir kayıt-işleme tablosu (transaction table) şeklinde tasarlanmış olmalıdır.


#27

SORU:

Test Etme ve Geçerliliği Doğrulamanın (Accuracy and Validation) önemi nedir?


CEVAP:

Veri madenciliği çalışmalarında, oluşturulmuş olan ya da kullanılan modelin geçerli bir model olması büyük önem taşımaktadır. Bu yüzden modelin test edilmesi ve geçerliliğinin doğrulanması gerekmektedir. Tasarlanmış olan modeli endüstriyel alanda kullanıma sunmadan önce modelin gerçek veriler ile çalışıldığı durumlarda nelerle karşılaşılabileceğinin iyi bir şekilde bilinmesi gerekmektedir.


#28

SORU:

Accuracy and Validation bölümünde bulunan sihirbazlar nelerdir?


CEVAP:

Doğruluk Grafiği (Accuracy Chart), Sınıflandırma Matrisi (Classification Matrix), Kâr Grafiği (Profit Chart), Çapraz Doğrulama (Cross-Validation) dir.


#29

SORU:

İyileşme grafiği önemi nedir?


CEVAP:

İyileşme grafiği, birden fazla modeli tek bir grafik ile kıyaslama imkânı sunmaktadır.


#30

SORU:

Model Usage ve Management nedir ve altında bulunan sihirbazlar neler yapabilir?


CEVAP:

Model Usage ve Management bölümleri altında bulunan sihirbazlar, veri madenciliği süreci sırasında oluşturulmuş olan ve SSAS içerisindeki bir örnekte tutulan veri madenciliği modellerine göz atma, modeller üzerinde değişiklik yapma, bir sorgu oluşturma ve modelleri yönetme imkânı sunmaktadır. Kullanıcı yeterli yetkilere sahip olduğu sürece var olan modelleri Excel istemcisi aracılığı ile kolaylıkla silebilir, değiştirebilir, yeniden adlandırabilir ya da yönetebilir.


#31

SORU:

 Tahmin sorgusu nedir?


CEVAP:

Trendlerden yola çıkarak bir kestirim yapabilmek için yeni bir verinin var olan bir model üzerinde uygulanması sürecine tahmin sorgusu adı verilmektedir.


#32

SORU:

Modellerin Yönetimi (Manage Models) ile neyin yapılması mümkün değildir?


CEVAP:

Manage Models sihirbazı yardımı ile yeni bir veri madenciliği modeli ya da sorgusu oluşturulamamaktadır.


#33

SORU:

Bağlantı (Connection) altında bulunan sihirbazların görevi nedir?


CEVAP:

Connection bölümü altında bulunan sihirbazlar yardımıyla SSAS sunucu ile kurulmuş olan bağlantı yönetilmektedir.


#34

SORU:

Yardım (Help) bölümü altında neler bulunmaktadır?


CEVAP:

Help bölümü altında Excel veri madenciliği eklentisinin kurulumu ve kullanımı konusunda yardımcı olabilecek kaynaklar bulunmaktadır