DİJİTAL GÖRÜNTÜ İŞLEME - Ünite 5: Sınıflandırma-Temel Teknikler Özeti :
PAYLAŞ:Ünite 5: Sınıflandırma-Temel Teknikler
Temel Kavramlar
Bir kişinin, çekilen bir dijital görüntüdeki farklı nesneleri (hayvanlar, ağaçlar, araçlar, insanlar, mekânlar vb.) birbirinden ayırabilmesi ve bu nesneleri ayırabilmek için her nesneye ait özel ve farklı detayları (boyut, şekil, doku, renk, çevresel ilişki vs.) bütünleşik olarak kolayca tespit edebilmesi, insana özgü olan görsel ve sayısal zekânın ortak bir ürünüdür. Fakat aynı amaca yönelik olarak bilgisayarların kullanılması, işlenmesi gereken verinin karmaşıklığı, büyüklüğü ve yüksek boyutlu bir yapı içermesi nedeniyle kolay değildir.
Örüntü tanıma, istatistiksel, olasılıksal, sinyal işleme, algoritma tasarımı vb. teknikler kullanılarak ham verilerden bilgisayarlar yardımıyla çıkarım yapma bilimidir. Son yıllarda geliştirilen yeni yöntemler sayesinde bilgisayar algoritmaları, insanlara özgü olan birçok konuda daha fazla söz sahibi olacak şekilde (yapay zekâ) evrimleşmektedir. Bununla birlikte, insanların oldukça kolay gerçekleştirdiği sınıflandırma gibi konularda algoritmik anlamda ciddi bir ilerleme yaşansa da günümüze kadar geliştirilen yöntemler, insana özgü olan görsel ve sayısal zekânın yapabildiği sınıflandırma ve örüntü tanıma işlemlerinin hâlâ çok gerisindedir.
Örüntü tanıma, istatistiksel, olasılıksal, sinyal işleme, algoritma tasarımı vb. teknikler kullanılarak ham verilerden bilgisayarlar yardımıyla çıkarım yapma bilimidir.
Bir sınıfın veya grubun karakteristik özelliklerinin bileşimi örüntü olarak tanımlanır. Sembolik (örneğin, renk) veya dijital (örneğin, yükseklik) olarak bir sınıfa ait herhangi özel karakteristiğe ise özellik denir. Birden çok sayıda (n) özelliklerin birleşimi, n boyutlu bir vektör ile temsil edilir ve bu vektör özellik vektörü olarak ifade edilir. Özellik vektörü tarafından tanımlanan n boyutlu ortama ise özellik uzayı adı verilir. Sınıflandırma ve örüntü tanıma işlemlerinde özellik uzayında kullanılan her nokta (bir sınıfa veya gruba ait) bir özelliği temsil eder. Bu gösterime ise özellik saçılım grafiği adı verilir (S:133 Şekil 5.1’i inceleyiniz.).
Bir sınıflandırıcının temel hedefi, çok boyutlu olabilen özellik uzayını mümkün olan en yüksek doğrulukla sınıf etiketlerini içerecek şekilde karar bölgelerine ayırmaktır ve karar bölgeleri arasındaki sınırlara ise sınıflandırıcının karar sınırları adı verilir (S:133 Şekil 5.1’i inceleyiniz.).
Geleneksel sınıflandırma yöntemlerinde, dijital görüntülerin en küçük birimi olan pikseller, sınıflandırmada en temel birim olarak kabul edilirler. Piksel tabanlı sınıflandırma yöntemlerinde görüntüyü oluşturan pikseller tek tek ele alınır ve her pikselin ait olduğu sınıf belirlenmeye çalışılır.
Nesne tabanlı sınıflandırma yöntemleri, piksel gruplarından oluşturulan nesnelerin şekillerini, içerdikleri piksellerin yansıma çeşitliliğini ya da nesnelerin birbirleriyle olan komşuluk ilişkilerini sınıflandırma sırasında kullanabilmektedir.
Kontrollü Sınıflandırma
Sınıflandırma yöntemlerinden ilk kategori olan kontrollü sınıflandırma, bir dijital görüntüde yer alan farklı sınırların (grupların) ön bilgi kullanılarak ortaya çıkartılması işlemidir. Bir başka ifadeyle önceden var olan bazı örnek girdiler ve bunların bir kullanıcı tarafından sınıf etiketi atanmış çıktıları, sınıflandırıcı tarafından incelenerek aralarındaki ilişki modellenmeye çalışılır. Kullanıcı tarafından sağlanan örnek girdiler ve çıktılar, eğitim veri seti olarak adlandırılır.
Kontrollü sınıflandırmalarda yöntemin eğitim işleminde ve doğruluk analizi aşamasında kullanılmak üzere (arazi çalışmaları, görüntü yorumlama tecrübeleri vb. sonucunda) sınıf etiketi kesin olarak bilinen bir referans (yer gerçeği) veri seti kullanıcı tarafından etiketleme yoluyla oluşturulur (S:13 Şekil 5.4’ü inceleyiniz.) Bu veri setinin bir kısmı (örn. %20’si) sınıflandırma başarısının testi amaçlı, bir başka deyişle son aşamadaki doğruluk analizi için test verisi olarak ayrılır. Geriye kalan kısmın ise örneğin %75’i kullanılacak olan kontrollü sınıflandırıcı algoritmasının eğitilmesi, %25’i ise eğitilen sınıflandırıcının geçerliliğinin denetimi için kullanılır. Geçerlilik denetimi aşamasında, kontrollü bir sınıflandırıcının eğitim aşaması sırasında kullandığı parametrelerin alacağı optimum değerler araştırılır.
Parametrik Kontrollü Sınıflandırma Yöntemleri
Parametrik kontrollü sınıflandırma yöntemleri görüntüde ele alınacak sınırların eğitim verileri için belirli istatistiki dağılım kabullerini öncül olarak yapar. Bu istatistiki dağılımlardan en popüler olanı normal dağılımdır ve Maksimum Olabilirlik, Bayes Sınıflandırması ve Gauss Karışım Modeli kontrollü sınıflandırmalarının temelini oluşturur.
Maksimum Olabilirlik ve Bayes Sınıflandırması
Parametrik yöntemlerin en bilinenlerinin başında Maksimum Olabilirlik yöntemi gelmektedir. Bir piksel için en uygun (optimal) sınıfın tüm olası sınıflar arasından o piksel için en yüksek olasılığa sahip sınıfın seçilerek atandığı yönteme Maksimum Olabilirlik yöntemi adı verilmektedir.
Gauss Karışım Modeli, verinin bir veya daha çok Gauss dağılımının ağırlıklı birleşimi olarak gösterilmesine dayanan istatistiksel bir yöntemdir.
Parametrik Olmayan Kontrollü Sınıflandırma Yöntemleri
Parametrik olmayan kontrollü sınıflandırma yöntemlerinde görüntüde ele alınacak sınırların eğitim verileri hakkında herhangi bir istatistiki dağılım kabulü yapılmaz. Bu yöntemlerden en popüler olanları şunlardır:
- Karar Ağaçları ve Rastgele Orman
- Destek Vektör Makineleri
- k-En Yakın Komşuluk
- Kernel-tabanlı yöntemler
- Yapay Sinir Ağları
Karar Ağaçları ve Rastgele Orman
Bir konu üzerinde yargıya ulaşabilmek için farklı seviyelerden oluşan ve her seviyeye ulaşmak için gerekli olan (olasılıksal) değerleri veya kriterleri bir ağaç yapısı kullanarak betimleyen sistemlere karar ağaçları adı verilmektedir. Genel bir ağaç yapısında kök düğüm, dal ve uç düğümler olmak üzere üç ana seviye bulunur. Kök düğüm karar ağacındaki tüm popülasyonu temsil eder ve ağacın en tepesinde yer alır. Kök düğümünden en alt seviyeye kadar olan kısımdaki düğümler ise iç düğümler olarak adlandırılır. İç düğümlerin belirli seviyelerdeki gruplanmış kısımlarına ise dal adı verilir. En alt seviyedeki düğümler ise uç (yaprak veya terminal) düğüm olarak tanımlanır ve oluşturulan karar ağacının herhangi bir konu üzerinde üreteceği nihai yargıları içerir. Karar ağacındaki her bir ara düğüm sadece bir ana düğüme bağlı olurken, iki veya daha fazla alt düğüme ayrılabilmektedir (S:142 Şekil 5.7’yi inceleyiniz).
Rastgele Orman yönteminde adından da anlaşılacağı üzere birçok karar ağacı kullanılarak adeta bir karar ormanı elde edilmektedir. Buradaki ilk aşama olan eğitim aşamasında, eğitim veri setinin bir kısmı (örneğin, 2/3’ü) rastgele olarak alt kümelere ayrılır ve her alt küme için bir karar ağacı oluşturulur.
Destek Vektör Makineleri, iki (veya daha fazla) sınıfı birbirinden en uygun şekilde ayırabilecek sınır hattının nasıl tanımlanacağını belirleyen etkin bir istatistiksel sınıflandırma yöntemidir. Sınır hattının ne şekilde tanımlanacağı, doğal olarak sınıflandırma için kullanılan eğitim verisine ve ele alınacak sınırların özellik bilgilerine bağlı olarak değişmektedir.
Kernel-Tabanlı Yöntemler: Doğrusal olarak ayrılamayan iki özellik verisini, yine doğrusal olmayan bir dönüşüm fonksiyonu ile farklı bir uzaya taşıyarak, daha büyük boyutlu bu yeni uzayda iki özellik verisinin noktasal çarpımını direkt olarak tanımlayan fonksiyona Kernel adı verilmektedir. Kernel yöntemi ile doğrusal modeller kullanılarak, doğrusal olmayan veri setleri öğrenmeye çalışılır. Eğitim verilerinin kendi orijinal uzayında değil de daha büyük boyutlu bir uzayda ele alınarak sınıflandırmanın gerçekleştirildiği yöntemlere Kernel-tabanlı (çekirdek-tabanlı olarak da adlandırılmaktadır) yöntemler adı verilir.
k-En Yakın Komşuluk: Etiketi bilinmeyen bir örneğin, eğitim setinde yer alan veriler ile arasındaki benzerliğinin komşuluk ilişkilerine dayanarak incelendiği ve örneğe ait sınıf etiketinin komşu örneklerin sınıf etiketlerinin çoğunluğunun gözetilerek atandığı yönteme k-En Yakın Komşuluk sınıflandırma yöntemi adı verilir.
Yapay Sinir Ağları: İnsan beynindeki sinir hücrelerinden ve ağ yapısından esinlenilerek geliştirilen, kendi aralarında çeşitli ağırlık katsayıları aracılığıyla iletişim kuran ve her biri kendi çalışma fonksiyonuna sahip birim elemanlarından oluşan mantıksal yazılımlara Yapay Sinir Ağları denir. Bu mantıksal yazılımlar kullanılarak gerçekleştirilen sınıflandırmalara ise Yapay Sinir Ağları Sınıflandırması adı verilir.
Kontrolsüz Sınıflandırma
Kesin Kontrolsüz Sınıflandırma
Klasik anlamda sınıflandırmanın sonucunda elde edilen etiket değerleri 0 veya 1 gibi kesin kararlar olmaktadır. Aslında birçok durumda sınıflandırma çıktısı olarak beklenen de bu kesin etiket değerleridir. Sınıflandırma sonrasında her veriye ait kesin olarak bir etiket bilgisinin atandığı sınıflandırmalara Kesin Sınıflandırma yöntemleri adı verilir. Bu sınıflandırma yöntemlerinde her verinin sadece ama sadece bir sınıfa ait olacağı kabulü vardır ve kontrolsüz sınıflandırma konusunda en bilineni K-Ortalamalar yöntemidir.
K-Ortalamalar Yöntemi
Sınıflandırma sonunda oluşturulacak olan toplam küme sayısını belirten K girdi parametresini kullanarak, özellik uzayındaki verileri belirli bir benzerlik kriteri çerçevesinde gruplayan yönteme K-Ortalamalar Sınıflandırması adı verilir. Bu yöntemde kümedeki özelliklerin (x) ortalama değeri (yani merkezi, mi), küme benzerliği kriterinde kullanılır ve belirli bir uzaklık ölçütü (d) hesabına dayanan karesel hata kriteri minimum yapılmaya çalışılır.
Bulanık Kontrolsüz Sınıflandırma
Kesin sınıflandırma yöntemlerinin aksine sınıflandırma işleminin karar aşamasına gelindiğinde bazı veriler ciddi anlamda belirsizlik taşıyabilmektedir. Bunun temel sebebi, görüntülerdeki farklı sınıfların bant yansıtım değerleri arasındaki benzerliklerdir. Bunun yanı sıra sınıflar arası geçişler, çoğu zaman kesin sınır çizgileriyle gerçekleşememektedir. Bu bağlamda, sınıflandırma sürecinde karar mekanizmaları tarafından belirsizliğin nasıl kümeleme işlemine dâhil edileceği ve bu sürecin nasıl bir parçası olacağı sorularının cevabını Bulanık Mantık teorisi (Zadeh, 1962) vermektedir. Bulanık mantık sınıflandırma karar mekanizmaları, sınıflar arası spektral geçişlerin belirsizliğini dikkate alarak, sınıflandırma sonucunda verilerin birden fazla sınıfa üyeliğine izin verir. Her bir veriye, 0 veya 1 gibi kesin etiket değerlerinin aksine 0 ile 1 arasında değişen (0 üyeliğin olmadığı durumu, 1 ise tam üyeliği temsil eder) üyelik dereceleri atanır. Kontrolsüz sınıflandırma özelinde bulanık mantıktan yararlanan en temel yöntem Bulanık C-Ortalamalar yöntemidir.
Bulanık C-Ortalamalar yönteminin temelini, Eşitlik S:160 Şekil 5.18’e benzer bir karesel hata kriteri oluşturmaktadır.
Tematik Harita ve Doğruluk Analizi
Özellik uzayında sınıflandırmadan sonra görüntü üzerinde her piksele atandıkları sınıfları temsil edecek şekilde, alfabetik (A, B, …) veya nümerik (1, 2, …) bir etiket değeri atanır. Bu şekilde etiket değerleri aracılığıyla sınıflandırma sonuçlarını içeren görüntülere, Tematik harita veya Tematik görüntü adı verilir. Sınıflandırma sonrasında görsel anlaşılabilirliği (ve yorumlanabilirliği) arttırmak amacıyla her bir etiket farklı bir renk kodu ile temsil edilir ve bu renk kodlarının karşılık geldiği sınıflar bir lejant üzerinde açıklanır. Her ne kadar bazı kurumlar tarafından sınıflara ait renk kodları standartlaştırılmış (USGS, 1992) olsa da her sınıflandırma uygulaması farklı tipte sınıflar içerebileceğinden, sınıflara ait renk kodları görsel anlaşılabilirliği sağlayacak şekilde keyfi olarak da seçilebilir (S:160 Şekil 5.18’i inceleyiniz).
Üretilen tematik haritaların başarısı, son kullanıcıların önemli kararlar almasına etki eden birincil faktördür ve tematik haritalar, mümkün olan en düşük hata düzeyine sahip olacak şekilde üretilmelidir. Bu amaca yönelik olarak doğruluk analizi kavramı geliştirilmiştir. Sınıflandırma yoluyla üretilen tematik haritanın, bir test verisi ile görsel yorumlama ya da istatistiksel analizler ile karşılaştırılarak analiz edilmesi işlemine, Doğruluk analizi adı verilir.
Doğruluk analizinde kullanılan popüler istatistiksel yöntem, hata matrisidir. Hata matrisi, eşit sayıda satır ve sütundan oluşan, görüntü sınıflandırması ile ilgili Genel doğruluk, sınıflara ait Üretici ve Kullanıcı doğrulukları ile Kappa katsayısı bilgilerini içeren bir araçtır (S:162 Tablo 5.8’i inceleyiniz).
Matrisi oluşturan satırlar, sınıflandırma sonuç etiketlerini, sütunlar ise test verisi etiketlerini içermektedir. Genel doğruluk, matriste yer alan diyagonal elementler (matrisin koyu renk ile çevrelenmiş kısmı) toplamının, yani doğru olarak sınıflandırılmış pikseller toplamının, test verisini oluşturan piksel sayısına bölünmesi ile elde edilir. Matristeki diyagonal olmayan diğer pikseler ise her sınıfa ait hata miktarlarını göstermektedir.
Matriste yer alan her bir sınıfa yönelik doğruluk oranları üretici ve kullanıcı doğruluğu terimleri ile açıklanmaktadır:
Üretici doğruluğu: Matrisin diyagonal kısmında bulunan ve her bir sınıf için doğru olarak sınıflandırılmış toplam piksel sayısının, matrisin ilgili sütununda bulunan toplam piksel sayısına bölünmesi ile elde edilen değerdir.
Kullanıcı doğruluğu: Kullanıcı doğruluğu ise yine her bir sınıf için doğru sınıflandırılmış piksel sayısının, matrisin satır kısmında bulunan ilgili sınıfa ait toplam piksel sayısına bölümünden elde edilen değerdir. Üretici doğruluğu, doğru olarak sınıflandırılmış piksellerin test verisi içindeki oranını, başka bir ifadeyle bir test pikseli için doğru sınıfa atanma ampirik olasılığını belirtir. Kullanıcı doğruluğu ise bir sınıfa atanan piksellerin gerçekte o sınıfa ait olma ampirik olasılığını ifade etmektedir. Üretici doğruluğu, kullanılan sınıflandırma yönteminin başarısını ölçerken, kullanıcı doğruluğu, üretilen tematik haritaya ait güvenin bir ifadesidir.
Tematik haritalara ait doğrulukların analiz edilebilmesi amacıyla kullanılan bir diğer yöntem, Kappa istatistiğidir. Kappa istatistiği, üretilen tematik harita ile test verisi arasındaki doğruluğu, matrisin ana diyagonal elementleri toplamı ve matriste yer alan satır ve sütün toplamlarına bağlı kalarak hesaplamayı sağlayan ve bu yolla elde edilen doğruluğun şans faktörüne bağlı olup olmadığını ortaya koyan istatistiksel bir ölçümdür.