DİJİTAL GÖRÜNTÜ İŞLEME - Ünite 6: Sınıflandırma-İleri Teknikler Özeti :

PAYLAŞ:

Ünite 6: Sınıflandırma-İleri Teknikler

Temel Kavramlar

Uzaktan algılamada piksel tabanlı yaklaşım, 1990’ların sonlarına kadar kabul gören bir paradigma olmuştur. Piksel tabanlı yaklaşım, çalışılan ortalama nesne boyutunun, piksel çözünürlüğünden daha küçük veya piksel çözünürlüğüne yakın olduğu düşük mekânsal çözünürlüklü görüntüler için daha kabul edilebilir.

Piksel tabanlı yaklaşımların uygulandığı süreçte, düşük mekânsal çözünürlükte karşılaşılan temel sorun, bir pikselin birden fazla nesnenin yansıtımını içermesi olarak karşımıza çıkar.

Bu tür karışık piksellerin sınıflandırılmasında, spektral karışım analizi yöntemlerinden bileşenlere ayrıştırma (unmixing) yöntemi uygulanabilir.

Nesne Tabanlı Sınıflandırma

Temel olarak nesne tabanlı sınıflandırma iki farklı süreçle uygulanmaktadır. Bunlar:

  • Segmentasyon - Nesne çıkartımı
  • Sınıflandırma

Segmentasyon - Nesne Çıkartımı

Piksel tabanlı bir sınıflandırma, eğitim, sınıflandırma ve doğruluk analizi süreçlerini içermektedir. Nesne tabanlı sınıf andırmada ise bu üç aşamaya ek olarak, eğitim sürecinden önce piksellerin gruplandırılarak nesnelere dönüştürülme süreci vardır. Nesne çıkarma işlemi olarak adlandırılan bu aşamada, algılayıcılar tarafından piksel bazında ölçülerek kaydedilen yansıtma değerlerinin oluşturduğu dijital görüntü, komşuluk ve benzerlik kriterlerine göre piksel gruplarına ayrılır. Yaygın olarak segmentasyon adıyla bilinen bu adımda, görüntü işlemenin daha sonraki adımlarında kullanılacak olan segmentler yani görüntü nesneleri elde edilmektedir. Bu aşama, nesne tabanlı sınıflandırmanın ilk ve en önemli aşaması olup, sonraki adım olan sınıflandırma sürecinde, pikseller yerine nesneler kullanılabilecektir.

Görüntü segmentasyonu genel olarak üç farklı kategoride gerçekleştirilmektedir:

  • Piksel tabanlı,
  • Sınır tabanlı
  • Bölgesel tabanlı

Piksel (nokta) tabanlı segmentasyon: En basit yöntemdir. Her piksel, belirli eşik değerlerine göre bir kategoriye atanır.

Sınır tabanlı segmentasyon: Bu yöntemde, önce uç değerlere sahip pikseller belirlenir ve nesne boyunca bu maksimum pikseller, çeşitli takip algoritmalarıyla başlangıç noktasına gelinceye kadar tespit edilerek, nesneyi çevreleyen sınır ortaya çıkartılır.

Bölgesel tabanlı segmentasyon: Bölgesel tabanlı yaklaşım, konumsal kümeleme olarak da adlandırılmaktadır. Kümeleme, benzer parlaklık değerine sahip piksellerin gruplandırılmasını, konumsal ise aynı kategorideki piksellerin tek bir bağlantılı bileşen oluşturmasını ifade eder.

Görüntü segmentasyonu nda kullanılan en yaygın üç temel ölçüt (parametre) aşağıda verilmektedir:

  1. Renk/Şekil
  2. Yoğunluk/Pürüzsüzlük
  3. Ölçek

Renk / Şekil Ölçütü: Renk ölçütü, nesne çıkartımı için piksellerin gruplandırılmasında kullanılan komşu piksellerin yansıtım değerleri benzerliğine dair bir ölçüttür. Yüksek şekil değeri, segmentasyon sürecinde rengin etkisini azaltırken, şekil üzerindeki etkisini artırmaktadır. Benzer şekilde düşük şekil değeri, segmentasyonda rengin etkisinin artmasına neden olmaktadır.

Yoğunluk / Pürüzsüzlük Ölçütü: Birbirlerini tamamlayıcı diğer iki parametre, renk yoğunluğu ve kenar pürüzsüzlüğü ölçütleridir. Renk yoğunluğu ölçüt değeri arttırılarak, renge bağlı olarak diğer nesnelerden kolaylıkla ayırt edilebilen cisimler elde edilebilir. Pürüzsüzlük ölçüt değerinin yüksek seçilmesi ise segmentasyonda nesne sınırları oluşturulurken daha düzgün sınırların belirlenmesine yardımcı olur.

Ölçek Ölçütü: Ölçek, nesne büyüklükleri ile ilgili diğer bir ölçüttür. Ancak, piksel sayısı veya alan büyüklüğü olarak doğrudan bir eşik değeri değildir. Segmentasyon işleminde bir homojenlik kriteri olarak renk, şekil, yoğunluk ve pürüzsüzlük ölçütleri ile birlikte kullanılmaktadır.

Yukarıda bahsedilen ölçütlerin dışında segmentasyonda ve bunun yanı sıra özellikle sınıflandırmada kullanılan temel özellikler, aşağıda 3 farklı kategoride detaylı olarak verilmiştir:

Spektral Özellikler

Bir nesneye ait spektral özellikler, o görüntü nesnesini oluşturan piksellerin, bir banttaki/katmandaki yansıtım değerleri ile hesaplanır. Bir nesneye ait hesaplanabilecek çok sayıda spektral özellik olmakla birlikte en temel özellikler aşağıda verilmiştir.

Ortalama değer: Nesneyi oluşturan piksellerin yansıtım değerlerinin aritmetik ortalamasıdır.

Standart sapma: Görüntü nesnesini oluşturan piksel yansıtım değerleri dağılımı ile ilişkili olarak türetilen standart sapma değeri, diğer bir spektral ölçüttür.

Minimum ve maksimum: Nesneyi oluşturan minimum ve maksimum piksel değerleridir. Genellikle eşik değer ile sınıf tanımı (örneğin, bir su alanını temsil eden görüntü nesnesinin yakın kızılötesi banttaki yansıtımına yönelik eşik değerin saptanmasında) yapılırken kullanılır.

Dağılım: Genel anlamda görüntü verisinin, istatistiksel sıklığını ifade eder.

Parlaklık: Nesneyi oluşturan belirli bir banttaki piksel değerlerinin toplamını ifade eder.

Maksimum fark: Değerlendirmeye alınan bantlar arasındaki farkı ifade eder.

Görüntü ile ilişki: Her bir nesneye ait piksel değerlerinin ortalaması ile görüntüdeki tüm piksellerin ortalaması arasındaki farkı ifade eder.

Oran: Birçok farklı formülasyon ile bant değerleri arasında gerçekleştirilebilir. En iyi oran, nesnelerin tanımlanmasında ayırt ediciliği en yüksek düzeyde gerçekleştirme potansiyeline sahip olandır.

Şekil Özellikleri

Nesne tabanlı sınıflandırmanın piksel tabanlı sınıflandırmaya göre en önemli üstünlüklerinden birisi de nesne şekil özelliklerinin kullanılabilmesidir. Şekil ölçütleri, görüntü nesnesine ait, alan, uzunluk, en/ boy oranı, çevre vb. gibi görüntü nesnesinden doğrudan elde edilen ölçümler olabileceği gibi, asimetri, sınır indeksi, eliptiklik, dikdörtgenlik, şekil indeksi vb. gibi görüntü nesnesi için farklı formülasyonlarla türetilen değerler de olabilir. Benzer nitelikte birçok şekil bilgisi kullanılmakla birlikte en yaygın olanlar aşağıda verilmiştir.

Alan: Nesne içerisinde yer alan piksellerin toplam sayısıdır.

Uzunluk ve genişlik: Nesne iskeletine bağlı olarak tanımlanır. Nesne iskeleti, nesnenin iç yapısını tanımlayan bir unsurdur.

Çevre: Nesne sınırlarındaki toplam piksel sayısıdır.

Asimetri: Nesnenin ana aksı boyunca simetrisinin hesaplanmasına bağlı olarak elde edilen bir değerdir.

Yoğunluk: Nesnenin uzunluk ve genişliğinin, nesneyi oluşturan piksel sayısına oranıdır.

Şekil indeksi: Nesne çevre uzunluğunun, nesneyi oluşturan piksel sayısına oranıdır.

En/boy oranı: Nesnenin genişlik ve uzunluğunun oranı (en/boy oranı)’dır.

Doku Özellikleri

Görüntü dokusu, uzaktan algılanmış görüntülerin önemli bir bileşenidir.

Doku analizi, uzaktan algılamada daha çok hava fotoğraflarının yorumlanmasında ve radar görüntü işlemede kullanılmıştır, ancak görünür ve yakın kızılötesi bölgede yansıyan enerjinin tespit edildiği optik uzaktan algılamada da yaygın olarak kullanılmaktadır.

Görüntü dokusunun üç temel bileşeni vardır;

  • Birinci bileşen: Lokal kontrast, yan yana olan koyu ve açık parlaklığa sahip piksellerin farklılıklarından hesaplanır.
  • İkinci bileşen: Görüntüde birbirine kontrast gösteren açık ve koyu alanların büyüklüğü ile ilgilidir ve iki farklı türde, kaba (alansal olarak büyük) ve ince (alansal olarak küçük) doku ile ifade edilir.
  • Üçüncü bileşen: Koyu ve parlak alanların yönlenmesini ifade eder.

Doku analizinde iki farklı temel yöntem kullanılmaktadır:

  • Birinci derece istatistikler
  • İkinci ve daha üst derece istatistikler

Birinci derece istatistikler: Birinci derece istatistiklere verilebilecek basit ama oldukça yararlı bir doku ölçütü hesaplama yöntemi standart sapma (SD)’dır.

İkinci ve daha üst derece istatistikler: İkinci ve daha üst derece istatistikler, pikseller arasındaki ilişkinin kullanıldığı hesaplamalardır.

Kapsam-İlişki Özellikleri

Kapsam-ilişki özellikleri, nesnelerin, diğer nesnelerle olan ilişkisi ile ilgili olarak elde edilebilen özellikleridir. Bu özellikler, bir nesne grubunun ayırt edici özelliği olarak kullanılabilir. Örneğin; görüntüdeki bir gölge nesnesi, etrafını çevreleyen parlak nesnelerle ayırt edilebilir ya da bir ada nesnesi, etrafını çevreleyen su nesnelerini tanımlamada kullanılabilir.

Nesneler arası yukarıda bahsedilen bu ilişkiler, aynı segmentasyon seviyesinde elde edilen nesneler arasında olduğu gibi, çok katmanlı segmentasyon olarak adlandırılan farklı seviyelerdeki nesneler arasında da kurulabilir.

Çok katmanlı segmentasyon: Farklı parametrelerle uygulanan birden fazla sayıda segmentasyon, birden fazla nesne katmanının oluşmasını sağlar. Farklı nesne katmanları söz konusu olduğunda, bir katmandaki nesne ile diğer bir katmandaki nesne arasında hiyerarşik bir ilişki oluşur. İki nesne arasında kurulan (örneğin, aynı sınıfa ait olma veya birinin diğerinin alt sınıfı olması vb. gibi) ilişkiler, hiyerarşik sınıflandırma sürecinin de ilk aşamasıdır.

Sınıflandırma

Piksel tabanlı sınıflandırmada, her pikselin içerdiği spektral bilgi ayrı olarak değerlendiriliyorken, nesne tabanlı sınıflandırmada, görüntü nesnelerine ait türetilen bütünleşik bilgiler değerlendirilmektedir. Böylelikle sınıflandırmada daha fazla istatistiksel veri (standart sapma, varyans, ortalama vb.) kullanılmış olmaktadır. Bunun yanı sıra nesnelere ait ölçütler de (örneğin, doku) sınıflandırma çalışmalarına dâhil edilerek daha doğruluklu sonuçların elde edilmesi sağlanır.

Sınıf tanımlarında kullanılan ölçütler için belirlenen değer aralıkları, kontrollü veya kontrolsüz sınıflandırma olarak adlandırılan iki farklı yöntemle belirlenmektedir.

Kontrollü Sınıflandırma

İlk adım olarak kullanıcı tarafından sınıflar belirlenir. Daha sonra her sınıf için, o sınıfı temsil eden eğitim nesneleri seçilir. Böylece her sınıf, kendini temsil eden eğitim nesnelerinin ölçüt değerleri baz alınarak belirlenen değer aralıkları ile tanımlanır. En yakın komşuluk yöntemi, en yaygın kullanılan nesne tabanlı kontrollü sınıflandırma yaklaşımıdır.

En Yakın Komşuluk: Çok yaygın olarak kullanılan bu yöntemde eğitim setinde bulunan nesnelere dayalı olarak, yani her bir örnek için eğitim setindeki nesneler ile karşılaştırma yapılarak, aralarındaki benzerliğe göre nesnenin hangi sınıfa ait olduğu belirlenir.

Kontrolsüz Sınıflandırma

Benzer şekilde ilk adım olarak kullanıcı tarafından sınıflar belirlenir. Daha sonra her sınıf için o sınıfı en iyi temsil eden ölçütler ile kullanıcının o ölçütler için belirleyeceği değer aralıkları tanımlanır. Kullanıcı müdahalesi daha fazla olmasına rağmen, ölçütlerin değer aralıkları hiçbir eğitim sınıfı kullanılmadan belirlendiği için, bu yöntem kontrolsüz sınıflandırma kategorisinde yer almaktadır. ‘Üyelik Fonksiyonları’ yöntemi, kontrolsüz nesne tabanlı sınıflandırma yaklaşımına örnek verilebilir.

Üyelik Fonksiyonları: Bu yöntemde her bir sınıf, karakteristik özellikleri ve özellik bilgilerinin dağılımıyla tanımlanır. Görüntü analizinde ilk olarak, her nesnenin tanımlanan özellikler için aldığı değerler hesaplanır ve bu özellikler referans alınarak, nesnenin her bir sınıfa ait üyelik değeri bulunur.

Hiyerarşik Sınıflandırma

Segmentasyon ve sınıflandırmanın birbiri ile ilişkili birden fazla seviyede gerçekleştirildiği bu sürece, hiyerarşik sınıflandırma adı verilmektedir. (S:192, Şekil 6.28’i inceleyiniz.)

Nesne Tabanlı Sınıflandırmada Doğruluk Analizi

Piksel tabanlı sınıflandırmada geleneksel olarak, Genel Doğruluk, Kullanıcı ve Üretici Doğruluklarını içeren hata matrisi ile Kappa İstatistiği yaygın olarak kullanılmaktadır.

Nesne tabanlı sınıflandırmada da benzer şekilde doğruluk analizi gerçekleştirilir; pikseller yerine nesnelerin, hangi oranda doğru sınıfa atandığı ile ilgili değerlendirme yapılır. Ancak bu sefer nesnelerin, hem doğru geometriye sahip olması (bir başka deyişle segmentasyonun doğruluğu) hem de sınıflandırılma doğruluğu dikkate alınmalıdır.

Piksel tabanlı sınıflandırmaya göre daha yeni bir yaklaşım olan nesne tabanlı sınıflandırmanın en temel avantajları, aşağıda kısaca özetlenmektedir:

  • Spektral ve doku bilgileri, istatistiksel olarak daha anlamlı ifade edilebilmektedir.
  • Nesnelere ait biçim ve topolojik bilgiler sınıflandırmaya ek bilgi olarak eklenebilmektedir.
  • Gerçek dünyadaki nesneler ile görüntüde segmentasyon sonucu oluşturulan nesneler arasında konumsal bir ilişki kurulabilmektedir.
  • CBS ve uzaktan algılama entegrasyonu kolaylaşmakta ve daha tutarlı sonuçlar elde edilmektedir.

Düzgünlük Etkili Sınıflandırma

Uzaktan algılamada düzgünlük etkili sınıflandırma, görüntüdeki anlamlı örüntü gruplarının belirlenmesi ve etiketlenmesi sırasında görüntüyü oluşturan piksellerin kendilerinin içerdiği bilgilerin yanı sıra her pikselin komşu piksellerinin de içerdiği bilgiler dikkate alınarak tematik haritanın yine piksel seviyesinde oluşturulduğu bir işlemdir. Bir başka deyişle sonuçta elde edilen tematik bilgiyi oluşturan sadece piksellerin kendisinin içerdiği bilgi değil, aynı zamanda belirli bir yakınlıktaki komşu piksellerinin içerdiği bilgidir ve sınıflandırma işlemi, temel yöntemlerde olduğu gibi yine piksel seviyesinde gerçekleştirilmektedir.