SOSYAL AĞ ANALİZİ - Ünite 2: Temel Kavramlar Özeti :

PAYLAŞ:

Ünite 2: Temel Kavramlar

Giriş

Sosyal ağlarda düğümler “aktör” adını almaktadır. Örneğin; bir aktörün (bir insan) arkadaşlık bağlantılarından oluşan ağ “ego ağı” adını alır. Sözünü ettiğimiz bu tür sosyal ağların, iş bulma olasılıklarını kariyer başarılarını etkileyip etkilemediği, yeniliklerin yayılmasında ağların ne gibi bir fonksiyonu olduğu, firmalar arası iş birliği ağları ve ağların liderliğe olan etkileri yapılan araştırmalarla incelenmiştir. Bir aktörün sosyal ağının ona sosyal bir sermaye sağlayıp sağlamadığı da yine araştırılan konular arasındadır. Ancak şu bir gerçek ki, günümüzde sosyal ağlar anketlerle incelenemeyecek kadar büyümüştür ve bu tür araştırmaların bilgisayar ve İnternet olmaksızın gerçekleştirilebilmesi kolay değildir.

Yönlü ve Yönsüz, Tartılı ve Tartısız Ağlar

Bu bölümde, düğümler arasındaki bağlantıların yönüne ve ağırlığına (gücüne) göre nasıl adlandırıldıklarına değinilecek, ayrıca ikili ve üçlü bağlantılardan söz edilecektir.

Yönlü ve Yönsüz Ağlar

Ağlar yolu ile iletişim kurarız, bilgiyi paylaşırız, yönetiriz.

Oklar; bir düğümden diğerine olan bağlantının, gönderilenlerin yönünü bize göstermektedir. Düğümler arasında ok yerine çizgi veya bağlantı da olabilir. Bu durumda düğümler arasında yönsüz bir bağlantı vardır deriz. Bir düğümün diğer düğümler ile arasındaki bir ok veya çizgi yoksa bu düğüm diğer düğümlerle etkileşim içinde değildir; ne onları etkilemekte ne de onlardan etkilenmektedir deriz.

Bir kişi bir başka kişiye telefon açtığında, bu tür çizgede iki kişiyi bağlayan çizgide, belirli bir yöne sahip bir ok olması doğaldır. Daha sonra, telefon açılan kişi ona telefon açana telefon açarsa, doğal olarak ok her iki yönde de olacaktır. Oysa nişanlı veya evli iki kişi arasında veya ortak iş yapan iki şirket arasında bu tür bir ok ve okun yönü söz konusu değildir. Bu verdiğimiz örnekler çerçevesinde bağlantılar ve ağlar yönlü (directed) veya yönsüz (undirected) olarak iki sınıfta düşünülebilir. Yönlü ağlarda, düğümlerden gönderilen soyut veya somut bir şeyler söz konusudur ve çizgelerde, bunlar oklarla gösterilir. Yönlü ağlarda bağlantı tek yönlü olabileceği gibi iki yönlü de olabilir. Buna karşılık, yönsüz ağlarda ise, sadece paylaşılan ortak özellikler vardır ve bağlantılar ok işaretinin yer almadığı bir çizgi şeklindedir. Yönsüz ağlarda bağlantılar simetriktir. Yönlü ağlara örnek olarak, Twitter ve telefon açmak; yönsüz ağlara örnek olarak ise, Facebook ve akrabalık, arkadaşlık ilişkileri verilebilir.

İkili ve Üçlü Bağlantılar

Ağ analizlerinde diadik ilişkiler iki düğüm arasındaki ikili ilişkilerdir. Yine ağ analizinde üç düğüm arasındaki bağlantılar ise triadik bağlantılar olarak adlandırılır. Yönlü ağlarda iki düğüm arasında üç tür bağlantı olabilir:

  • İki düğüm arasında hiçbir bağlantı olmayabilir
  • İki düğüm arasında tek yönlü bir bağlantı olabilir.
  • İki düğüm arasında karşılıklı (reciprocal) bir bağlantı olabilir.

Eğer Pajek yardımı ile bir ağdaki üçlüleri (triads) saydırmak istersek, şu komutlarla ilerlemeliyiz:

Network > Info > Triadic Census

Eğer bir sosyal ağda iki kişi ortak bir arkadaşa sahip ise, o iki kişinin de gelecekte artan bir olasılıkla arkadaş olmaları beklenir ve bu olguya “üçlü kapanma” (Triadic closure) adı verilir. Eğer A düğümünün B ve C düğümleri ile bağlantıları varsa ve eğer bu bağlantılar kuvvetli bağlarsa, özellikle B-C bağının oluşması olasıdır.

Tartılı ve Tartısız Ağlar

Ağlar, tartılı (weighted) olabilecekleri gibi tartısız (unweighted) da olabilirler. Eğer i ve j düğümlerinin arasındaki bağlantı w ij =1 ise ve diğer bütün düğümler arasındaki bağlantıların değeri 1’e eşitse bu ağ tartısız bir ağdır. Oysa cep telefonu ile konuşan iki kişinin konuştukları süreler veya bu sürelerin toplamı, ağda tartı olarak alınabilir ve bu tür ağlar tartılı ağlar olarak adlandırılırlar. Benzer şekilde, verilen borç miktarları ve yapılan ithalat/ihracat miktarları da tartı olarak alınabilir.

Derece, Ortalama Derece ve Derece Dağılımı

Bir ağdaki düğüm (sosyolojik anlamda aktör) sayısı, “ağ büyüklüğü” adını alır ve ağ büyüklüğü N ile gösterilir. Bir ağın düğüm sayısı arttıkça o ağdaki karmaşıklık artar. Yönlü bir ağ için maksimum bağlantı sayısı N(N-1) ile yönsüz bir ağ için ise maksimum bağlantı sayısı N(N-1) / 2 ile hesaplanır. N(N-1) / 2 sayısı bize aynı zamanda bir ağdaki düğüm çifti sayısını gösterir. Sayfa 25’deki Tablo 2.1’de, ağdaki düğüm sayısına, çeşitli ağ büyüklüklerine ve ağın yönlü veya yönsüz olmasına göre hesaplanmış maksimum bağlantı sayıları verilmiştir.

Derece, bir düğümün bağlantılı olduğu komşu sayısıdır. Yönlü ağlarda bir ağdaki düğümlerin gelen dereceleri, giden dereceleri ve toplam dereceleri söz konusudur. Toplam derece, gelen ve giden derece sayılarının toplamıdır.

En yüksek dereceye sahip olan düğümler, bir anlamda ağdaki akışı kontrol edebilecek güce sahip olan “merkezî düğümler”dir (hubs). Merkezî düğümlerin gelen ve giden bağlantıları yüksektir. Eğer bir merkezî düğümün gelen bağlantı derecesi yüksek ise, bunun anlamı o düğüme çok fazla danışıldığı olabilir. Yine bir merkezî düğümün giden bağlantı derecesi yüksek ise, o zaman da bunun anlamı, bu düğümün sağa sola çok fazla talimat verdiği, görüş bildirdiği veya haber verdiği anlamında olabilir. Merkezî düğümler bir ağdaki önemli düğümlerdir. Sosyal ağ analizinde merkezî düğümlerin belirlenmesi önemlidir.

Bir i düğümünün derecesini k i ile gösteriyoruz. Yönsüz bir ağda toplam bağlantı sayısı olan toplam derece, düğümlerin derecelerinin toplamıdır:

Burada kullanılan ½ , bağlantıların her iki düğüm için de sayılması nedeniyle kullanılmaktadır. Yönsüz bir ağ için ortalama derece şu şekilde hesaplanır:

Yönlü ağlar için gelen (in) ve giden (out) derece toplamı, toplam dereceye eşit olacaktır:

Yönlü bir ağ için toplam bağlantı sayısı şöyle hesaplanabilir:

Yönlü bir ağ için ortalama derece ise şu şekilde hesaplanır:

Derece Dağılımı

Derece dağılımı pk ise bize bir ağda rassal olarak seçilen bir düğümün k derecesine sahip olması olasılığını verir. N’nin bir ağdaki toplam düğüm sayısı ve N k ’nın bir ağda k derecesine sahip düğüm sayısı olduğunu hatırlayarak, N k değerlerini N’ye bölerek bu değerleri normalize edip olasılık toplamlarını 1 yapabiliriz:

Ağlar için derece dağılımı pk çok önemlidir çünkü bu dağılım ağın dirençli bir ağ olup olmadığından, ağda virüslerin yayılmasına kadar birçok gelişmeyi belirler. Ayrıca derece dağılımı, ağların türünün belirlenmesinde kullanılan ağın DNA’sı gibidir.

Komşuluk Matrisi

Komşuluk matrisini bir Aij matrisi şeklinde düşünürsek ve bu matrisin bağlantılarının değerleri 1 ise, bu matrisin elemanları şu şekilde olur:

Eğer j’den i’ye bir bağlantı varsa Aij =1

Eğer j’den i’ye bir bağlantı yoksa Aij = 0

olur. Eğer komşuluk matrisi yönsüz bir ağın komşuluk matrisiyse, bu matris simetrik bir matristir. Aij = Aji ve Aii =0 olur ve ayrıca derecelerin satır toplamları, sütun toplamlarına eşit olur:

Yönsüz bir ağ için toplam bağ sayısı ile ortalama derece sayısı şu şekilde hesaplanabilir:

Buna karşılık, yönlendirilmiş ağların komşuluk matrisi simetrik olmak zorunda değildir. Yönsüz ağlarda A ij ? A ji ve A ii =0 olur ve satır toplamları sütun toplamlarına eşit olmak zorunda değildir. Gelen ve giden bağlantıların sayısı veya değerlerinin toplamı aynı olmak zorunda değildir:

Yönlendirilmiş bir ağ için ise toplam bağ sayısı ile ortalama derece sayısı şu şekilde hesaplanabilir:

Ağ Türleri ve Ağ Yoğunluğu

Bu bölümde, düğümlerine göre ağ türlerinin nasıl adlandırıldıklarından söz edilecek, ardından bağlantı sayılarına göre ağların seyrek ve yoğun şeklinde nitelendirilmesine ilişkin açıklamalar yapılacaktır.

Tek Parçalı, İki Parçalı ve Çok Parçalı Ağlar

Biz genelde aynı türden düğümlerden oluşan ağlarla ilgileniriz. Örneğin; insanların oluşturdukları sosyal ağlarda düğümler aynı türden olduğu için bu ağlar “tek parçalı ağ” adını alır. Kullanıcıları kullanıcılara veya dokümanları dokümanlara bağlayan ağlar tek parçalı ağlardır. Ancak bir ağda müşteriler ve ürünler gibi iki tür düğüm söz konusu ise o zaman bu ağ “iki parçalı ağ” adını alır.

Başka durumlarda ise düğüm türleri eğer ikiden de fazla ise o zaman bu ağ “çok parçalı ağ” adını alır. İki veya daha çok parçalı ağlarda düğüm türleri, farklı renk ve şekillerle gösterilebilir. Ağ ölçülerinin çoğunluğu tek parçalı ağlar için geçerli olduğundan, iki veya çok parçalı ağları analiz etmek için önce bu ağlar tek parçalı biçime dönüştürülür ve hesaplamalar daha sonra yapılır.

Gerçek Ağların Seyrekliği

Gerçek ağların düğüm (N) ve bağlantı sayıları (L) birbirinden çok farklıdır. Bir ağdaki bağlantı sayısı L=0 ile LMaks arasında değişir. Tam bir çizgede, maksimum bağlantı sayısını gösteren L Maks sayıda bağlantı bulunur. Gerçek ağlarda L değeri L Maks değerinden çok küçüktür ve bu durum bize gerçek ağların seyrek olduğunu gösterir. Seyrekliğin özellikle ağların bilgisayar belleklerinde saklanmasında bize kolaylıklar sağlayabileceği unutulmamalıdır. Gerçek ağlarda düğüm sayısı (N) ve bağlantı sayısı (L) çok çeşitli değerler alabilir. Örneğin, yaşayan organizmalardan beyin haritası çıkarılan ilk canlı bir kurtçuk olan C. Elegans’tır ve onun sinir ağında 297 nöron (düğüm) ve 2345 sinaps (bağlantı) bulunmaktadır. İnsan beyninde ise, yüz milyar (1011) nöron ve bu nöronların her birinde ortalama 7000 bağlantı bulunmaktadır. İnsan hücresinin genetik ağında düğüm olarak 20000 gen bulunmaktadır. Web’de trilyondan fazla (N>1012) web sayfası bulunmaktadır. Bir ağda bağlantı sayısı sıfır olabileceği gibi ağdaki maksimum bağlantı sayısı aşağıdaki formül ile hesaplanır:

Maksimum bağlantıya sahip ağın çizgesine ise, tam çizge (complete graph) adı verilir. Tam ağ çizgesi, rassal ağ çizgesi, ölçekten bağımsız ağ çizelgesi gibi belirli özelliklere sahip ağların çizgelerinin elde edilmesinde Pajek (okunuşu Pah-yek) programı kolaylıklar sağlamaktadır. Bu nedenle, maksimum bağlantıya sahip tam bir ağın çizgesini Pajek programı ile şu komutlar yardımı ile çizebiliriz:

Network > Create new Network > Complete Network > Directed

Bu komutlar: “Ağ > Yeni Ağ Oluştur > Tam Ağ > Yönlü Ağ” anlamındadır.

Daha sonra ekranda beliren diyalog kutusunda, “Enter number of vertices” (düğüm sayısını gir) satırındaki boşluğa, istediğimiz düğüm sayısını girip OK tıklanır. Bu işlemlerden sonra, tam ağ çizilir:

Draw > Network (Çiz > Ağ)

Gerçek ağların sahip oldukları bağlantı sayıları L, maksimum bağlantı sayılarından küçüktür. Örneğin; web, sahip olabileceği maksimum bağlantı sayısının sadece 1/106 kadarına sahiptir. Diğer gerçek ağlar için de bu oran değişebilir ama ağların seyrek (sparse) olma olgusu değişmez. Ağların komşuluk matrislerinin seyrek matris olması olgusu, kullanılan bilgisayar algoritmasında gereksiz alanları saklamadan sadece sıfır olmayan elemanları saklayarak önemli bir kazanım sağlamamıza yol açar.

Gerçek ağların seyrek ağlar olması olgusu, Metcalfe yasasını da etkiler. Ağların çoğunda tam bağlantı sayısının (maksimum bağlantı sayısı) sadece küçük bir oranının gerçekte yer alması, ağların değerinin N2 ile büyümediğini, belki de N sayısı ile doğrusal bir şekilde büyüdüğünü bize anlatır. Diğer yandan, ağlardaki bağlantıların değerleri birbirlerine eşit değildir. Öte yandan, bazı bağlantıların ağırlıklarının diğerlerine göre çok büyük olması da Metcalfe yasasının geçerliliğini etkiler.

Ağ Yoğunluğu

Sosyolojik açıdan ağdaki uyumluluk, birliktelik, dayanışma ve aidiyet ağ yoğunluğu (density) ile ölçülür.

Yoğunluk, düğümler arasındaki karşılıklı bağlantılı olmanın düzeyini ölçen bir ölçüdür.

Patika, En Kısa Patika ve Ortalama Patika Uzunluğu

Bir ağda iki düğüm arasındaki, bağlantıların birbirine eklenmesinden oluşan yol patika adını alır. Her düğüm arasındaki yolun bir birim olduğunu söyleyebiliriz. İki düğüm arasında birden fazla patika var ise, patikalar arasındaki en kısa patika, en az sayıda yola sahip patikadır. Yönsüz ağlarda iki düğüm arasındaki en kısa patika her iki düğüm için aynı iken, bu durum yönlü ağlarda farklı olabilir. Örneğin, X düğümünden Y düğümüne en kısa patikaya dxy ise ve Y düğümünden X düğümüne en kısa patika dyx ise, yönsüz ağlarda dxy = dyx iken, yönlü ağlarda genellikle dxy ? dyx’tir. İki düğüm arasında birden çok sayıda en kısa patika olması da mümkündür. Ağlarda en kısa patikaların bulunması için farklı algoritmaların bulunduğunu da söylemeliyiz.

Ortalama patika uzunluğu ise, bütün düğüm çiftleri arasındaki en kısa patikaların ortalaması olarak tanımlanabilir: