SAĞLIK ALANINDA İSTATİSTİK - Ünite 1: Temel Kavramlar Özeti :
PAYLAŞ:Ünite 1: Temel Kavramlar
Giriş
Bilgi çağı olarak adlandırılan günümüzde, bilginin nasıl elde edileceği, nasıl çözümleneceği ve nasıl yorumlanacağı önemli bir sorun olarak karşımıza çıkmaktadır. İlgilenilen konuya ilişkin bilgiye veri adı verilir ve ancak sayı biçimindeki veriler çözümlemeye ve yorumlamaya uygun verilerdir.
Günlük yaşantıda sıklıkla karşılaşılan istatistik kelimesinin gerçekte iki farklı anlamı bulunmaktadır. Daha yaygın olarak istatistik, sayısal bilgi anlamında kullanılır. Aritmetik ortalama, standart sapma, oran ya da ilişki katsayısı gibi hesaplanan sayısal bilgilerin her biri birer istatistiktir. Çağdaş anlamda istatistik, doğadaki değişkenlikten ortaya çıkan sayısal bilgilerin incelenmesinde uygulanan bilimsel çalışmaların bütünü olarak ifade edilebilir. Tanım olarak vermek gerekirse istatistik; belli bir amaç için verilerin toplanması, düzenlenmesi, tablo ve grafiklerle gösterilmesi, analiz edilmesi ve elde edilen sonuçların yorumlanması konularını içeren ve daha etkili kararlar almada yardımcı olan bir bilim dalıdır.
Verilerin toplanması, düzenlenmesi, sunulması, analiz edilmesi ile ilgili konuları içeren istatistik dalın tanımlayıcı istatistik adı verilir.
Bir diğer istatistik dalı çıkarımsal istatistiktir. Çıkarımsal istatistikte temel olarak amaç, ilgilenilen topluluktan seçilen bir alt grup yardımıyla o topluluğa ilişkin bilgi sağlamaktır.
İstatistiksel yöntemlerin biyolojik bilimlerle ilgili problemlerin çözümünde uygulandığı bilim dalına da biyoistatistik adı verilir.
Sağlık Alanında İstatistiğe İlişkin Temel Kavramlar
Hakkında bilgi toplanmak istenilen, üzerinde özellikleri ile ilgili ölçüm, sayım ya da gözlemlerin yapılabildiği canlı varlıklar, nesneler ya da olayların her birine birim adı verilir. Dolayısıyla istatistikte bir olgunun birim olarak kabul edilebilmesi için, sayılabilir, gözlenebilir ya da ölçülebilir özellikleri bulunması gerekir.
Sunma ve yorumlama yapmak amacıyla birimlerden toplanan, analiz edilen ve özetlenen sayısal bilgilere veri adı verilir. İstatistikte genellikle bir tek birimle değil, birden çok birimden elde edilen veri topluluğu ile ilgilenilir. Birden fazla birimden örnek toplanmadıkça uygulanan istatistik tekniklerinin herhangi bir bilimsel değeri olmayacaktır. Dolayısıyla bir araştırmada birimlerden toplanan tüm veriler bu araştırmanın veri seti olarak adlandırılır.
Yukarıdaki tanımlamalarda hep ilgilenilen bir topluluk kavramından söz edildi. Kullandığımız bu topluluk kavramının çıkarımsal istatistikte çok önemli bir yeri ve özel bir adı bulunmaktadır. Çeşitli Türkçe kaynaklarda “popülasyon”, “evren” ya da “kitle” olarak da belirtilen ana kütle, bilimsel bir araştırmada incelenecek olan birimlerin oluşturduğu topluluğa verilen addır. İstatistikte ana kütle daima belli bir bölge ya da belli bir zaman aralığında tanımlanan ve üzerinde çıkarsamalar yapılacak olan birimlerden elde edilen gözlemler topluluğu anlamını taşımaktadır.
Sayılabilecek sayıda birim içeren ana kütlelere sonlu ana kütle denir. Örneğin, bir ildeki sağlık ocakları topluluğu, bir ilçedeki hasta bakıcılar topluluğu sayılabilecek sayıda olmalarından dolayı sonlu ana kütle niteliğindedirler. Sonlu bir ana kütlede yer alan toplam birim sayısı N harfiyle belirtilir.
İçerdiği birim sayısı sayılamayacak kadar büyük olan ana kütlelere sonsuz ana kütle adı verilir. Örneğin, dünya üzerinde yaşayan sivrisinek topluluğu sayılamayacak kadar çok sivrisinekten oluştuğu için sonsuz ana kütle niteliğindedir.
Sağlık alanında istatistikte kullanılan veriler genellikle birimlerden alınan ölçüm ya da gözlem değerlerine dayalı olarak elde edilmektedir. Sonlu bir ana kütlede çok fazla sayıda birim bulunmuyorsa ve bu birimlerin tamamına ulaşmak zaman, maliyet, işgücü vb. gibi kayıplara yol açmıyorsa ana kütledeki tüm birimler dikkate alınarak araştırma gerçekleştirilebilir. Buna göre, bir araştırma ana kütledeki tüm birimler ele alınarak gerçekleştiriliyorsa buna tam sayım adı verilmektedir. Bir ana kütledeki birimlerin tamamına ulaşılamadığı durumlarda, ana kütleyi iyi temsil edecek şekilde ve daha az sayıda birim alarak oluşturulan alt kümeye örneklem adı verilir.
Koşullara bağlı olarak farklı zamanlarda farklı değerler alabilen birimlerin herhangi bir özelliğine ya da karakteristiğine değişken adı verilir. Örneğin yapılacak tıbbi bir araştırmada, hastaların cinsiyeti, ağırlığı, boyu, verilen ilacın dozu, ilaca tepki süresi gibi özellikler birer değişkendir. Değişkenler genellikle X, Y, Z gibi harferle gösterilirler. Yapılan bir araştırmada yer alan tüm birimler için veriler belirlenen değişkenlere ilişkin olarak toplanan ölçümlerden oluşur. Belli bir birim için elde edilen ölçümler kümesi de gözlem olarak adlandırılır.
Birimlerin incelenen özelliği sayısal olarak kaydedilebildiğinde, bu özelliğe de nicel değişken adı verilir. Örneğin, kişinin yaşı, bir ilacın raf ömrü ya da bir ailedeki çocuk sayısı gibi sayısal olarak ifade edilebilen değişkenler nicel değişkenlerdir. Yapılacak aritmetik işlemler nicel değişkenler için anlamlı sonuçlar sağlayabilir. Örneğin, kişilerin yaşları toplanıp kişi sayısına bölünerek ortalama yaş değeri hesaplanabilir. Bu ortalama değeri anlamlı ve de kolayca yorumlanabilir bir değer olacaktır. Nicel değişkenler de kendi içerisinde kesikli ya da sürekli değişkenler olmak üzere ikiye ayrılabilir. Alacağı değerler sadece tamsayı olarak belirtilebilen nicel değişkenlere kesikli değişken adı verilir. Örneğin, bir hastanedeki yatak sayısı, acil servise bir günde gelen hasta sayısı, bölgede yetişen bitki türü sayısı gibi değişkenler yalnızca tamsayı olarak ifade edilebildiği için kesikli değişkenlerdir. Bu değişkenler sayma yoluyla elde edilirler. Gözlem değerleri belli bir sayı aralığı içerisinde kesirli ondalık sayılar olarak ifade edilebilen nicel değişkenlere sürekli değişken adı verilir. Örneğin, bir hastanın kan basıncı, vücut ağırlığı, içme suyunun pH miktarı gibi değişkenler ondalıklı sayı olarak ifade edilebildiği için sürekli değişkenlerdir. Bu değişkenler ölçme yoluyla elde edilirler. Bir ana kütlenin ölçülebilen herhangi bir özelliğinin almış olduğu sayısal değerlere parametre adı verilir. Örnek olarak, sonraki ünitede ayrıntılı olarak incelenecek olan ana kütle aritmetik ortalaması ya da ana kütle standart sapması, ana kütledeki tüm birimler ele alınarak hesaplandığı için birer parametredir. Dolayısıyla parametre, ana kütledeki bütün birimler ele alınıp hesaplanan sayısal ya da oransal bir değerdir.
Ölçme Düzeyleri
Veriler ölçme düzeylerine göre sınıflandırılabilir. Verilerin içerdiği bilgi miktarı belirlenirken ve eldeki verilere en uygun veri özetleme ya da istatistiksel analiz tekniğine karar verilirken ölçme düzeyinden yararlanılır. Genel anlamda değişkenlerin derecesinin belirlenerek, sonuçların sayısal olarak ifade edilmesine ölçme adı verilir. “Ölçmeye konu olan özelliklerin sınıflanması, sıralanması, derecelenmesi ya da miktar ve derecelerinin belirlenebilmesi için uyulması gereken kurallarla kısıtlamaları belirleyen ölçme araçlarına ölçek denir.” Ölçekler değişkene atanan sayısal değerlerin içerdiği bilgiye göre belirlenmektedir. Ölçme düzeyi olarak; sınıflayıcı ölçek, sıralayıcı ölçek, eşit aralıklı ölçek ve oransal ölçek olmak üzere dört farklı ölçek türü bulunur. Sınıflayıcı ve sıralayıcı ölçekler nitel verilerde kullanılırken, eşit aralıklı ve oransal ölçekler nicel verilerde kullanılır.
Frekans Dağılımları
Toplanan verilerin frekans dağılımlarının oluşturulması ve tablolar yardımıyla sunulması bu konunun altında incelenmektedir.
Deney ve araştırma sonucunda elde edilen ve ilgilenilen değişkenin herhangi bir özelliğine göre sıralanmış veri kümesine basit seri adı verilir. Basit seriler, üzerinde analiz yapılacak olan gözlem değerlerinin küçükten büyüğe ya da büyükten küçüğe doğru sıralanması ve alt alta ya da yan yana yazılması yoluyla oluşturulur.
Büyüklük sırasına konmuş birimlerin birden fazla kullanılması durumunda ilgilenilen değişkenin aldığı değerlerin tekrarlanma sayılarını da gösterecek şekilde elde edilen seriye frekans serisi adı verilir. Frekans serileri, ana kütleyi incelenen değişkenin şıklarına göre sınıflama yoluyla elde edilir ve ana kütlenin dağılımını gösterir. Frekans serilerinde değişkenlerin farklı düzeylerinin kaçar kez tekrarlandığını gösteren sayılara ise frekans (sıklık) adı verilir.
Birbirinden farklı tüm sonuçların tekrar sayıları yerine bu sonuçların belirli aralıklara ya da sınıflara bölünmesi ve her aralıkta ya da sınıfa ilişkin birim sayısı frekansları oluşturacak şekilde yeniden düzenlenen frekans serisine gruplanmış frekans serisi adı verilir.
Bazı araştırmalarda araştırma sonuçları yorumlanırken kaç adet gözlem sonucunun belirli bir değerden daha yüksek ya da daha düşük olduğu sorusu cevaplanmak istenebilir. Bu sorunun daha kolay cevaplanabilmesi için kümülatif frekans serisi oluşturulur. Kümülatif frekans serileri araştırılması yapılan soruya göre küçükten büyüğe ya da büyükten küçüğe doğru oluşturulabilir. Küçükten büyüğe doğru oluşturulan kümülatif frekans serisinde -den az adı verilen yeni bir sütun bulunurken büyükten küçüğe doğru oluşturulan kümülatif frekans serileri için -den çok adı verilen sütun bulunur. -den az sütunu oluşturulurken ilk satırdan başlanarak ve frekanslar toplanarak ilerlenirken, -den çok sütunu oluşturulurken frekansların toplanması işlemine en son satırdan başlanır.
Eğer incelenmesi gereken iki değişken bulunuyorsa bu iki değişkenin birlikte değişiminin tek bir tabloda gösterilmesi amacıyla değişkenlerden birinin farklı düzeylerinin tablonun satırlarına, diğerininkilerin de tablonun sütunlarına yerleştirilmesi yoluyla oluşturulan tablo türüne kontenjans tablosu ya da iki-yönlü frekans tablosu adı verilir.
Verilerin Grafiksel Gösterimi
Elde edilen sayısal veri kümesi bir frekans tablosu yardımıyla gösterilebileceği gibi, uygun grafiklerin çizilmesi yoluyla da gösterilebilir. Rakamlarla dolu bir tablo yerine bunları sembolize eden grafiklerin incelenmesi, daha görsel olması nedeniyle çoğu zaman tercih edilebilir. Verilerin görselleştirilmesi amacıyla sağlık alanında istatistikte sıklıkla kullanılan grafik türleri çizgi grafiği, sütun grafiği, histogram, dal-yaprak grafiği ve saçılım grafiğidir.
Çizgi grafiği, incelenen değişkenin zaman içerisinde aldığı değerleri göstermek amacıyla kullanılabilir. Çizgi grafiklerinde incelenen değişkenin aldığı değerler düşey eksende, zaman değişkeninin değerleri de yatay eksende belirtilir. Sütun grafiği, uygun frekans serisi oluşturulan verilerin görsel olarak da açıklanabilmesini sağlayan grafik türlerinden biridir. Sütun grafikleri en fazla isimsel veriler için kullanılmakla birlikte, sıralı ve sürekli veriler için de oluşturulabilir. Bu grafik türü sürekli veriler için kullanıldığında sütun grafiği yerine “histogram” adını almaktadır.
Dal-yaprak grafiği görünüş olarak histograma benzemekle birlikte, temel olarak histogramdan farkı; sınıf aralığının frekansını belirten sütunların yerine veri değerlerini kullanmasıdır. Bununla birlikte, histogram genelde büyük veri setleri için kullanılırken dal-yaprak grafiği nispeten küçük veri setleri için oluşturulur.
Saçılım grafiği ise, iki değişken arasındaki ilişkinin varlığını görsel olarak araştırmak amacıyla oluşturulur.