ÖĞRETİMDE PLANLAMA VE DEĞERLENDİRME - Ünite 6: Ölçme Araçlarında Bulunması Gereken Teknik Özellikler Özeti :

PAYLAŞ:

Ünite 6: Ölçme Araçlarında Bulunması Gereken Teknik Özellikler

Ölçme Araçlarında Bulunması Gereken Özellikler

Ölçme araçları bir özelliği ölçmek için kullanılırlar. Bu özellik bilgi olabilir, yetenek olabilir, zekâ olabilir, performans miktarı olabilir ya da kişilik olabilir. Tüm ölçme araçları bir amaç için geliştirilirler. Ölçme araçlarının, neyi ölçmek için geliştirildiyse sadece onu ölçmesi istenir. Aynı zamanda bir ölçme aracının ölçmek istediği özelliği ölçerken hata da yapmaması istenir. Amaca hizmet eden ve hata yapmayan bir ölçme aracının kolayca uygulanabilen, çok masraf ve emek gerektirmeyen bir araç olması da istenir. Kısaca, bir ölçme aracında geçerlilik, güvenirlik ve kullanışlılık özelliklerinin sağlanmış olması beklenir. Bu özelliklerden birisine ya da birkaçına sahip olmayan bir ölçme aracı gerçek sonuçlar yerine hatalı ya da amaçlanmayan sonuçlar verecektir.

Geçerlilik

Geçerlilik, bir ölçeğin ölçülmek istenen özelliği ölçüp, başka özellikleri ölçmemesidir. Bir ölçme aracı, ölçmeyi amaçladığı özelliği ölçüyorsa ortada geçerlilikle ilgili bir sorun yoktur. Fakat aynı ölçme aracı, ölçmek istediği özellikten başka değişkenleri de ölçüyorsa bu ölçeğin geçerliliği ile ilgili bir sorun var demektir.

Bir ölçeğin planlanmış ölçme amacı dışında planlanmamış ölçmeler de yapıp yapmadığını sınamak amacıyla çeşitli yöntemler geliştirilmiştir. Bu yöntemler geçerlilik kanıtları olarak isimlendirilmektedir. Geçerlilik kanıtlama yöntemleri:

Kapsam geçerliliği
Yordama geçerliliği
Benzer ölçek geçerliliği
Yapı geçerliliği
Görünüş geçerliliğidir.

Kapsam, bir öğretim programında yer alan etkinlikler, üniteler ve konulardır. Kapsam geçerliğinin ölçme aracının ölçmek istediği hedef, konu, ünite ya da içeriği başka hedef, konu ya da üniteler karıştırmadan ölçmesidir. Kapsam geçerliğini belirlemede yararlanılan yöntemler: testin belirtke tablosu ile uyumuna bakmaktır. Kapsam geçerliği testin belirlenen hedef (kazanım), konu ve üniteleri temsil etme derecesidir. Testin konu ve kazanımları ne kadar temsil ettiğini belirleyecek bir referans araca ihtiyaç vardır. Bu araç belirtke tablosudur. Belirtke tablosu, hangi konudan kaç tane, hangi düzeyde kazanım olduğunu gösteren iki boyutlu bir çizelgedir. Belirtke tablosunda yer alan hedeflerin büyük çoğunluğunu temsil eden sayıda sorudan oluşan bir testin kapsam geçerliliği yüksektir. Bununla birlikte kapsam geçerliğini sağlamak için test, bir alan uzmanına gösterilerek testi hazırlayan kişinin güzünden kaçmış¸ olabilecek eksiklikler bir başkasının güzünden belirlenmeye çalışılır.

Yordama geçerliliği, özellikle seçme ve yerleştirme amacıyla uygulanan testlerin geçerliliğini saptamak için kullanılan önemli bir yöntemdir. Uygulanan bir ölçeğe bağlı olarak verilecek kararların doğruluğunu ya da dakikliğini belirleyerek geleceğe yapılacak yatırımların verimliliğini güvence altına alır. Yordama geçerliğinde tahmin edilecek ölçütün bazı özelliklere sahip olması gerekir: Ölçüt; test ile ilgili olmalıdır, uzun süre değişmeyen bir yapıda olmalıdır, testin ve ölçütün uygulanacağı gruptaki kişi sayısı fazla olmalıdır. Testlerin, gelecekteki başarıyı önceden tahmin edip etmediğini bulmak, seçme testlerinin yordama geçerliği hakkında bilgi edinmek anlamına gelir. Uygulanan test ile daha sonradan ortaya çıkacak tahmin puanları arasında korelasyon kurularak yorum yapılır. Eğer seçme amacıyla kullandığımız test ile ileride ortaya çıkacak performans ya da puanlar arasındaki korelasyon yüksek çıkarsa testin yordama geçerliğinin yüksek olduğu kararı verilir.

Uygunluk geçerliliği yeni geliştirilen bir testin geçerliğini belirleyebilmek için testin, aynı özelliği ölçen fakat geçerli olduğu bilinen başka bir testle aynı sonuçları verme derecesidir.

Çoğu zaman ölçme araçları aralarında belirli ilişkilerin olduğu ögelerin oluşturduğu yapıları ölçmeye çalışır. Araştırmacı ya da testi geliştiren, ölçmek istediği özelliğin gerçek yaşamdaki örgütlenişini ve ölçmek istediği özelliği oluşturan yapılar arasındaki ilişkilerin benzerini, geliştirdiği testten elde ettiği puanlar arasında da görmek ister. Eğer tasarladığı ilişkiler, testten elde edilen puanlar arasında da söz konusuysa ölçeğin yapı geçerliliği için kanıt sağlanmış sayılır. Yapı geçerliliği için kanıt arama süreci çoğunlukla faktör analizi yöntemiyle yapılır.

Faktör analizi; maddeler arası korelasyonların incelenerek beklenildiği gibi gruplanıp gruplanmadığının incelenmesi olarak tanımlanır. Maddeler arası korelasyonlar beklenen gruplaşmaya yaklaştıkça yapı geçerliliğinin yüksek olduğu söylenebilir. Ayırt edicilik test yöntemi de yapı geçerliğini belirlemede kullanılır. Testin ölçülmek istenen özelliğe sahip olanlarla olmayanları ayırt etme derecesine bakılır. Testi Cevaplayanlarla (Öğrencilerle) Görüşme yöntemi ile de yapı geçerliliği belirlenirken testin uygulandığı öğrencilere her bir soruyu hangi bilgilerini kullanarak çözdükleri sorulur.

Aynı zamanda ayırt edicilik testi ve cevaplayıcılarla görüşme yöntemleri de yapı geçerliliğini belirlemek amacıyla kullanılmaktadır. Görünüş geçerliliği bir testin ölçülmek istenen özelliği ölçüyormuş gibi görünme derecesidir. Bu geçerlilik daha çok testin isimlendirilmesi, sorularının ölçülmek istenen özelliğe dair ipucu vermesi ile ilgilidir.

Bir testin geçerliğini artırmak için yapılması gerekenler: Testteki soruların eğitim programına ya da işlenen konu ve hedef davranışlara uygun olarak hazırlanması, güvenirliğe ilişkin olumlu çalışımalar yapılması, testte yer alan her bir sorunun tek bir davranışa yönelik olmasını sağlanması, sınav uygulaması sırasında kopya davranışının engellenmesidir.

Güvenirlilik

Bir ölçme aracının hatadan arınık ölçme yapabilme derecesi o ölçme aracının güvenilirliğine ilişkin bilgi verir. Güvenilirlik bir ölçme aracının tekrar uygulandığında aynı sonucu verebilme derecesidir. Bir ölçme aracının sonuçlarına pek çok yerden hata karışabilir. Hata ölçmenin yapıldığı ortamdan, ölçme işlemini gerçekleştirmek için geliştirilmiş olan ölçekten ya da ölçme işlemini yapan kişiden kaynaklanabilir. Bir ölçeğe ait güvenilirlik kanıtları:

Kararlılık
Eş değerlik
İç tutarlılık
Ölçmenin standart hatası yöntemleri ile sağlanır.

Güvenilirliğin derecesi tekrarlı ölçümle belirlenebilir. Eğer testin tümü tekrar uygulanıyorsa bu yöntem test tekrar test yöntemi olarak bilinir. Test-tekrar test yöntemi testin bir zaman aralığında kararını değiştirip değiştirmediği ile ilgilenir. Bu nedenle yöntem güvenilirliğin kararlılık cinsinden ifadesi olarak bilinir. Testin aynısını bir kez daha kullanmak mümkün değilse çok benzeri uygulanarak tekrarlı ölçüm elde edilir. Bu yöntemle güvenirlik belirleme eşdeğerlik olarak bilinir. Testin bütün olarak tekrarlanması mümkün değilse bir test birbirine denk olacak şekilde iki parçaya ayrılır ve bu parçalar birbirinin tekrarı gibi düşünülür. Bu yöntem iki yarı yöntemi olarak bilinir ve testin iç tutarlılık anlamında güvenirliğini verir. Testteki her maddeyi ilk maddenin tekrarı gibi düşünerek tüm maddeleri tekrarlı ölçü kabul etmek ise KR20 yöntemi olarak bilinir. Bu yöntem de maddelerin birbirleriyle uyumunu incelediğinden iç tutarlılık yöntemi olarak bilinir. Her ölçme aracının bir miktar hatası bulunur. Bu hata yönü bilinmeksizin hesaplanıp bir dağılım olarak puanların yorumunu etkileyebilir. Bu hatanın dağılımının bir standart sapmalık bölümüne standart hata adı verilir. Standart Hata Ölçmenin standart hatası diğer yöntemlere kıyasla kısmen karışık bir yöntemdir. İstatistiksel işlemler daha çok kullanılır.

Güvenilirliğin kararlılık, eş değerlik, iç tutarlılık ve standart hataya ek olarak objektiflik ve duyarlılık olmak üzere iki anlamlı daha vardır. Bir testin tarafsız, nesnel puanlanabilmesi objektiflik olarak bilinir. Testin objektifliği arttıkça güvenilirliği yükselir. Bir diğer anlam duyarlılıktır. Ölçme aracının birimlerinin küçüklüğü duyarlılığın artması anlamına gelir. Duyarlılık arttığında güvenirlik artar.

Güvenirliği testin dil olarak anlaşılırlığı, soru sayısı, soruların zorluk düzeyi, grubun heterojenliği, kopya, şans başarısı, testin süresi ve uygulama koşulları etkiler. Testin dil olarak anlaşılırlık derecesi, soru sayısı, soruların güçlük derecesi, testin uygulandığı grubun homojenlik derecesi, şans başarısına izin verilip verilmediği, test uygulaması sırasında kopya çekilip çekilmediği, test uygulaması için verilen süre, testin bir yönergesinin bulunup bulunmadığı ve test uygulamasının test yapmaya uygunluk derecesi güvenirliği etkileyen faktörlerdir.

Geçerlilik ve güvenilirlik ölçmenin temel gereklilikleridir ve bu ikisi arasında hem mantıksal hem de matematiksel bağlantı oldukça yüksektir. Geçerlilik, güvenilirlik için bir ön koşuldur. Geçerlilikle güvenilirlik arasındaki matematiksel bağıntı, geçerliliğin en fazla güvenilirliğin karekökü kadar olabileceği şeklinde ifade edilir. Bu durum geçerliliğin güvenilirlik tarafından sınırlandığını gösterir.

Kullanışlılık

Kullanışlılık, bir ölçme aracının kısa zamanda fazla para harcanmadan ve çok yorucu olmadan hazırlanabilmesi ve uygulanabilmesidir. Bir ölçme aracının kullanışlı olması için bazı faktörlere göre düzenlenmesi gerekir: Ölçme aracı, maliyet, okulun olanakları, öğrenci profili vb. özellikler göz önünde bulundurularak seçilmeli ve ekonomik olması sağlanmalıdır. Bir testteki soru sayısının az olması testin kullanışlılığını artırır. Hazırlanma süresi kısa olan testlerin kullanılması uygulayıcıya zaman bakımından tasarruf sağlar. Eğer bir test kısa zamanda uygulanabiliyorsa bu test kullanışlıdır. Ölçme araçlarının bir kısmı hazırlayıcı ve uygulayıcıda uzmanlık gerektirir. Uzman olmayan bir öğretmenin hazırladığı ölçme aracının güvenirliği ve geçerliğinin düşük olması beklenir. Fakat eğer bir ölçme aracı hazırlanırken uzmanlık o test kullanışlıdır. Testte bir yönergenin olması ve uygulamada sorun çıkacak durumların ortadan kaldırılması testin kullanışlılığını artırır. Kolay bir şekilde puanlanan bir test kullanışlıdır. Kullanışlılık güvenirlik ve geçerlilik ile negatif yönde ilişki içindedir. Soru sayısı azaltıldığında testin kullanışlılığı artmaktadır fakat güvenirlik ve geçerlilik düşmektedir. Bu nedenle kullanışlılığın derecesi güvenirlik ve geçerlilik ile kıyaslanarak belirlenmelidir. Bir testin kullanışlılığı güvenilirlik ve geçerliliğe rağmen arttırılmaya çalışılmamalıdır.