Klasik test teorisi
Bir test bir bilimsel araç neyi amaçladığını ölçtüğü ölçüde, yani geçerli ve iyi ölçüyor, yani kesin veya güvenilir. Sağladıkları önlemlere güvenemeyeceğimiz bir araç bulursak, aynı nesneyi ölçtüğümüz zaman zaman değiştiği için güvenilir olmadığını söyleyeceğiz. Ölçmek için bir araç doğru Bir şey kesin olmalı, çünkü aksi halde ölçtüğün şeyi ölç, yanlış ölç. Bu nedenle, kesin olmak gerekli ancak yeterli olmayan bir durumdur. Ek olarak, geçerli olması gerekir, yani, doğru olarak ölçtüğü şey ölçmek istediği şeydir, başka hiçbir şey olmaz.
Ayrıca ilginizi çekebilir: Öğe Tepkisi Teorisi - Uygulamalar ve Testgüvenilirlik:
Mutlak ve göreceli güvenilirlik: Bir testin güvenilirliği problemini iki farklı yolla ele alabiliriz;.
Ölçümlerinin yanlışlığı olarak güvenilirlik: Bir denek teste cevap verdiğinde, hatadan etkilenen deneysel bir puan alır. Hata olmasaydı, konu gerçek puanı alırdı. Test kesin değildir çünkü deneysel puan gerçek puanla eşleşmemektedir. Her iki puan arasındaki bu fark, örnekleme hatası, ölçüm hatasıdır. tipik ölçüm hatası olacak ölçüm hatalarının standart sapması. tipik ölçüm hatası Testin mutlak hassasiyetini gösterir, çünkü elde edilen ölçüm ile elde edilen ölçüm arasındaki farkın tahmin edilmesine izin vermez,.
Ölçümlerin stabilitesi olarak güvenilirlik: Bir test, güvenilir olduğu zaman tekrarlandığında verdiği sonuçlar ne kadar sabit veya sabit olursa o kadar güvenilir olacaktır. Sonuçlar iki durumda ne kadar istikrarlı olursa, aralarındaki korelasyon o kadar artar. Bu korelasyon denir güvenilirlik katsayısı. Bu bizi hata miktarını değil, testin kendisiyle tutarlılığını ve sunduğu bilginin tutarlılığını ifade eder. güvenilirlik katsayısı Testin göreceli güvenilirliğini ifade eder.
Güvenilirlik katsayısı ve güvenilirlik endeksi: - Güvenilirlik katsayısı bir testin testin kendisiyle ilişkisi, örneğin iki paralel biçimde elde edilmesidir: rxx. - Hassas endeksi Testin ampirik puanları ile gerçek puanları arasındaki korelasyondur: rxv Kesinlik endeksi her zaman güvenilirlik katsayısından daha büyük olacaktır, güvenilirlik katsayısını bulmak için bu üç klasik yöntem vurgulanmaya değerdir:
- Test ile tekrarı arasındaki ilişkiyi bulun: Tekrarlama ya da test-tekrar test yöntemi: Aynı testi iki gruba aynı gruba uygulamak ve iki puan dizisi arasındaki korelasyonu hesaplamaktan ibarettir. Bu korelasyon güvenilirlik katsayısıdır. Bu yöntem genellikle diğer prosedürlerle elde edilenlerden daha yüksek bir güvenilirlik katsayısı verir ve rahatsız edici faktörlerle kontamine olabilir.
- Testin iki paralel formu arasındaki korelasyonu bulun: Paralel formların yöntemi: Aynı testin iki paralel formunu, yani aynı bilgiyi veren iki eşdeğer formu hazırlayın ve aynı konu grubuna uygulayın. İki form arasındaki korelasyon güvenilirlik katsayısıdır. Bu yöntemle aynı testi tekrarlayarak rahatsız edici tekrar test güvenilirliği kaynaklarından kaçınılır..
- Testin iki paralel yarısı arasındaki korelasyonu bulun: İki yarımın metodu: Test iki denk yarıya bölünür ve aralarındaki korelasyon bulunur. Tercih edilen bir yöntemdir, çünkü basittir ve önceki prosedürlerin sınırlamalarını göz ardı eder. Testin tuhaf unsurlarını, yarısını oluşturmak için ve diğerini oluşturmak için eşit elemanları seçebilirsiniz..
Güvenilirlik katsayısı ve paralel testler arasındaki korelasyon
güvenilirlik katsayısı Bir testin gerçek varyansın ampirik varyansa oranını gösterir: gráfico33 Bir testin güvenilirlik katsayısı 0 ile 1 arasında değişir. Örneğin: iki paralel test arasındaki korelasyon rxx ise´ = 0.80, testin varyansının% 80'inin gerçek ölçümden kaynaklandığı ve geri kalanının, testin varyansının% 20'sinin hatadan kaynaklandığı anlamına gelir. güvenilirlik endeksi Testin ampirik puanları ile gerçek puanları arasındaki korelasyondur. Güvenilirlik endeksi = Güvenilirlik endeksi güvenilirlik katsayısının kareköküne eşittir
Bir testin iki paralel şekli geliştirildikten sonra, varyansların homojenliğini ve önlemler arasındaki farkı kontrol etmek için varyans analizi prosedürü uygulanır. Varyanslar homojen ise, araçlar arasındaki fark anlamlı değildir ve iki form aynı tipte ve aynı tipte ve psikolojik içerikli elementlerle oluşturulmuşsa, paralel oldukları söylenebilir. Olmazsa, olmadıkça onları düzeltmelisin. Güvenilirlik eksikliği rxx değeri ile tanımlanır´= 0 4.- Tipik ölçüm hatası: Ampirik ile gerçek puan arasındaki fark ölçüm hatası olarak adlandırılan rastgele hatadır. Ölçüm hatalarının standart sapması tipik ölçüm hatası olarak adlandırılır. tipik ölçüm hatası Testin mutlak güvenilirliği hakkında tahminler yapılmasına izin verir, yani, ölçüm hatasının bir puanı ne kadar etkilediğini tahmin etmek.
Güvenilirlik ve uzunluk: Testin uzunluğu elementlerin sayısını ifade eder. Güvenilirlik bu uzunluğa bağlıdır. Eğer bir test üç unsurdan oluşuyorsa, bir denek bir keresinde 1, diğerinde veya paralel bir şekilde bir puan alabilir.
Bir durumdan diğerine, puan bir puan değişmiştir; üçün üzerindeki bir nokta,% 33'lük bir varyasyondur, yüksek bir varyasyondur. Eğer denekler bu tip rastgele değişimler elde ederse, testin kendisiyle veya testin iki paralel şekli ile korelasyonu büyük ölçüde azalacak ve yüksek olamaz. Test çok daha uzunsa, örneğin 100 öğeniz varsa, bir konu bir defada 70 puan ve paralel olarak 67 puan alabilir. Birinden diğerine 3 puan değişti; toplam teste göre, özellikle% 3 olan nispeten küçük bir farktır. Bir formdan paralele geçerken deneklerin puanlarında meydana gelen bu büyüklükteki bu küçük gündelik değişimler göreceli olarak önemsizdir ve her ikisi arasındaki korelasyondan önceki kadar azalmayacaktır..
Güvenilirlik katsayısı önceki durumdan çok daha yüksek olacaktır. Spearman-Brown denklemi güvenilirlik ve uzunluk arasındaki ilişkiyi ifade eder. Bir testin kesinliği, uzunluk 0 olduğunda sıfırdır ve uzunluk arttıkça artar. Artış, göreceli olarak daha küçük olmasına rağmen, parçanın uzunluğu daha büyüktür. Bu, hassasiyetin başlangıçta çok, daha az göreceli olarak büyüdüğü anlamına gelir. Uzunluk sonsuzluğa meyilli olduğunda, güvenilirlik katsayısı eğilimindedir
Bir testin uzunluğunu artırarak, doğruluğu artar çünkü gerçek sapmayı hata farkından daha yüksek bir oranda arttırır. Bu, testin doğruluğunun artacağı anlamına gelir çünkü hataya bağlı varyans oranı azalır. Flangon ve Guttman formüllerinin yanı sıra Rulon formülü, iki yarı yöntemin yöntemiyle güvenilirlik katsayısı hesaplanırken özellikle uygulanabilir. Bunlar güvenilirlik katsayısını hesaplamak için kullanılan formüllerdir..
Güvenilirlik ve tutarlılık: Güvenilirlik katsayısı başka bir şekilde de bulunabilir, buna sözde alfa katsayısı veya genelleştirilebilirlik veya temsil edilebilirlik katsayısı (Cronbach). Bu alfa katsayısı, bazı öğelerin kişiliğin veya davranışın bir yönünü ölçtüğü doğruluğu gösterir. Şunlar olarak yorumlanabilir: Belli bir açıdan tüm olası öğelerin ortalama korelasyonunun bir tahmini. Testin tutarlılığına veya iç tutarlılığına (test elemanları ne ölçüde ölçtüğü, elementleri arasındaki ilişki) ve uzunluğuna göre testin doğruluğunun bir ölçüsüdür. Testin temsil edilebilirliğini belirtmek, yani onu oluşturan maddeleri örneklemenin, aynı türden muhtemel maddelerin popülasyonunu ve psikolojik içeriği temsil etmesidir. alfa katsayısı temel olarak bir testin kesinliğinde iki temel kavramı yansıtır: 1. Elementleri arasındaki ilişki: hepsinin aynı şeyi ne ölçüde ölçtüğü.
Testin uzunluğu: bir numunenin vakalarının sayısını arttırırken ve sistematik hatalar ortadan kaldırılırsa, numune popülasyonu çıkarıldığından daha iyi temsil eder ve kazara hatanın olması daha olası değildir. Testin öğeleri ikilik ise (evet veya hayır, 1 veya 0, anlaşma veya anlaşmazlık, vb.) İse, alfa katsayısının denklemi sadeleştirilir ve denklemlerin ortaya çıkması sağlanır. Kuder-Richardson (KR20 ve KR21). Belirli sayıda maddeye bakıldığında, bir test daha homojen olduğunda daha güvenilir olacaktır. Alfa katsayısı, bir test öğesinin homojenliğini ve tutarlılığını veya dahili tutarlılığını temsil ettiği için bize güvenilirliği söyler..
Standartlar ve güvenilirlik kriterleri
Maddelerin örnek uzayının modeline göre, testin amacı, örnek uzaydaki tüm maddeler kullanıldığında elde edilecek ölçümü tahmin etmektir. Bu ölçüm, gerçek ölçümlerin yaklaşık veya az olduğu yaklaşık gerçek puan olacaktır. Bir örnek öğesinin gerçek puanlarla ne derece ilişkili olduğuna bağlı olarak, test az çok güvenilirdir. Bu modelde, örnek uzayındaki tüm maddeler arasındaki korelasyon matrisi merkezidir.Bu örnek model iç tutarlılık konusunda daha doğrudan ısrar eder ve elde ettiği sürece dolaylı olarak kararlılığı garanti eder..
Paralel testlerin doğrusal modeli, puanların istikrarı konusunda daha fazla ısrar eder ve istikrarı sağladığı ölçüde dolaylı olarak iç tutarlılığı desteklemektedir. Bireysel teşhis ve tahminler oluşturmak için bir test uygularsak, güvenilirlik katsayısı 0,90 olmalıdır. Tahminlerde ve toplu sınıflandırmalarda, 0'90'dan 0'80'e kadar kurtulmanın uygun olmamasına rağmen, gereklilik çok fazla değildir..
Bazen, kişilik testleri gibi belirli test türlerinde, 0,70'den fazla katsayılara ulaşmak zordur. Paralel formlar veya paralel yarımlar, az çok geniş bir aralıktan sonra uygulanırsa, gündelik hatalar alfa katsayısını etkileyenlerden çok daha fazla olabilir. Bunun nedeni, korelasyonu azaltan şeyin yalnızca teste özgü rastgele hatalar değil, aynı zamanda alfa katsayısını hesaba katan ve aynı zamanda iki farklı durumdan gelebilecek tüm hataları da etkileyen tek bir olaydır. , sayısız ayrıntıda farklı olabilir. Bu nedenle, alfa katsayısı genellikle diğer katsayılardan daha büyüktür..
Aynı testi tekrarlayarak bulduğu katsayı dışında, ilk uygulamanın rastgele hatalarının ikinci sırada tekrarlanması ve ikisi arasındaki korelasyonun azaltılması yerine, arttırılması olasılığı daha fazladır. İkinci uygulamanın birinciden tamamen bağımsız olması sağlanmalıdır. Bunu başarırsak, bu en kolay ve en ucuz yöntem olacak ve özellikle uzun süreler boyunca ve karmaşık testlerle puanların stabilitesini takdir etmeye çalışırken tavsiye edilir. > İleri: Testlerin geçerliliği
Bu makale tamamen bilgilendiricidir, Çevrimiçi Psikoloji bölümünde, teşhis koyacak veya tedavi önerecek fakültemiz yoktur. Sizi, davanızı özellikle tedavi etmek için bir psikoloğa gitmeye davet ediyoruz..
Benzer makaleleri okumak isterseniz Klasik test teorisi, Deneysel Psikoloji kategorimize girmenizi tavsiye ederiz..