Güvenilirlik ve geçerlilik arasındaki 4 fark (bilimde)
Konuşma dilinde çok benzer anlamlara sahip olduklarından, bilimden ve özellikle de psikometriden söz ettiğimizde güvenilirlik ve geçerlilik kavramlarını karıştırmak kolaydır..
Bu yazı ile biz açıklığa kavuşturmak niyetinde güvenilirlik ve geçerlilik arasındaki temel farklar. Umarım bu ortak şüphe netleştirmek için faydalı bulursunuz.
- İlgili makale: "Psikometri: İnsan aklını verilerle çalışmak"
Güvenilirlik nedir?
Psikometride "güvenilirlik" kavramı bir aletin doğruluğunu ifade eder; Özellikle, güvenilirlik katsayıları bize bu araçla alınan önlemlerin tutarlılığı ve istikrarı hakkında bilgi veriyor..
Bir enstrümanın güvenilirliği arttıkça, belirli özellikleri ölçmek için kullanırken ortaya çıkacak rastgele ve öngörülemeyen hataların miktarı da düşer. Güvenilirlik, öngörülebilir hataları, yani deneysel kontrole tabi olanları hariç tutar.
Klasik test teorisine göre, güvenilirlik, gerçek puanlarla açıklanan varyansın oranıdır. Böylece, bir testteki doğrudan puan, rastgele hatanın ve gerçek puanın toplamından oluşacaktır..
Güvenilirliğin iki ana bileşeni bunlar geçici istikrar ve iç tutarlılıktır. İlk kavram, farklı durumlarda ölçülen puanların çok az değiştiğini gösterirken, iç tutarlılık testi oluşturan maddelerin aynı psikolojik yapıyı ne ölçüde ölçtüğünü gösterir..
Bu nedenle, yüksek bir güvenilirlik katsayısı, bir testteki puanların dahili olarak ve zamanın bir fonksiyonu olarak küçük dalgalanma gösterdiğini ve cihazda ölçüm hataları yok.
- Belki ilginizi çeker: "Psikolojik test türleri: işlevleri ve özellikleri"
Geçerlilik tanımı
Geçerlilikten bahsettiğimizde, testin ölçmeyi amaçladığı yapıyı doğru ölçüp ölçmediğini ifade ederiz. Bu kavram olarak tanımlanır Testte elde edilen puan ile ilgili bir başka ölçüt arasındaki ilişki; Her iki eleman arasındaki doğrusal korelasyon derecesi, geçerlilik katsayısını belirler..
Ayrıca, bilimsel araştırmalarda yüksek geçerlilik, belirli bir araçla veya bir çalışmada elde edilen sonuçların ne ölçüde genelleştirilebileceğini gösterir.
Hesaplanma şekline bağlı olarak farklı geçerlilik türleri vardır; Bu, çok farklı anlamlara sahip bir terimdir. Temelde arasında ayırabiliriz içerik geçerliliği, ölçüt (veya ampirik) geçerliliği ve yapı geçerliliği.
İçerik geçerliliği, bir psikometrik testin öğelerinin ne ölçüde değerlendirilecek yapıyı oluşturan unsurların temsili bir örneği olduğunu tanımlar. Araç, yapının tüm temel yönlerini içermelidir; Örneğin, depresyonu ölçmek için yeterli bir test yapmak istiyorsak, aklın durumunu ve zevkteki düşüşü değerlendiren maddeleri mutlaka içermeliyiz..
Ölçüt geçerliliği, aracın özellik veya ilgi alanı ile ilgili hususları öngörme yeteneğini ölçer. Son olarak, yapı geçerliliği amaçlanmıştır Testin ölçmek istediğinizi ölçüp ölçmeyeceğini belirleyin., örneğin, benzer testlerde elde edilen puanlarla yakınsama.
Güvenilirlik ve geçerlilik arasındaki farklar
Bu iki psikometrik özellik birbiriyle yakından ilişkili olsa da, gerçek şu ki açıkça ayırt edilmiş yönlere işaret ediyorlar.. Bakalım bu farklar neler?.
1. Analizin amacı
Güvenilirlik, cihazın kendisini oluşturan öğelerin özelliklerini ölçmesi anlamında bir özelliğidir. Öte yandan, geçerlilik tam olarak enstrümana atıfta bulunmaz, ancak sonuçlardan yapılan genellemeler için bununla elde edildi.
2. Verdikleri bilgiler
Her ne kadar basit bir şekilde yaklaşmak için basit olsa da, geçerliliğin bir psikometrik aracın aslında ölçmek istediği yapıyı ölçtüğünü gösterirken, güvenilirliğin hatasız bir şekilde doğru ölçüp ölçmeyeceğini belirtir..
3. Hesaplanma biçimleri
Güvenilirliği ölçmek için temel olarak üç prosedür kullanılır: iki yarı yöntemi, paralel formlardan biri ve test-tekrar test. En çok kullanılan, test cevaplandıktan sonra öğelerin iki gruba ayrıldığı iki yarı prosedürüdür; daha sonra iki yarı arasındaki korelasyon analiz edilir..
Paralel veya alternatif formların yöntemi, aralarındaki maddeleri ne ölçüde ilişkilendirdiklerini ölçmek için iki eşdeğer test oluşturmaktan oluşur. Test tekrar testi, testi olabildiğince benzer koşullar altında iki kez geçmeye dayanıyor. Her iki prosedür de, testin birinci şekli ile ikincisi arasında bir zaman aralığı bırakmaktan oluşan paralel formlarla test-tekrar testine yol açarak birleştirilebilir..
Öte yandan, geçerlilik türüne bağlı olarak farklı şekillerde hesaplanır, ancak genel olarak tüm yöntemler, objektif testteki puan ile benzer özelliklere ilişkin aynı konuların diğer verileri arasındaki karşılaştırmaya dayanmaktadır; Amaç, testin özelliğin bir tahmincisi olarak hareket edebilmesidir..
Geçerliliği değerlendirmek için kullanılan yöntemler arasında faktör analizi ve çoklu yöntem çok özellikli matris tekniği bulunur. Ayrıca, içerik geçerliliği genellikle rasyonel, istatistiksel olmayan analizlerle belirlenir; örneğin, testin geçerliliği konusunda uzmanların öznel yargısını ifade eden görünür geçerliliği içerir..
4. Her iki kavram arasındaki ilişki
Bir psikometrik aracın güvenilirliği geçerliliğini etkiler: ne kadar güvenilir olursa, geçerliliği de o kadar yüksek olur. Bu nedenle, bir aletin geçerlilik katsayıları her zaman güvenilirlik katsayılarından düşüktür ve geçerlilik dolaylı olarak bize güvenilirliği bildirir..