4 rozdíly mezi spolehlivostí a platností (ve vědě)
Protože v hovorovém jazyce mají velmi podobné významy, je snadné zaměnit termíny spolehlivosti a platnosti, když hovoříme o vědě a konkrétně o psychometrii..
Tímto textem zamýšlíme objasnit velké rozdíly mezi spolehlivostí a platností. Doufejme, že je užitečné objasnit tuto běžnou pochybnost.
- Související článek: "Psychometrics: studium lidské mysli prostřednictvím dat"
Co je to spolehlivost?
V psychometrii je pojem "spolehlivost". odkazuje na přesnost nástroje; Konkrétně, koeficienty spolehlivosti nás informují o konzistenci a stabilitě opatření přijatých s tímto nástrojem.
Čím vyšší je spolehlivost nástroje, tím nižší je množství náhodných a nepředvídatelných chyb, které se objeví při jeho použití k měření určitých atributů. Spolehlivost vylučuje předvídatelné chyby, tj. Ty, které podléhají experimentální kontrole.
Podle klasické teorie testů je spolehlivost poměr rozptylu, který je vysvětlen skutečnými skóre. Přímé skóre v testu by se tedy skládalo ze součtu náhodných chyb a skutečného skóre.
Dvě hlavní složky spolehlivosti jedná se o dočasnou stabilitu a vnitřní konzistenci. První koncept ukazuje, že se skóre mění při měření při různých příležitostech, zatímco vnitřní soudržnost se týká míry, do které položky, které tvoří test, měří stejný psychologický konstrukt..
Vysoký koeficient spolehlivosti tedy ukazuje, že skóre na testu kolísá málo interně a jako funkce času a v souhrnu to znamená, že přístroj chybí chyby měření.
- Možná vás zajímá: "Typy psychologických testů: jejich funkce a charakteristiky"
Definice platnosti
Když mluvíme o platnosti, odkazujeme na to, zda test správně měří konstrukci, kterou zamýšlí měřit. Tento pojem je definován jako vztah mezi skóre získaným v testu a dalším souvisejícím opatřením; stupeň lineární korelace mezi oběma prvky určuje koeficient platnosti.
Také ve vědeckém výzkumu vysoká validita udává míru, do jaké mohou být výsledky získané s daným nástrojem nebo ve studii zobecněny.
Existují různé typy platnosti, které závisí na způsobu, jakým jsou vypočteny; toto dělá to termín s velmi odlišnými významy. V zásadě můžeme rozlišovat mezi platnosti obsahu, kritéria (nebo empirické) platnosti a konstrukce platnosti.
Platnost obsahu definuje, do jaké míry jsou položky psychometrického testu reprezentativní vzorek prvků, které tvoří konstrukt, který má být hodnocen. Přístroj musí obsahovat všechny základní aspekty konstruktu; Pokud například chceme provést přiměřený test pro měření deprese, musíme nutně zahrnout položky, které hodnotí stav mysli a pokles potěšení..
Platnost kritéria měří schopnost nástroje předvídat aspekty týkající se zvláštnosti nebo oblasti zájmu. Nakonec je zamýšlena platnost konstrukce Zjistěte, zda test měří, co chcete měřit, například z konvergence s výsledky získanými v podobných testech.
Rozdíly mezi spolehlivostí a platností
Ačkoli tyto dvě psychometrické vlastnosti jsou úzce příbuzné, pravdou je, že odkazují na jasně diferencované aspekty. Podívejme se, jaké jsou tyto rozdíly.
1. Předmět analýzy
Spolehlivost je charakteristikou nástroje v tom smyslu, že měří vlastnosti položek, které jej obsahují. Na druhé straně, platnost se nevztahuje přesně na nástroj, ale zobecnění, která jsou výsledkem těchto výsledků prostřednictvím tohoto.
2. Poskytované informace
Ačkoli je to poněkud zjednodušující způsob, jak se k němu přiblížit, obvykle se uvádí, že platnost indikuje, že psychometrický nástroj skutečně měří konstrukci, kterou zamýšlí měřit, zatímco spolehlivost se týká toho, zda ji správně měří, bez chyb.
3. Způsob výpočtu
Pro měření spolehlivosti jsou v zásadě používány tři postupy: metoda dvou polovin, jedna z paralelních forem a test-retest. Nejpoužívanější je postup dvou polovin, ve kterých jsou položky po zodpovězení testu rozděleny do dvou skupin; pak je analyzována korelace mezi oběma polovinami.
Metoda paralelních nebo alternativních forem spočívá ve vytvoření dvou ekvivalentních testů, které měří, do jaké míry korelují položky mezi nimi. Test-retest je jednoduše založen na absolvování zkoušky dvakrát, za podmínek co nejpodobnějších. Oba postupy mohou být kombinovány, což vede k opakování testu s paralelními formami, který spočívá v ponechání časového intervalu mezi první formou zkoušky a druhou zkouškou..
Na druhé straně platnost počítá se různými způsoby v závislosti na typu, ale obecně jsou všechny metody založeny na srovnání mezi skóre v objektivním testu a ostatními údaji stejných subjektů ve vztahu k podobným rysům; cílem je, aby zkouška mohla fungovat jako prediktor rysu.
Mezi metodami použitelnými pro hodnocení platnosti nalezneme faktorovou analýzu a metodu multi-traitových matic. Platnost obsahu je také často určována racionálními, nestatistickými analýzami; zahrnuje například zdánlivou platnost, která odkazuje na subjektivní úsudek odborníků ohledně platnosti zkoušky.
4. Vztah mezi oběma pojmy
Spolehlivost psychometrického nástroje ovlivňuje jeho platnost: čím spolehlivější je, tím větší je jeho platnost. Proto jsou koeficienty platnosti nástroje vždy nižší než koeficienty spolehlivosti a platnost nás nepřímo informuje o spolehlivosti.