Teorie klasických testů

Teorie klasických testů / Experimentální psychologie

Test je vědeckého nástroje v rozsahu, v jakém měří to, co zamýšlí, to znamená, že je platné, a to dobře, to znamená, že je přesné nebo spolehlivé. Pokud najdeme nástroj, kterému nemůžeme důvěřovat opatření, která poskytují, protože se čas od času mění, když měříme stejný objekt, pak řekneme, že to není spolehlivé. Přístroj k měření řádně něco, to musí být přesné, protože jinak, změřte, co měříte, změřte to špatně. Proto je přesnost nutnou, ale ne dostatečnou podmínkou. Kromě toho musí být platné, to znamená, že přesně to bude měřit, a nic jiného.

Také by vás mohlo zajímat: Položka Odpověď Teorie - Aplikace a Test

Spolehlivost:

Absolutní a relativní spolehlivost: Problém spolehlivosti testu můžeme řešit dvěma různými způsoby, i když v pozadí se shodují..

Spolehlivost jako nepřesnost měření: Když subjekt reaguje na test, získá empirické skóre, které je ovlivněno chybou. Pokud by nedošlo k chybě, subjekt by získal své skutečné skóre. Test je nepřesný, protože empirické skóre neodpovídá skutečnému skutečnému skóre. Tento rozdíl mezi oběma skóre je vzorkovací chyba, chyba měření. typická chyba měření bude standardní odchylka chyb měření. typická chyba měření označuje absolutní přesnost zkoušky, protože umožňuje odhadnout rozdíl mezi získaným měřením a měřením, které by bylo možné získat, kdyby nedošlo k chybě..

Spolehlivost jako stabilita měření: Zkouška bude spolehlivější, tím více bude konstantní nebo stabilní výsledky, které poskytuje při opakování. Čím stabilnější výsledky jsou ve dvou případech, tím větší je vzájemná korelace. Tato korelace se nazývá koeficient spolehlivosti. To nás vyjadřuje, nikoli množství chyby, ale soudržnost testu se sebou samým a stálost informací, které nabízí. koeficient spolehlivosti vyjadřuje relativní spolehlivost zkoušky.

Koeficient spolehlivosti a index spolehlivosti: - Koeficient spolehlivosti testu je korelace zkoušky se sebou samým, například ve dvou paralelních formách: rxx. - Index přesnosti je korelace mezi empirickými výsledky testu a jeho skutečnými hodnotami: rxv Index přesnosti bude vždy větší než koeficient spolehlivosti Pro zjištění koeficientu spolehlivosti stojí za to zdůraznit tyto tři klasické metody:

  • Najděte korelaci mezi testem a jeho opakováním: Metoda opakování nebo metoda opakování testu: spočívá v aplikaci stejného testu na stejnou skupinu ve dvou případech a vypočte se korelace mezi dvěma sériemi skóre. Tato korelace je koeficient spolehlivosti. Tato metoda obvykle poskytuje vyšší koeficient spolehlivosti než koeficienty získané jinými postupy a může být kontaminována rušivými faktory.
  • Najděte korelaci mezi dvěma paralelními formami testu: Metoda paralelních forem: Připravte dvě paralelní formy stejného testu, tj. Dvě rovnocenné formy, které poskytují stejné informace, a platí pro stejnou skupinu subjektů. Korelace mezi oběma formami je koeficient spolehlivosti. Při této metodě se tím, že se neopakuje stejný test, vyhnou rušivým zdrojům spolehlivosti opakovaného testu.
  • Najděte korelaci mezi dvěma paralelními polovinami zkoušky: Metoda dvou polovin: Test je rozdělen do dvou ekvivalentních polovin a je zjištěna korelace mezi nimi. Je to výhodnější metoda, protože je jednoduchá a ignoruje omezení předchozích postupů. Můžete si vybrat liché prvky testu, tvořit jednu polovinu, a sudé prvky tvoří druhou.

Koeficient spolehlivosti a korelace mezi paralelními testy

koeficient spolehlivosti testu ukazuje poměr, v jakém je skutečná rozptyl empirické odchylky: graphic33 Koeficient spolehlivosti zkoušky se pohybuje mezi 0 a 1. Například: pokud je korelace mezi dvěma paralelními testy rxx´ = 0,80, to znamená, že 80% rozptylu testu je způsobeno skutečným měřením a zbytek, tj. 20% rozptylu testu je způsoben chybou. index spolehlivosti testu je korelace mezi jeho empirickými skóre a jeho skutečným indexem spolehlivosti = index spolehlivosti se rovná druhé odmocnině koeficientu spolehlivosti

Jakmile byly vyvinuty dvě paralelní formy testu, použije se postup analýzy rozptylu ke kontrole homogenity odchylek a rozdílu mezi opatřeními. Pokud jsou odchylky homogenní, rozdíl mezi prostředky není významný a obě formy jsou konstruovány se stejným počtem prvků stejného typu a psychologického obsahu, lze říci, že jsou paralelní. Pokud ne, musíte je reformovat, dokud nebudou. Nedostatek spolehlivosti je identifikován s hodnotou rxx´= 0 4.- Typická chyba měření: Rozdíl mezi empirickým a reálným skóre je náhodná chyba, nazývaná chyba měření. Standardní odchylka chyb měření se nazývá typická chyba měření. typická chyba měření umožňuje provádět odhady absolutní spolehlivosti testu, tj. odhadnout, kolik chyby měření ovlivňuje skóre.

Spolehlivost a délka: Délka zkoušky se týká počtu jejích prvků. Spolehlivost závisí na této délce. Pokud se test skládá ze tří prvků, může subjekt jednou získat skóre 1 a v jiném, nebo paralelním způsobem, skóre

Od jedné příležitosti k druhé se skóre lišilo o jeden bod; bod nad tři je variace 33%, vysoká variace. Pokud subjekty získají náhodné variace tohoto typu, korelace testu se samotným nebo se dvěma paralelními formami testu bude značně snížena a nemůže být vysoká. Pokud je test mnohem delší, pokud máte například 100 položek, předmět může získat 70 bodů při jedné příležitosti a 67 paralelně. Z jednoho do druhého se změnilo 3 body; je to relativně malá odchylka ve vztahu k celkovému testu, konkrétně 3%. Tyto malé příležitostné změny této velikosti, které se vyskytují v bodech subjektů, když se pohybují z jedné formy na paralelní, jsou relativně nedůležité a nezmenší se tak, jako dříve než korelace mezi oběma způsoby..

Koeficient spolehlivosti bude mnohem vyšší než v předchozím případě. Rovnice Spearman-Brown vyjadřuje vztah mezi spolehlivostí a délkou. Přesnost testu je nulová, když je délka 0, a zvyšuje se s rostoucí délkou. I když je nárůst relativně menší, protože jeho délka je větší. To znamená, že přesnost roste hodně na začátku a relativně méně později. Když má délka sklon k nekonečnu, koeficient spolehlivosti má tendenci

Zvýšením délky testu se jeho přesnost zvyšuje, protože zvyšuje skutečnou rozptyl v míře vyšší, než je odchylka chyb. To znamená, že přesnost testu se zvyšuje, protože podíl odchylky způsobený chybou klesá. Vzorec Rulonu, stejně jako vzorec Flanagan a Guttman, jsou zvláště použitelné při výpočtu koeficientu spolehlivosti metodou dvou polovin. Jedná se o vzorce, které se používají pro výpočet koeficientu spolehlivosti.

Spolehlivost a konzistence: Součinitel spolehlivosti lze nalézt i jiným způsobem, je to tzv. Tzv koeficient alfa o koeficient zobecnění nebo reprezentativnost (Cronbach). Tento koeficient alfa udává přesnost, s jakou některé položky měří aspekt osobnosti nebo chování. Lze ji interpretovat jako: odhad průměrné korelace všech možných položek v určitém aspektu. Míra přesnosti zkoušky podle její soudržnosti nebo vnitřní konzistence (vzájemný vztah mezi jejími prvky, do jaké míry testovací prvky měří všechny) a jejich délky. Označení reprezentativnosti testu, tj. Množství, ve kterém vzorek položek, které ho tvoří, reprezentuje populaci možných položek stejného typu a psychologického obsahu. koeficient alfa odráží především dva základní pojmy v přesnosti testu: 1. Vzájemný vztah mezi jeho prvky: rozsah, v jakém všichni měří totéž.

Délka zkoušky: při zvětšování počtu případů vzorku a při odstranění systematických chyb vzorek představuje lepší populaci než je extrahována a je nepravděpodobné, že se jedná o náhodnou chybu. Pokud jsou položky zkoušky dichotomické (ano nebo ne, 1 nebo 0, dohoda nebo nesouhlas atd.), Je rovnice koeficientu alfa zjednodušena, což vede k rovnicím Kuder-Richardson (KR20 a KR21). Vzhledem k určitému počtu položek bude test spolehlivější, pokud bude homogennější. Alfa koeficient nám říká spolehlivost, protože představuje homogenitu a konzistenci nebo vnitřní konzistenci prvků testu.

Normy a kritéria spolehlivosti

Podle modelu vzorového prostoru položek je cílem testu odhadnout opatření, které by bylo dosaženo, kdyby byly použity všechny položky v prostoru vzorku. Toto měřítko by bylo skutečným skóre, ke kterému se reálná měření přibližují více či méně. V závislosti na míře, s jakou vzorek položek koreluje se skutečnými skóre, je test více či méně spolehlivý. V tomto modelu je centrální matice korelací mezi všemi položkami v prostoru pro výběr vzorku, která je přímo závislá na vnitřní konzistenci a pokud ji dosahuje, nepřímo zaručuje stabilitu..

Lineární model paralelních testů trvá více na stabilitě skóre a do té míry, že dosahuje stability, nepřímo podporuje vnitřní konzistenci. Pokud použijeme test pro stanovení jednotlivých diagnóz a prognóz, koeficient spolehlivosti by měl být 0,90 nahoru. V prognózách a kolektivních klasifikacích to není ani tak požadavek, i když není vhodné dostat se daleko od 0'90 do 0'80.

V některých typech testů, jako jsou testy osobnosti, je někdy obtížné dosáhnout koeficientů větších než 0,70. Jsou-li paralelní formy nebo paralelní poloviny aplikovány po více nebo méně velkém intervalu, mohou být běžné chyby četnější než chyby, které ovlivňují koeficient alfa. Je to tak proto, že to, co snižuje korelaci, jsou nejen náhodné chyby, které jsou vlastní zkoušce, ale také jednorázové chyby, které zohledňují koeficient alfa, ale také ovlivňují všechny chyby, které mohou pocházet ze dvou různých situací. , které se mohou lišit v mnoha detailech. Proto je koeficient alfa obvykle větší než ostatní koeficienty.

S výjimkou koeficientu nalezeného opakováním stejného testu, protože existuje větší pravděpodobnost, že se náhodné chyby první aplikace opakují ve druhém a namísto snížení korelace mezi těmito dvěma hodnotami ji zvýšíte. Je třeba zajistit, aby druhá aplikace byla zcela nezávislá na první aplikaci. Dosáhneme-li toho, bude to nejjednodušší a nejlevnější způsob, který je vhodný při snaze ocenit stabilitu partitur, zejména v dlouhých časových úsecích a při složitých testech. > Další: Platnost testů

Tento článek je čistě informativní, v online psychologii nemáme schopnost dělat diagnózu nebo doporučit léčbu. Zveme vás k návštěvě psychologa, který se bude zabývat zejména vaším případem.

Pokud chcete číst více článků podobných Teorie klasických testů, Doporučujeme Vám vstoupit do naší kategorie Experimentální psychologie.