Teorie reakce na položku - Aplikace a Test

V oblasti Teorie psychometrických testů Objevila se různá označení, která v současné době pojmenovávají „Teorie reakce na položky“ (F.M. Lord, 1980). Toto označení představuje určité rozdíly s ohledem na klasický model: 1. - vztah mezi očekávanou hodnotou skóre subjektu a rysem (charakteristika odpovědná za hodnoty) není obvykle lineární. 2.- má za cíl učinit individuální předpovědi, aniž by musela odkazovat na charakteristiky normativní skupiny.

Také by vás mohlo zajímat: Klasický test Teorie Index

Teorie reakce na položku nebo modely latentního znaku v teorii testů
Modely teorie odezvy položek (tri)
Odhad parametrů
Zkušební konstrukce
Aplikace teorie odezvy položek
Interpretace partitur

Teorie reakce na položku nebo modely latentního znaku v teorii testů

Vidíme tedy, že tato teorie reakce na položku poskytuje možnost popsat jednotlivé položky i jednotlivce samostatně; Domnívá se také, že reakce dané osoby závisí na úrovni dovedností, které jsou v daném rozmezí. Původ těchto modelů je kvůli Lazarsfeld, 1950, kdo představil termín “latentní rys” \ t .

Odtud se má za to, že každý jednotlivec má individuální parametr, který je zodpovědný za vlastnosti předmětu, také nazývaný "rys". Tato funkce není přímo měřitelná, proto se individuální parametr nazývá latentní proměnná. Při použití testů můžete získat dvě různé věci, skutečné skóre a měřítko fitness; Toho je dosaženo, pokud projdeme dva testy na stejné kondici ve stejné skupině.

V teorii latentního rysu nebo teorie odpovědi na položku Skutečné skóre je hodnota, která se očekává od pozorovaného skóre. Podle Pána je opravdové skóre a zdatnost to samé, ale vyjádřené v různých měřítcích měření.

Modely teorie odezvy položek (tri)

Modely binomických chyb: představil Pán (1965), které předpokládají, že pozorované skóre odpovídá počtu správných odpovědí získaných v testu (jejichž položky mají stejnou obtížnost a mají lokální nezávislost, tj. Pravděpodobnost odpověď na položky není ovlivněna odpověďmi na jiné položky).

Poissonovy modely: tyto modely jsou vhodné pro ty testy, které mají velký počet položek a v nichž je pravděpodobnost správné nebo nesprávné odpovědi malá. V rámci této skupiny máme zase různé modely:

Poissonian model Rasch, jehož hypotézy jsou: každý test má velký počet binárních položek, které jsou lokálně nezávislé. pravděpodobnost chyby v každé položce je malá. Pravděpodobnost, že subjekt udělá chybu, závisí na dvou věcech: obtížnosti testu a schopnosti subjektu. aditivita obtíží, chápaná jako výsledek smíchání dvou rovnocenných testů v jediném testu, jehož obtížnost je součtem obtíží obou počátečních testů.
Poissonův model pro vyhodnocení rychlosti: Tento model byl také navržen společností Rasch a je charakterizován tím, že se bere v úvahu rychlost provádění testu. Model lze navrhnout dvěma způsoby: spočítat počet chyb a počet slov v jednotce času. spočítat počet spáchaných chyb a čas strávený dokončením čtení textu. Pravděpodobnost realizace určitého počtu slov v testu (i) subjektem (j), po určitou dobu (t)
Ojiva Normální modely: je model, který navrhl Pán (1968) a který se používá v testech s dichotomními položkami a pouze s jednou společnou proměnnou, jejíž graf by byl následující: Základní předpoklady, které tento model charakterizují, jsou:

prostor latentní varianty je jednorozměrný (k = 1).
místní nezávislost mezi intemy.
metrika pro latentní proměnnou může být zvolena tak, aby křivka každé položky byla normální hlavicí.

Logistické modely; Jedná se o model velmi podobný předchozímu, ale má také více výhod ve srovnání s matematickým zpracováním. Logistická funkce má následující podobu: Existují různé logistické modely v závislosti na počtu parametrů, které mají:

2 parametry logistického modelu, Birnbaum 1968, mezi jeho vlastnostmi říkáme, že to je jednorozměrný, tam je místní nezávislost, elementy jsou dichotomous, etc.
3 parametry logistického modelu, Pane, je charakterizován tím, že pravděpodobnost zásahu věštěním je faktorem, který ovlivní výkon testu. 4.3. 4-parametrový logistický model: model navržený společností McDonald 1967 a Barton-Lord v roce 1981, jehož účelem je vysvětlit případy, kdy subjekty, které mají vysokou úroveň fitness, na položku nereagují správně.
Logistický model Raschu: Tento model je ten, který navzdory tomu, že má nevýhodu, vytvořil největší počet pracovních míst, to znamená, že jeho přizpůsobení reálným datům je obtížnější, ale na rozdíl od toho je výhoda, která ho činí tak, že nevyžaduje velké Vzorové velikosti pro vaši úpravu.

Odhad parametrů

Nejpoužívanější metoda je Maximální pravděpodobnost, vedle této metody se používají numerické postupy aproximace jako Newton-Raphson a Scoring (Rao). Metoda maximální pravděpodobnosti je založena na principu získávání odhadů neznámých parametrů, které maximalizují pravděpodobnost získání uvedených vzorků. Kromě maximální pravděpodobnosti, Bayesian odhad je také používán, založený na Bayes teorému, který sestává z začlenění všech známých informací, a priori, to je důležité pro proces tvorby závěrů. Podrobnější studie Bayesovské metody pro odhad fitness parametrů je Birnbaum (1996) a Owen (1975). .

INFORMAČNÍ FUNKCE

Nejlepší test, který lze zkonstruovat, je ten, který poskytuje nejvíce informací o latentním rysu. Kvantifikace těchto informací se provádí prostřednictvím "informačních funkcí". Vzorec informační funkce, Birnbaum 1968, je následující: Je třeba vzít v úvahu, že informace získané v testu jsou součtem informací každé položky, kromě příspěvku každé položky nezávisí na ostatních položkách. které tvoří test. Obecně lze říci, že informace ve všech modelech:

se liší podle úrovně fitness.
Čím větší je sklon křivky, tím více informací.
závisí na rozptylu skóre, tím vyšší je, tím méně informací.

Zkušební konstrukce

První úkol a jeden z nejdůležitějších v době sestavování testu je volba položek, předchozí struna teoretických předpokladů, které musí definovat vlastnost, kterou test zamýšlí měřit. Pojem „analýza položek“ odkazuje na soubor formálních postupů, které se provádějí za účelem výběru těch položek, které budou nakonec tvořit test. Informace, které se považují za nejdůležitější s ohledem na položky, jsou:

Obtížnost položky, procento jednotlivců, kteří na ni odpoví.
Diskriminace, korelace každé položky s celkovým výsledkem testu.
Rozptýlení nebo analýza chyb, její vliv je relevantní, ovlivňuje obtížnost položky a způsobuje podcenění hodnot diskriminace..

V době stanovení ukazatelů různých indexů se obvykle používají statistiky nebo indexy, přičemž nejpoužívanější jsou následující:

Index obtížnosti. \ T diskriminace Index spolehlivosti Index platnosti Známé indexy, které musí být vzaty v úvahu při výběru položek, které budou tvořit test, uvidíme, jaké kroky jsou nezbytné pro sestavení testu:

Specifikace problému.
Vyjádřete širokou sadu položek a laděte je.
Volba modelu.
Otestujte předem vybrané položky.
Vyberte nejlepší položky.
Studujte vlastnosti testu
Stanovte normy interpretace získaného závěrečného testu.

Z předchozích bodů je třeba poznamenat, že volba modelu, bod 3, bude záviset na cílech sledovaných testem, na vlastnostech a kvalitě údajů a na dostupných zdrojích. Když je zvolen model, s ohledem na teoretické podmínky, ve kterých může být použit, ne navzdory svým ctnostem musí být analyzovány v každém případě a za specifických okolností. Vlastnosti přiřazené těm modelům, které tvoří Teorie reakce na položku (TRI), Mohou být ovlivněny:

rozměrnost testu vzácná dostupnost vzorku nedostatek počítačových zdrojů Existuje několik preferencí, pokud používáte jeden nebo jiné modely, podívejme se na ně: normální modely hlavic se obvykle nepoužívají v aplikacích, jejich hodnota je teoretická.
Rasch: vhodné pro horizontální srovnání (srovnatelné testy na úrovni obtížnosti s podobnou distribucí fitness). mít různé formy stejného testu. * 2 a 3 parametry: jsou ty, které nejlépe vyhovují různým problémům.
detekovat chybné vzory odezvy. pro vertikální vyrovnání testů (porovnat testy s různými úrovněmi obtížnosti a různými distribucemi pro fitness).

1 a 2 parametry:

vhodné pro vybudování jediného měřítka, takže dovednosti můžete porovnávat na různých úrovních.

Výběr modelu, kromě sledovaného účelu, může být ovlivněn velikostí vzorku; V případě, že vzorek je velký a reprezentativní, nebude problém ani klasický model ani latentní znak. Ale v TRI ( teorie odezvy položek ) malý vzorek síly vybrat modely s malým počtem parametrů, a to i model uniparameter.

Aplikace teorie odezvy položek

Podívejme se, co jsou nejběžnější aplikace: a) Vyrovnávání testů, někdy je nutné spojit výsledky, které byly získány v různých testech, se dvěma možnými účely:

Horizontální vyrovnání: Snaží se získat různé formy stejného testu.
Vertikální vyrovnáníCílem je vybudovat jednotnou škálu schopností s různými obtížemi. Pokud jde o vyrovnání testů, Pán (1980) zavádí pojem „spravedlnost“, což znamená, že pro každý předmět mohou být dva testy zaměnitelné, protože se použije, že jeden nebo druhý nebude měnit úroveň nadání, která byla odhadnuta. pro předmět.

Studie zkreslení položky, položky je zkreslena, když v průměru dává výrazně odlišné skóre ve specifických skupinách, u nichž se předpokládá, že jsou součástí stejné populace.

Testy přizpůsobené nebo průměrné , Prostřednictvím systému TRI mohou být vytvořeny individualizované testy, které umožňují přesněji odvodit skutečnou hodnotu dotyčného znaku. Položky budou podávány postupně, přednastavení jedné položky nebo jiné bude záviset na výše uvedených odpovědích. Existují různé typy přizpůsobených testů, poukazujeme na následující:

dvoufázový postup, Lord 1971; Bertz a Weiss 1973 - 1974. Nejprve se provede jeden test a podle výsledků se provede druhý test.
Postup v několika etapách je stejný jako předchozí, pouze proces zahrnuje více etap.
Pevný větvící model, Lord 1970, 1971, 1974; Mussio 1973. Všechny subjekty řeší stejnou položku, v závislosti na odezvě je soubor položek vyřešen.
Variabilní rozvětvený model je založen na nezávislosti mezi položkami a vlastnostmi odhadů maximální pravděpodobnosti.

Banka položek, Mít velkou sadu položek je něco, co zlepší kvalitu testu, ale pro to musí položky projít nejprve ladicím procesem. Aby bylo možné položky klasifikovat, je třeba vzít v úvahu, která funkce je určena k měření testu, který bude tato položka součástí.

Interpretace partitur

Váhy: jeho účelem je nabídnout kontinuum, které je třeba uspořádat, klasifikovat nebo vědět, jaká je relativní velikost hodnoceného prvku; to nám umožní stanovit rozdíly a podobnosti u lidí s ohledem na tuto vlastnost. Škály používané v psychologii jsou: nominální, ordinální, interval a důvod; tyto stupnice jsou konstruovány z výsledků testů, výsledků nazývaných "přímé skóre" .

Typify : pro typizaci testu je transformace přímých skóre na jiné, které jsou snadno interpretovatelné, protože typizované skóre odhalí pozici subjektu s ohledem na skupinu a umožní nám provést srovnání mezi jednotlivými projekty. Existují dva typy psaní:

Lineární, zachovat tvar distribuce a nemění velikost korelací.
Nelineární, nezachovávají distribuci ani velikost korelací .

ROZMĚR APTITUDU V TRI je postavená stupnice měřítkem, které odpovídá úrovním zdatnosti; Tato škála je charakterizována, protože odhady a odkazy jsou prováděny přímo s ohledem na schopnost a její rozsah. Navíc tato schopnost, která se odhaduje, závisí pouze na tvaru charakteristické křivky položek. V rámci možných měřítek označujeme dva:

Stupnice, navržená Woodcockem (1978) a je definována následujícím vzorcem:
Stupnice WITS, navržená Wrightem (1977), je měřítkem předchozího a je dána následujícím vztahem:

Tento článek je čistě informativní, v online psychologii nemáme schopnost dělat diagnózu nebo doporučit léčbu. Zveme vás k návštěvě psychologa, který se bude zabývat zejména vaším případem.

Pokud chcete číst více článků podobných Teorie reakce na položku - Aplikace a Test, Doporučujeme Vám vstoupit do naší kategorie Experimentální psychologie.

« Teorie otevřených systémů - Definice a charakteristiky Teorie Michaela Tomasella, co nás dělá člověkem? »