Psykometria (psykometria) on psykologian , kognitiivisten tieteiden , kasvatuksen ja matematiikan risteyksessä oleva tieteenala , joka tutkii psykologisten mittausten teoriaa ja metodologiaa, mukaan lukien tiedon, kykyjen, asenteiden ja persoonallisuuden ominaisuuksien mittaamista. Psykometria on psykodiagnostiikan haara . Ensinnäkin tämä alue koskee mittaustyökalujen, kuten kyselylomakkeiden, testien ja persoonallisuuden kuvaamiseen (arviointiin) tarkoitettujen menetelmien luomista ja validointia, mutta laskennallisen käyttäytymistieteen osana se voi keskittyä tiettyjen käyttäytymis- ja rakentamisalueiden kuvaamiseen. niiden teoreettiset ja matemaattiset mallit . Se sisältää kolme päätutkimustehtävää, nimittäin:
Psykometriaan osallistuvat voivat olla psykologeja (usein ikään liittyviä), matemaatikoita ja kehitys- tai HR -ammattilaisia . Usein erityistä, erillistä psykometrian tutkintoa ei vaadita. Kuitenkin Australiassa pääsy ja joidenkin Australian Council for Educational Researchin (ACER) testien käyttö edellyttää todistetta valtuutetusta pätevyydestä. Yhdysvalloissa psykometriaa opetetaan perustutkinto-, jatko- ja tohtoritasolla .
Suuri osa varhaisesta psykometriikasta tutkimuksesta perustui haluun mitata älykkyyttä. Francis Galton , joka tunnetaan "psykometrian isänä", sisällytti henkiset mittaukset antropometrisiin tietoihin. Psykometrian alkuperä liittyy myös psykofysiikkaan . Kaksi muuta psykometrian pioneeria , James McKean Cattell ja Charles Spearman , suorittivat tohtorin tutkinnon Wilhelm Wundtin Leipzigin psykofysiikan laboratoriosta .
Psychometrician Louis Thurstone , Psychometric Societyn perustaja ja ensimmäinen presidentti, kehitti vuonna 1936 teoreettisen lähestymistavan mittaamiseen, joka tunnetaan vertailevien tuomioiden laina . Tämä lähestymistapa liittyy läheisesti Ernst Weberin ja Gustav Fechnerin psykofyysisiin teorioihin . Myös Spearman ja Thurstone antoivat suuren panoksen tekijäanalyysin kehittämiseen .
Karl Pearson , Henry Kaiser , George Rush , Johnson O'Connor , Frederick Lord , Ledyard Tucker ja Arthur Jensen osallistuivat myös merkittävästi psykometrian kehittämiseen.
Psykometrian ala liittyy kvantitatiiviseen lähestymistapaan testitietojen analysointiin. Psykometrinen teoria tarjoaa tutkijoille ja psykologeille matemaattisia malleja, joita käytetään yksittäisten tehtävien tai testikohteiden vastausten analysoinnissa, testeissä yleensä ja testisarjoissa. Sovellettava psykometriikka koskee näiden mallien ja analyyttisten menettelyjen soveltamista tiettyihin testitietoihin. Psykometrisen analyysin neljä aluetta ovat normalisointi ja yhtälö, luotettavuuden arviointi, validiteettiarviointi ja eräanalyysi . Jokainen näistä alueista sisältää joukon tiettyjä teoreettisia määräyksiä ja erityisiä menettelyjä, joita käytetään testin laadun arvioinnissa kussakin yksittäisessä tapauksessa. Samaan aikaan ne kaikki liittyvät toisiinsa ja kehittyvät aktiivisesti eurooppalais-amerikkalaisen psykologisen paradigman puitteissa. Nykyaikaisten lähestymistapojen mukaan testin validiteetin ymmärtämiseen se ei luonnehdi itse testiä, vaan siitä tehtyjä johtopäätöksiä. Tämä tarkoittaa, että samaa työkalua voidaan käyttää sekä kelvollisesti (kehittäjien asettamien tavoitteiden ja rajoitusten mukaisesti) että virheellisesti. Tässä lähestymistavassa kaikki "erilliset" testin laadun analysointitoimenpiteet ovat komponentteja tehtävän päätelmän pätevyydestä ja toimivat vastaajaa koskevan päätelmän todistamisessa.
Mittauksen määritelmällä yhteiskuntatieteissä on pitkä historia. Stanley Smith Stevensin (1946) nykyinen laaja määritelmä on, että mittaus on "numeroiden osoittamista esineille tai tapahtumille jonkin säännön mukaan". Tämä määritelmä esitettiin asiakirjassa, jossa Stevens ehdotti neljää asteikkoa. Vaikka tämä määritelmä on laajalti hyväksytty, se eroaa fysiikan klassisemmasta mittauksen määritelmästä, jonka mukaan mittaus on yhden suuren numeerinen arviointi ja ilmaisu suhteessa toiseen (Michel, 1997).
Todellakin, Stevensin määritelmä esitettiin vastauksena brittiläiselle Ferguson-komitealle, jonka puheenjohtaja A. Ferguson oli fyysikko. British Association for the Advancement of Science nimitti komitean vuonna 1932 tutkimaan mahdollisuutta kvantifioida aistihavaintoja. Vaikka sen puheenjohtaja ja muut jäsenet olivat fyysikoita, komiteaan kuului myös useita psykologeja. Valiokunnan mietinnössä korostettiin ulottuvuuden määrittelemisen tärkeyttä. Vaikka Stevensin vastaus oli ehdottaa uutta määritelmää, jolla olisi merkittävä vaikutus kenttään, tämä ei ollut ainoa vastaus raporttiin. Toinen, radikaalisti erilainen vastaus vaati klassisen määritelmän omaksumista, kuten seuraava lausunto heijastuu: "Mittaus psykologiassa ja fysiikassa ei ole millään tavalla erilaista. Fyysikot voivat tehdä mittauksia, kun he löytävät operaatioita, joiden avulla voidaan löytää tarvittava kriteeri. Psykologien ei tarvitse huolehtia salaperäisistä eroista "mittauksen" merkityksessä näissä kahdessa tieteessä." (Reese, 1943, s. 49).
Testien normalisointi - olennainen osa niiden standardointia, se sisältää yleensä edustavan henkilöotoksen tutkimuksen suorittamisen, testien suorituskyvyn eri tasojen määrittämisen ja raakatestien tulosten muuntamisen yhteiseksi indikaattorijärjestelmäksi. Testit ovat joskus linjassa, kun samasta testistä on erilaisia muotoja. Tasaus tuo kaikkien muotojen pisteet yhteiselle asteikolle.
On olemassa 4 päälinjausstrategiaa. Ensimmäinen menetelmä sisältää jokaisen testin muodon suorittamisen vastaavalle (esimerkiksi satunnaisesti valitulle) vastaajaryhmälle, ja sitten näiden eri lomakkeiden pisteet asetetaan niin, että yhtäläisillä pisteillä on samat prosenttipisteet (sama osuus vastaajista saa saman tai alempi arvio). Tarkemmalla menetelmällä kaikki vastaajat täyttävät kaikki testin muodot ja yhtälöitä käytetään indikaattoreiden vastaavuuden määrittämiseen. Kolmas yleisesti käytetty menetelmä on yleistestin tai testin osan suorittaminen kaikkien vastaajien kanssa. Tämä yleinen arviointimenettely toimii "linkitystestinä", joka mahdollistaa kaikkien myöhempien mittausten sitomisen yhteen asteikkoon. Suorittaessa kyselyä käyttämällä saman testin eri muotoja, jokainen sisältää useita "ankkuritehtäviä", jotka suorittavat tällaisen "yhteystestin" toiminnon.
Luotettavuus ja validiteetti liittyvät testitulosten yleistettävyyteen – sen määrittämiseen, mitkä johtopäätökset testituloksista ovat päteviä. Luotettavuus koskee johtopäätöksiä mittauksen johdonmukaisuudesta. Johdonmukaisuus määritellään monella tapaa: ajallisena stabiilisuutena, samankaltaisuutena oletettavasti vastaavien testien välillä, homogeenisuutena yhden testin sisällä tai asiantuntijoiden antamien tulosten vertailukelpoisuutena. Testi-uudelleentestausmenetelmää käytettäessä testin luotettavuus varmistetaan toistamalla se samalle ryhmälle tietyn ajan kuluttua. Sitten kahta tuloksena saatua pistemäärää verrataan niiden välisen samankaltaisuuden määrittämiseksi. Vaihdettavien muotojen menetelmää käytettäessä tehdään kaksi rinnakkaista mittausta koehenkilönäytteelle. Asiantuntijoiden ("arvioijien") osallistuminen testin rinnakkaisten muotojen laadun arviointiin antaa luotettavuuden mittarin, ns. arvioijien luotettavuus. Tätä menetelmää käytetään usein, kun on tarve vertaisarviointiin.
Validiteetti kuvaa mittausmenettelyn tulosten perusteella tehtyjen johtopäätösten laatua.
Validiteettina pidetään testin kykyä saavuttaa asetetut tavoitteet ja perustella tuloksen perusteella tehtyjen päätösten riittävyys. Riittämättömästi validia testiä ei voida pitää mittausvälineenä ja käyttää käytännössä, koska saatu tulos voi usein vaikuttaa vakavasti testattavan tulevaisuuteen.
Testin validiteettia on kolmenlaisia.
Rakenteen (käsitteellinen) validiteetti . Se on määriteltävä, jos testi mittaa ominaisuutta, joka on luonteeltaan abstrakti eli ei sovellu suoraan mittaukseen. Tällaisissa tapauksissa on tarpeen luoda käsitteellinen malli , joka selittää tämän ominaisuuden. Tämä malli vahvistaa tai kumoaa testin.
Kriteerien (empiirinen) validiteetti . Näyttää, kuinka testituloksia verrataan johonkin ulkoiseen kriteeriin. Empiirinen validiteetti on olemassa kahdessa muodossa: nykyinen kriteerin validiteetti - testitulosten korrelaatio valitun kriteerin kanssa, joka on tällä hetkellä olemassa; ennustava kriteerin kelpoisuus - tulosten korrelaatio kriteerin kanssa, joka ilmestyy tulevaisuudessa. Se määrittää, kuinka paljon testi ennustaa mitatun laadun ilmenemistä tulevaisuudessa, ottaen huomioon ulkoisten tekijöiden vaikutuksen ja testattavan oman toiminnan.
Sisällön kelpoisuus . Määrittää, kuinka relevantti testi on aihealueelleen, eli mittaako se laatua, joka on tarkoitus mitata edustavassa otoksessa. Testin sisällön validiteetin ylläpitämiseksi on tarpeen tarkistaa sen noudattaminen säännöllisesti, koska todellinen kuva tietyn laadun ilmentymisestä voi muuttua otoksessa ajan myötä. Sisällön validiteetti tulee arvioida kokeen aihealueen asiantuntijan toimesta.
Testin validointiprosessin ei tulisi olla kokoelma todisteita sen pätevyydestä, vaan joukko toimenpiteitä tämän validiteetin lisäämiseksi.
Suurin osa klassisen testausteorian tehtäväanalyysimenetelmistä sisältää : a) tiettyyn tehtävään oikean tai väärän vastauksen antaneiden koehenkilöiden määrän rekisteröinnin; b) yksittäisten tehtävien korrelaatio muiden muuttujien kanssa; c) tehtävien tarkistaminen systemaattisten virheiden (tai "harha") varalta. Testin tehtävästä selviytyneiden koehenkilöiden osuutta kutsutaan tehtävän vaikeudeksi. Yksi tapa parantaa tehtäviä on laskea kunkin vastausvaihtoehdon valintaprosentti monivalintatehtävässä; on myös hyödyllistä laskea kunkin vaihtoehdon valinneiden koehenkilöiden keskimääräiset testipisteet. Näiden menetelmien avulla voidaan hallita, että vastausvaihtoehdot näyttävät uskottavilta valmistautumattomille aiheille, mutta eivät näytä oikealta tiedostavimmalle. Testin kokonaispistemäärän kanssa voimakkaasti korreloivien kohteiden valitseminen maksimoi testin sisäisen johdonmukaisuuden luotettavuuden, kun taas ulkoisen kriteerin kanssa voimakkaasti korreloivien kohteiden valitseminen maksimoi sen ennustavan validiteetin. Näiden korrelaatioiden kuvaavaa analogista mallia kutsutaan asetuspisteen ominaiskäyräksi ; tyypillisissä tapauksissa tämä on kaavio niiden koehenkilöiden osuudesta, jotka vastaavat kysymykseen oikein kokeen kokonaistuloksesta. Tehokkaita tehtäviä varten nämä kaaviot ovat positiivisia nousevia käyriä, jotka eivät pienene kyvyn kasvaessa.