Caterina Primi

Gli attrezzi di lavoro dello psicologo

Alcune caratteristiche psicologiche latenti, cioè non direttamente osservabili, possono essere misurate attraverso test: per comprenderne la portata bisogna familiarizzare con i concetti di costrutto, indicatori e item, e con i differenti modelli di misurazione

strumenti_psicologia.jpg

Inizio sempre il corso che tengo alla Scuola di Psicologia, presso l’Università di Firenze, spiegando cos’è la psicometria. Tale premessa è necessaria perché gli studenti che sono al primo anno hanno aspettative verso la psicologia che sia una disciplina in cui non abbiamo a che fare con i numeri, e a volte sembrano scegliere tale percorso di studio proprio per sfuggire all’uso di questi. Cercare quindi di fargli capire come la psicologia sia una scienza, che quindi richieda non solo l’uso di un metodo ma anche di strumenti per la rilevazione e la misurazione dei fenomeni psicologici, è la finalità del mio corso. Ecco, quindi, che a quel punto gli studenti comprendono che nella formazione dello psicologo è prevista la psicometria.

COS’È LA PSICOMETRIA?

La psicometria è quella branca della psicologia che applica metodi di misurazione quantitativa alle caratteristiche psicologiche. Fare lo psicologo richiede infatti di condurre misurazioni e di sapere usare strumenti di misura. L’uso di un test psicologico può aiutare nel formulare la diagnosi, nel valutare l’efficacia di un intervento oppure nello screening dei fattori di rischio rispetto ad uno specifico comportamento. È importante quindi sottolineare come occuparsi di misurazione non è solo priorità del ricercatore ma di qualsiasi psicologo che svolga la professione in ambiti applicativi diversi. Trattando il tema della misura, la psicometria si occupa quindi di strumenti come i test psicologici, e in particolare delle loro proprietà, che è necessario conoscere per sapere scegliere quale test utilizzare in base alle caratteristiche relative alla loro costruzione e/o al loro adattamento per una specifica popolazione.

COSA MISURIAMO CON UN TEST PSICOLOGICO?

In primo luogo occorre definire qual è l’oggetto delle nostre misurazioni e le sue caratteristiche. Nei diversi contesti applicativi dove operiamo ci possiamo trovare a misurare caratteristiche psicologiche che possono variare nelle persone e per questo sono definite variabili come, per esempio, l’ansia o l’intelligenza. Tali caratteristiche hanno la peculiarità di non essere osservabili: noi, infatti, non le vediamo direttamente ma osserviamo solo le loro manifestazioni. In questo la misura delle caratteristiche psicologiche si differenza dalla misurazione di caratteristiche fisiche come l’altezza o il peso, con le quali la misurazione può essere fatta direttamente utilizzando uno strumento e una specifica unità di misura. Ciò che quindi caratterizza l’oggetto delle nostre misurazioni è l’essere latente, cioè non direttamente osservabile e quindi sottostante al comportamento manifesto. Tuttavia la finalità della misurazione è proprio quello di determinare quanto di tale caratteristica latente una persona possiede.

Per rispondere a questo scopo occorre definire l’oggetto delle nostre misurazioni. Ecco allora che si pone il problema della definizione del costrutto. Si tratta cioè di una rappresentazione astratta, quindi teorica, di un fenomeno psicologico. Si può quindi considerare il costrutto come una categoria interpretativa della realtà, un modo per assegnare un significato a fenomeni di interesse teorico che assumiamo siano reali e sottesi al comportamento osservabile. Definire un costrutto psicologico è un processo complesso. Se proviamo infatti a definire, per esempio, l’intelligenza, ci accorgiamo quanto sia difficile esplicitarne il significato, pur essendo regolarmente usato nel linguaggio comune. È da sottolineare quindi che se la definizione del costrutto e la sua operazionalizzazione sono inadeguate, anche le nostre misure risulteranno inadeguate.

Una volta che è stato definito il costrutto a livello teorico, il passo successivo è quello di delimitare all’interno dell’universo di tutti i comportamenti possibili quelli che, coerentemente con la definizione, possono rappresentare le operazionalizzazioni del costrutto. L’elaborazione di un costrutto non prevede solo una definizione teorica ma anche una descrizione in termini operazionali, ossia nei comportamenti che consentono di rilevarlo nelle persone. In questo modo, attraverso l’operazionalizzazione, si definiscono le caratteristiche latenti in comportamenti osservabili e misurabili del costrutto, ovvero gli indicatori. Attraverso questa procedura di operazionalizzazione si individuano quei comportamenti che ci permettono di rilevare la presenza di una caratteristica psicologica latente. È grazie alla valutazione degli indicatori osservabili che siamo in grado di stabilire se una persona possiede o meno una certa caratteristica psicologica. Questo insieme di operazionalizzazioni è chiamato dominio di contenuto. È sicuramente un processo complesso quello di trasformare il contenuto delle operazionalizzazioni in indicatori-item del test. Si tratta di affermazioni o stimoli che dovrebbero permetterci di attivare, in una situazione controllata, il comportamento che vogliamo rilevare. L’item si può quindi considerare come un prolungamento osservabile del costrutto. Facciamo un esempio con un costrutto noto come quello dell’intelligenza. Tra i modelli teorici esistenti troviamo la definizione dell’intelligenza come un costrutto unidimensionale. L’intelligenza viene definita attraverso un fattore generale (intelligenza fluida) e descritta come la capacità di sapere risolvere problemi in situazioni nuove indipendentemente dalle conoscenze acquisite. L’operazionalizzazione di tale costrutto ha portato a definire come indicatori stimoli astratti che non siano collegati a nozioni acquisite precedentemente e che presentino una difficoltà crescente. Le Matrici Progressive di Raven sono un esempio di strumento che consente la misura dell’intelligenza fluida (costrutto) attraverso una serie di matrici (indicatori) ordinate in termini di difficoltà crescente. Le matrici sono formate da una serie di figure che subiscono delle trasformazioni sia orizzontali che verticali: possono aumentare o diminuire in grandezza, possono aggiungersi o sottrarsi elementi, possono spostarsi o sovrapporsi elementi. Nell’angolo in basso a destra della matrice manca una figura e la matrice deve essere completata: la figura che completa la matrice deve essere scelta tra 6 o 8 alternative. Le risposte corrette consentono di quantificare la caratteristica latente, in questo caso l’intelligenza fluida.

È importante quindi evidenziare come la definizione teorica del costrutto non interessa soltanto chi si occupa di costruzione di strumenti ma anche chi usa strumenti già messi a punto e che somministra con la finalità di fare valutazioni psicologiche. Infatti, per poter adeguatamente interpretare il punteggio ottenuto con le risposte date al nostro test è necessario conoscere il costrutto misurato e come è stato definito e operazionalizzato.

I MODELLI DI MISURAZIONE

Per poter misurare occorre mettere in relazione il costrutto con la risposta data ad un item. L’assunzione alla base del procedimento è che ogni item misuri qualcosa di sottostante che è un continuum. Il punteggio ottenuto ad ogni item è la misura di una caratteristica che può variare quantitativamente e che è comune a tutti gli item. È attraverso un modello di misurazione che si specifica la relazione tra il costrutto (variabile latente) e le sue operazionalizzazioni (indicatori). Si tratta quindi di un modello matematico che attraverso una funzione ci permette di rappresentare e quantificare la relazione tra il costrutto e ogni indicatore. Tra i modelli di misurazione, il più diffuso è quello noto come Teoria Classica dei Test (TCT) che prevede che la variabile latente abbia un effetto causale sulle variabili osservate, in grado di spiegare la maggior parte del punteggio osservato. Il modello di misurazione stabilisce che il punteggio osservato all’item yi è uguale alla quantità di costrutto posseduta η1 più una quantità di altre cause estranee al costrutto e all’errore di misurazione εi. Riguardo alla tipologia di errore bisogna distinguere tra errori sistematici che sono legati alla definizione del costrutto psicologico e propri dello strumento di misura. Questo tipo di errori hanno un peso costante sulla misurazione della caratteristica psicologica e portano ad avere i risultati osservati tutti in una direzione. Questo tipo di errori possono essere tuttavia tenuti sotto controllo sia migliorando la qualità del costrutto attraverso una definizione che non sia ambigua, sia attraverso una definizione operativa scegliendo indicatori che rappresentino in maniera adeguata il costrutto.

Espresso attraverso un’equazione matematica, il modello è di tipo lineareyi λiη1 εi, dove λi è il coefficiente che esprime l’effetto atteso del costrutto sulla risposta data all’item. La caratteristica fondamentale di questo modello è considerare l’errore casuale elemento intrinseco nel processo di misurazione. Anche se non si commettono errori sistematici, non risulta possibile prevenire gli errori casuali, quegli errori che accadono in modo imprevedibile nella misurazione. Ecco, quindi, che il punteggio osservato al test non corrisponde esattamente al livello del costrutto, dato che comprende sempre un errore. Possiamo quindi considerare che una certa quota di incertezza è intrinseca in qualunque processo di misurazione. Quando parliamo di affidabilità di un test facciamo quindi riferimento proprio alla sua proprietà di misurare con precisione il nostro costrutto. Utilizzando metodi diversi si può ottenere una stima dell’attendibilità, indicando l’impatto dell’errore di misurazione sul punteggio ottenuto al test. È quindi una proprietà del test che dovremmo sempre conoscere prima del suo utilizzo.

Una peculiarità del modello della TCT è quella di porre attenzione soltanto alle risposte dei soggetti, senza considerare l’altro elemento fondamentale nella misurazione che è rappresentato dall’item. L’assunzione è quella di considerare che tutti gli item abbiano uno stesso grado di difficoltà (se si tratta di un test che misura ad esempio il ragionamento matematico) oppure di severità (se si tratta di un test che descrive i sintomi di un disturbo). Partendo da tale assunzione viene calcolato il punteggio totale dato dalla combinazione di item che pur avendo un diverso peso nella definizione del costrutto sono considerati equivalenti.

È proprio con l’obiettivo di superare alcuni dei limiti della TCT che è stato sviluppato un nuovo modello di misurazione, l’Item Response Theory (IRT), un approccio psicometrico che consente di misurare i tratti latenti quantificando la probabilità di rispondere al test in funzione del livello di tratto posseduto e delle caratteristiche degli item che compongono il test. Messo a punto nell’ambito dei test di performance, negli ultimi anni tale approccio si è sviluppato anche nell’ambito della psicologia clinica, in cui è stato applicato per l’analisi delle proprietà psicometriche di vari strumenti, permettendo quindi un’indagine più sofisticata rispetto ai tradizionali metodi utilizzati nell’ambito della Teoria Classica dei Test. Rispetto a questa, infatti, l’IRT permette una serie di vantaggi, quali uno scaling centrato sia sul soggetto che risponde che sull’item e sulle sue proprietà psicometriche. Si tratta di un approccio alla misurazione di tipo probabilistico, assumendo che ogni persona che risponde ad un item di un test possiede un livello di abilità (θ) e che la probabilità di dare una risposta corretta dipende da questa abilità. Oltre al livello di abilità, quindi alla caratteristica latente, sono inseriti nel modello i parametri corrispondenti alle caratteristiche dell’item come difficoltà dell’item (b), capacità discriminativa (a) e guessing (c). Il modello matematico è di tipo logistico, non più lineare come nella TCT, e in base al numero dei parametri riferiti agli item si definiscono i diversi modelli (a 1 parametro se è presente solo il parametro della difficoltà, a 2 parametri con difficoltà e discriminatività e a 3 parametri con difficoltà, discriminatività e guessing). I modelli IRT si differenziano dalla TCT per una concezione di attendibilità in termini di capacità informativa non costante dello strumento ma per i diversi livelli di tratto misurati e quindi non espressa attraverso un unico coefficiente per l’intero test. In questo modo è possibile stabilire se lo strumento risulta adeguato per misurare ad esempio livelli bassi del nostro costrutto. Quindi, se si tratta di una prova che misura il ragionamento matematico, potrò usare il test per individuare quegli studenti che hanno bassa capacità di ragionamento. Se, invece, il test risulta più preciso su livelli alti del tratto latente, lo strumento aiuterà nell’individuare chi ha una livello elevato di ragionamento. L’uso dell’IRT anche per la misura di costrutti di personalità o condizioni psicopatologiche ha particolarmente messo in evidenza i vantaggi di questi modelli nell’ambito dell’assessment. La possibilità di stimare la capacità informativa dello strumento in termini di precisione in cui il tratto viene misurato permette infatti di evidenziare l’efficacia dello strumento in un intervento di screening (a livello basso di severità del tratto) o in un ambito di trattamento (a livello elevato di severità del tratto).

CONCLUSIONI

In ambito psicologico essere consapevoli del significato, delle potenzialità e dei limiti del processo di misurazione è fondamentale, in quanto, di per sé, i costrutti psicologici sono latenti, quindi non direttamente osservabili, ma inferibili solamente attraverso un insieme di indicatori osservabili definiti a priori. Conoscere quindi i modelli di misura, i loro presupposti e le loro possibilità, permette di avere maggiore familiarità con tutto ciò che concerne la misurazione, in tutti gli ambiti di ricerca e applicativi della psicologia. È quindi importante nella formazione dello psicologo acquisire tali competenze operative che possono incrementare le capacità di comprensione, interpretazione e selezione degli strumenti di misura in qualsiasi ambito psicologico, da quello educativo a quello clinico. Uno psicologo esperto di psicometria, ovvero “alfabetizzato” dal punto di vista psicometrico, rappresenta una garanzia sia in ambito accademico, in cui competenze di analisi psicometrica degli strumenti sono sempre più richieste e valorizzate, ma anche in qualunque tipo di ambito professionale legato alla psicologia, dal momento che l’operazione di misurare e di interpretare ciò che si misura costituisce l’attività professionalizzante per eccellenza degli psicologi.

Caterina Primi è professore ordinario di Psicometria presso la Scuola di Psicologia dell’Università di Firenze e responsabile del Laboratorio di Psicometria presso il Dipartimento NEUROFARBA; insegna inoltre Psicometria e Test Psicologici. È inoltre coinvolta in progetti a livello internazionale e nazionale su temi come l’insegnamento della statistica e della matematica.

 

 

Questo articolo è di ed è presente nel numero 287 della rivista. Consulta la pagina dedicata alla rivista per trovare gli altri articoli presenti in questo numero. Clicca qui