En esta teoría se parte del supuesto de que el comportamiento de un sujeto se puede explicar en términos de una o varias carcaterísticas personales, es decir, rasgos que se encuentran latentes, pero que se manifiestan a través del comportamiento del individuo en el test o en las respuesta a los ítems. Asi mismo, también expresa la relación que existe entre el nivel de rasgo de la persona medido con un test y la respuesta de la persona a un ítem del test.


AntecedentesNecesidad de un modelo que satisfaga las deficiencias de la Teoría Clásica de los Test
Según Muñiz y Hambleton (1992) existen varias dificultades que tiene la Teoría Clásica de los Test (TCT) que no pueden ser resueltas a partir de su marco de referencia. Quizás la más importante de éstas sea la invarianza de las mediciones y las propiedades de medida del instrumento, ya que si se utilizan dos pruebas de inteligencia diferentes para medir la capacidad intelectual de dos sujetos diferentes con cada una, no podríamos determinar cuál de los dos sujetos es el más inteligente, pues ambos resultados estarían en distinta escala (puesto que ambos utilizan valores normativos diferentes). Ya que las mediciones varían a partir de cada instrumento y cada escala, no existe una “invarianza”. Simplificando esta explicación, es como si se midiera el largo de dos ramas con dos reglas con unidades de medida diferentes, no se podría determinar cuál es la más larga si no se tiene un equivalencia entre ambas unidades.
Con todo lo anterior puede observarse cómo el desempeño del sujeto, depende en gran medida de las características de la prueba y muestra con la que se ha estandarizado, y no tanto de la característica del sujeto que se desea medir. Hambleton y Jones (1993) explican fácilmente esta idea a partir del planteamiento de una situación genérica, que por motivos didácticos se menciona en un ejemplo aplicado. Imagine que usted presenta un examen de física demasiado fácil, si el desempeño de usted fuera calificado a partir de los resultados de éste, es probable que usted sea considerado como una persona con grandes conocimientos de física, si por el contrario, usted presenta un examen muy difícil, es probable que usted sea considerado como una persona poco apta para entender los principios de la física, y sin embargo, en ambos exámenes usted tuvo un mismo nivel de habilidad y aptitud. Éste es precisamente el mayor problema de las pruebas elaboradas a partir del modelo de la TCT, que el desempeño del sujeto es dependiente de la escala de la prueba.
Principios básicos de la Teoría de Respuesta al Ítem
La Teoría de Respuesta al Ítem (TRI) viene a resolver este problema de medición a partir de una serie de propuestas metodológicas y asunciones básicas. Según Hambleton, Swaminathan y Rogers (1991), el desempeño “real” de un sujeto dependerá de su habilidad únicamente, y ésta a su vez impactará en la probabilidad de que el sujeto acierte en un ítem determinado. Es decir, cuanto mayor sean los conocimientos que un sujeto tiene sobre física, mayor probabilidad tendrá de resolver correctamente un problema de dicha ciencia. Así, la TRI, como su nombre lo indica, evalúa el ítem, y no la prueba en su totalidad. Esta relación entre la habilidad (o conocimiento) y la probabilidad de acertar el ítem queda manifiesta en la Curva Característica del Ítem (CCI), en donde se grafica esta relación (figura 1).

CCI-Bonito.jpg
Figura 1. Curva Característica del Ítem

Sin embargo, la TRI no siempre puede ser aplicada, puesto que para esto, se deben de cumplir dos grandes requisitos (Hambleton, Swaminathan y Rogers, 1991; Muñiz,2010; : 1) lo que se pretenda medir debe ser unidimensional. De ahí que sea una sola “habilidad” la que se evalúe. Sin embargo, esto no siempre es posible puesto que muchos constructos psicológicos (tanto de personalidad como cognitivos) dependen de otros factores; para esto Hambleton, Swaminathan y Rogers (1991) mencionan que el requisito indispensable para asumir la unidimensionalidad de un constructo es que haya un factor dominante que esté influyendo en el desempeño de la prueba. 2) Lo que mida un ítem, debe ser independiente a lo que mida otro ítem (esto es conocido como “independencia local”), esto es, nada, a excepción de la habilidad del sujeto, debe de influir en el desempeño de éste en un ítem determinado. Como se puede observar, una vez cumplido el supuesto de unidimensionalidad, es fácil cumplir el de independencia local.
Así, en la TRI el desempeño del sujeto no depende de la escala de medición, sino de la habilidad real del sujeto, de ahí que este se sitúe entre los valores de “menos infinito” a “más infinito”. Para conocer más acerca de éstas diferencias entre la TRI y la TCT, obsérvese la tabla 1, donde Muñiz (2010) compara varias características de ambas teorías.

Tabla 1. Diferencias entre la Teoría Clásica de los Test y la Teoría de Respuesta al Ítem.
Aspectos
Teoría Clásica de los Test
Teoría de Respuesta al Ítem
Énfasis
Test
Ítem
Modelo
Líneal
No lineal
Asunciones
Débiles (fáciles de cumplir por los datos
Fuertes (difíciles de cumplir por los datos)
Invarianza de las mediciones
No
Si
Invarianza de las propiedades del test
No
Si
Escala de las puntuaciones
Entre 0 y la puntuación máxima en el test
Entre -∞ y +∞
Relación ítem-test
Sin especificar
Curva característica del ítem
Descripción de los ítems
Índices de dificultad y discriminación
Parámetros a (dificultad), b (discriminación) y c (adivinación)
Errores de medida
Erros típico de la medida común para toda la muestra
Función de información (varía según el nivel de aptitud o habilidad)
Tamaño muestral
Puede funcionar bien con muestras entre 200 y 500 sujetos aproximadamente
Se recomienda más de 500 sujetos, aunque depende del modelo.

Modelos de Teoría de Respuesta al Ítem
Muñiz (2010) menciona que teóricamente podrían existir infinitdad de modelos de TRI, ya que éstos dependen de los cálculos y funciones que se empleen, según los objetivos y características del instrumento en cuestión. Sin embargo, existen dos grandes vertientes, la función logística y la curva normal. Debido a la facilidad de manejo y entendimiento de la primera, ésta es la que más suele utilizarse. De los modelos de función logística, los que mayoritariamente se utilizan son los que adoptan la función logística de la Curva Característica del Ítem, la cual dependiendo de la cantidad de parámetros que se usan es el nombre que reciben.
Cuando se utiliza el parámetro de dificultad del ítem (parámetro a), se tiene un modelo de un solo parámetro, que también es conocido como modelos de Rasch, debido a que fue Rash quien lo propuso inicialmente en la década de 1960 (Muñiz, 2010). Si además se usa el parámetro de discriminación del ítem (b), se tiene un modelo logístico de dos parámetros, propuesto inicialmente por Lord y modificado posteriormente por Birnbaum (Hambleton, Swaminathan y Rogers, 1991). Si además se usa el parámetro de la probabilidad de acertar el ítem al azar (c), se tiene un modelos logístico de tres parámetros (Muñiz, 2010).
Implicaciones de la TRI en la evaluación educativa
Quizá una de las grandes ventajas de la TRI en la evaluación educativa sea el hecho de que intenta evaluar la habilidad del sujeto y las características del ítem, y no así su habilidad comparada con el resto de la población. Esto es fundamental en evaluaciones a gran escala. Por otra parte, la TRI no excluye la utilización de la TCT, pues ambas pueden convivir (y lo hacen) en la construcción de los test. Ambas resuelven y aportan información válida para la elaboración de evaluaciones, y más que ser rivales resultan complementarias (Muñiz, 2010). Esto es algo que todo profesional de la educación debe tener en cuenta, pues asegurarse de cumplir ambos criterios tal vez repercuta en una mejor calidad de instrumentos de evaluación.

Ventajas de la TRI

Las principales ventajas que aporta la TRI se pueden resumir en los siguientes puntos (McAlpine, 2002, en Mateo, 2008)

*Ofrece medidas de la habilidad de los sujetos que son independientes del conjunto de ítems y muestra de sujetos.*Los parámetros que describen a los ítems son invariantes e independientes de la muetra se suetos y del resto de los ítems que conforman el test. Esta característica permite que se puedan comparar sujetos aunque contesten diferentes grupos de ítems.*Esta teoría no utiliza medidas repetidas de un mismo test o formas paralelas para justificar las puntuaciones empíricas y los errores de medida.*Los conceptos desarrollados por ésta teoría son compatibles con la elaboración de test normativos, criteriales o individualizados.*Facilita la creación de bancos de ítems.



Referencias
Hambleton, R. K. y Rusell, J. (1993). Comparison of Classical Test theory and Item Response Theory and their aplications to test development. Instructional Topics in Educactional Measurement,253-262.
Hambleton, R. K., Swaminathan, H. y Rogers, H. J. (1991). Fundamentals of Item Response Theory. E.U.A.: SAGE Publications, Inc.
Mateo, J. y Martínez, F. (2008). Medición y Evaluación Educativa. España: Editorial La Muralla S.A.
Muñiz, J. (2010). Las teorías de los tests: Teoría Clásica y Teorías de Respuesta a los Ítems. Papeles del Psícologo, 31(1), 57-66.
Muñiz, J. y Hambleton, R. K. (1992). Medio siglo de teoría de respuesta al ítem. Anuario de Psicología, 52, 41-66.