Elosua (2003) considera a la validez como "el aspecto de la medición psicopedagógica vinculado a la comprobación y estudio del significado de las puntuaciones obtenidas por el test".
Así, la validez sería el acto de "medir lo que deseamos medir y no algo distinto a ello". Esto es posible solo si poseemos los siguientes elementos:
  1. ‍Una base teórica sólida
  2. Planteamiento claro de objetivos
  3. Elección de una población o grupo representativo
  4. Elección cuidadosa de instrumentos
  5. Una administración cuidadosa del instrumento‍
Si nuestra investigación contiene estos elementos, es lo más valido posible (o por lo menos aceptable).

Características de la validez
Al hablar de validez de pruebas y evaluaciones, Gronlund (1983) sugiere tener en cuenta las siguientes precauciones:
  1. La validez pertenece a los resultados de una prueba o de un instrumento de evaluación y no al instrumento mismo, aunque a veces se hable de la validez de una prueba, o más específicamente, de la validez de la interpretación a partir de los resultados.
  2. La validez es una cuestión de grado. No existe sobre una base de todo o nada. Consiguientemente, debemos evitar pensar sobre los resultados de la evaluación como válidos o no válidos. La mejor manera de considerar la validez es en términos de aquellas categorías que especifican grado como son: gran validez, validez media y poca validez.
  3. La validez es siempre específica de algún uso particular. Jamás debe considerarse como cualidad de tipo general. Por ejemplo, los resultados de una prueba de aritmética pueden tener un grado de validez muy elevado en cuanto que indican habilidad para la computación, un grado bajo de validez en cuanto que señalan capacidad de razonamiento aritmético, un grado intermedio por lo que hace a la predicción de éxito en el arte o en la música. Así pues, cuando se aprecie o describa la validez es necesario considerar qué uso va a darse a los resultados. Los resultados de la evaluación jamás son nada más válidos; tienen un grado diferente de validez según sea el uso particular a cuyo servicio se pongan.


Historia del concepto de validez
De acuerdo con Elosua (2003), el significado de validez ha evolucionado desde un origen pragmático y operacional, hasta la complejidad que hoy predomina; Se ha revestido de mil formas, acepciones o enfoques bajo las cuales es posible delimitar a grandes rasgos tres etapas:
  1. Una primera etapa operacional dominada por una visión pragmática que prima la validez externa. Esta perspectiva diferencia cuatro tipos de validez establecidos en la APA en 1954: Contenido, predictiva, concurrente y de constructo; más tarde, en las ediciones de 1966 y 1974, se reducen a tres, agrupando para ello la validez predictiva y concurrente en la validez referida al criterio. La visión tripartita admitida no se rompe oficialmente hasta la publicación de los estándares de 1985.
  2. El segundo estadio teórico marcado por la importancia concedida a la teoría psicológica, en el que adopta una visión integradora. Se impone el análisis de la validez de constructo como concepto unificador que abarca aspectos de contenido y de relaciones con otras variables. Supone el reconocimiento de la validez como proceso único de recogida de evidencias a través de estrategias de investigación diferentes relacionadas con el constructo, con el contenido o con el criterio.
  3. La fase actual, a la que se podría llamar contextual, se amplía la acepción anterior y se delimita con el concepto de uso propuesto. Su objetivo sería dotar a los tests de avales tanto científicos como éticos. En esta nueva revisión no se encuentran referencias a distintas formas de validez. Se incorpora a la connotación teórica anterior un aspecto hasta ahora olvidado, el uso. Ya no es suficiente la justificación sustantiva de las puntuaciones, es necesario delimitar los fundamentos en un contexto externo, con relación al propósito o interpretación propuesta. Como consecuencia, dentro de los ámbitos de uso de un test habrán de especificarse las condiciones de la situación de medida, que entre otros aspectos, tendrán en cuenta la relevancia y utilidad de las puntuaciones para los fines propuestos.


¿Cómo cuidar la validez de una prueba antes, durante y después de su administración?

La importancia de procurar la validez de una prueba radica, según Muñiz (2010), en que a partir de ésta se han de realizar inferencias que se toman como base para la toma de decisiones importantes acerca del futuro de un individuo, por lo que resulta fundamental que estas inferencias sean adecuadas y pertinentes.
A continuación se presentan algunas sugerencias para lograrlo:


Antes de la prueba‍:

a) Basar la realización del test, o bien su elección, en una teoría definida de acuerdo a lo que se pretende medir.
b) Definir el grupo a quien se dirigirá el test, basándose en las condiciones de los individuos como edad, nivel académico, etc.

Durante la prueba:
a) Estandarizar las instrucciones.
b) Utilizar la misma modalidad de prueba para todos los individuos (prueba por computadora o cara a cara, individual o grupal).
c) Según Kaplan y Saccuzzo (2006), los factores situacionales en la administración de la prueba pueden influir en los resultados, por lo que se recomienda tomar en cuenta aspectos como el rapport hacia los sujetos examinados, las expectativas del examinador y evitar el reforzamiento directo de respuestas específicas.

‍Después de la prueba‍:
a) Realizar las inferencias en la teoría base del test.



Reflexiones actuales

La definición de validez (constructo) que habla de "una prueba es válida si mide lo que debería medir", no viene en el artículo de Cronbach y Meehl de 1955, en donde inventaron el constructo. Tampoco viene en artículos más recientes, como el de Messick en 1989. Se parece más a la definición que dieron Cattell (1946) y Kelley (1927). Sin embargo, es una definición muy buena para validez, y en palabras de Borsboom, es "correcta y mejor que las definiciones recientes". La validez no es una propiedad del test sino una propiedad de la interpretación de la puntuación del test.
Si algo no existe, entonces no puede medirse. Si es que existe, pero no produce causalmente variaciones en los resultados del procedimiento de medida, entonces o no mide nada en absoluto, o mide algo totalmente diferente.

Validez es una propiedad, validación es una actividad. Validez no es un juicio. Es la propiedad que se juzga. En base a la validez se puede tomar una decisión.
No se llega a ningún lado diciendo que "la inteligencia es algo que se relaciona positivamente con el conocimiento general y negativamente con el comportamiento criminal". Si se ve la validez como correlación, entonces si dos constructos tienen una correlación perfecta, son realmente el mismo constructo pero con diferente nombre.
Un test es válido para medir un atributo si la variación en el atributo causa variación en la puntuación del test.

Referencias
Borsboom, D., Mellenberg, G. (2004). The concept of validity. Psychological Review, Vol. 111, No. 4, pp. 1061–1071.
Elousa, P. (2003). Sobre la validez de los tests. Psicothema, 15(2), 315-321.
Embretson, S. (2007). Construct validity: A universal validity system or just another test evaluation procedure? Educational Researcher, Vol. 36, No. 8, pp. 449–455.
Gronlund, N. (1983). Medición y evaluación en la enseñanza. México: Pax.
Kaplan, R. y Saccuzzo, D. (2006). Pruebas psicológicas. Principios, aplicaciones y temas. 6a. edición. México: Thomson.
Muñiz, J. (2010). Las teorías de los tests: teoría clásica y teoría de respuesta a los ítems (en línea). Papeles del psicólogo 31(1) pp. 57-66.