Dado que en el lenguaje coloquial tienen significados muy similares, es fácil confundir los términos de fiabilidad y validez cuando hablamos de ciencia y, específicamente, de psicometría.

Con este texto pretendemos dilucidar las diferencias principales entre la fiabilidad y la validez. Esperemos que os resulte útil para aclarar esta duda tan habitual.

¿Qué es la fiabilidad?

En psicometría, el concepto “fiabilidad” hace referencia a la precisión de un instrumento; concretamente, los coeficientes de fiabilidad nos informan de la consistencia y la estabilidad de las medidas tomadas con dicha herramienta.

Cuanto mayor sea la fiabilidad de un instrumento, menor será la cantidad de errores aleatorios e impredecibles que aparecerán al utilizarlo para medir determinados atributos. La fiabilidad excluye los errores predecibles, es decir, los que se hallan sometidos a control experimental.

Según la teoría clásica de los tests, la fiabilidad es la proporción de la varianza que queda explicada por las puntuaciones verdaderas. Así, la puntuación directa en una prueba se compondría de la suma del error aleatorio y la puntuación verdadera.

Los dos componentes principales de la fiabilidad son la estabilidad temporal y la consistencia interna. El primer concepto indica que las puntuaciones cambian poco al medirlas en distintas ocasiones, mientras que la consistencia interna hace referencia al grado en que los ítems que componen el test miden el mismo constructo psicológico.

Por tanto, un coeficiente de fiabilidad elevado indica que las puntuaciones en una prueba fluctúan poco a nivel interno y en función del tiempo y, en resumen, que el instrumento está ausente de errores de medición.

Definición de validez

Cuando hablamos de validez nos referimos a si el test mide correctamente el constructo que pretende medir. Este concepto se define como la relación entre la puntuación obtenida en una prueba y otra medida relacionada; el grado de correlación lineal entre ambos elementos determina el coeficiente de validez.

Asimismo, en la investigación científica una validez elevada indica el grado en que los resultados obtenidos con un determinado instrumento o en un estudio se pueden generalizar.

Existen distintos tipos de validez, que dependen del modo en que se calcule; esto hace que se trate de un término con acepciones muy diversas. Fundamentalmente podemos distinguir entre validez de contenido, validez de criterio (o empírica) y validez de constructo.

La validez de contenido define hasta qué punto los ítems de un test psicométrico son una muestra representativa de los elementos que componen el constructo a evaluar. El instrumento debe incluir todos los aspectos fundamentales del constructo; por ejemplo, si queremos hacer una prueba adecuada para medir la depresión deberemos incluir necesariamente ítems que evalúen el estado de ánimo y la disminución del placer.

La validez de criterio mide la capacidad del instrumento para predecir aspectos relacionados con el rasgo o área de interés. Por último, la validez de constructo pretende determinar si el test mide aquello que pretende medir, por ejemplo a partir de la convergencia con las puntuaciones obtenidas en pruebas similares.

Diferencias entre fiabilidad y validez

Aunque estas dos propiedades psicométricas están íntimamente relacionadas, lo cierto es que hacen referencia a aspectos claramente diferenciados. Veamos en qué consisten estas diferencias.

1. El objeto de análisis

La fiabilidad es una característica del instrumento, en el sentido de que mide las propiedades de los ítems que lo componen. Por contra, la validez no se refiere exactamente al instrumento sino a las generalizaciones que se hacen a partir de los resultados obtenidos a través de éste.

2. La información que proporcionan

Aunque es un modo un poco simplista de plantearlo, a grandes rasgos se suele afirmar que la validez indica que una herramienta psicométrica mide realmente el constructo que pretende medir, mientras que la fiabilidad se refiere a si lo mide de forma correcta, sin errores.

3. El modo en que se calculan

Para medir la fiabilidad se utilizan fundamentalmente tres procedimientos: el método de las dos mitades, el de formas paralelas y el test-retest. El más usado es el procedimiento de las dos mitades, en el cual se dividen los ítems en dos grupos una vez contestado el test; después se analiza la correlación entre las dos mitades.

El método de las formas paralelas o alternativas consiste en crear dos tests equivalentes para medir hasta qué punto correlacionan los ítems entre ellos. El test-retest se basa sencillamente en pasar la prueba dos veces, en condiciones lo más similares posible. Ambos procedimientos se pueden combinar, dando lugar al test-retest con formas paralelas, que consiste en dejar un intervalo de tiempo entre la primera forma del test y la segunda.

Por su parte, la validez se calcula de formas distintas en función del tipo, pero en general todos los métodos se basan en la comparación entre la puntuación en el test objetivo y otros datos de los mismos sujetos en relación a rasgos similares; el objetivo es que la prueba pueda actuar como predictor del rasgo.

Entre los métodos utilizados para evaluar la validez encontramos el análisis factorial y la técnica de matrices multimétodo-multirrasgo. Asimismo, la validez de contenido se determina con frecuencia mediante análisis racionales, no estadísticos; por ejemplo, incluye la validez aparente, que hace referencia al juicio subjetivo de personas expertas sobre la validez del test.

4. La relación entre ambos conceptos

La fiabilidad de un instrumento psicométrico influye en su validez: cuanto más fiable sea, mayor será también su validez. Por tanto, los coeficientes de validez de una herramienta siempre son inferiores a los de fiabilidad, y la validez nos informa indirectamente sobre la fiabilidad.