A bordo del Otto Neurath: LA EVALUACIÓN COMO MEDIDA Y COMO PREDICCIÓN

17 de marzo de 2010

LA EVALUACIÓN COMO MEDIDA Y COMO PREDICCIÓN

Una tesis OBVIA, pero que los profesores nos resistimos a aceptar como gato panza arriba, es que la nota que ponemos a un alumno es un acto de MEDICIÓN, lo que no implica que lo que estemos midiendo sea algo intrínsecamente cuantitativo, pero sí el que es, o debemos suponer que es, algo OBJETIVO. Asímismo, como toda medición, se trata también de una PREDICCIÓN.

Esto significa que, cuando afirmamos (mediante nuestro "juicio experto") que este examen tiene un 7, o este alumno, a la vista de su actividad durante el curso, etc., merece un 4, lo que estamos asegurando públicamente (o eso deberíamos), y comprometiendo nuestro juicio profesional al hacerlo, es que si ese mismo examen, o esa misma actividad durante el curso, fuera juzgada por un elevado número de profesionales cualificados, la MEDIA de sus evaluaciones no se alejaría más que marginalmente de la nota que estamos poniendo nosotros.

Que la evaluación del trabajo de un alumno durante un año en una asignatura lo juzgue una sola persona es algo que sólo se justifica por un argumento económico: sería carísimo que hubiera diez o veinte profesores alrededor de un mismo grupo de alumnos durante un año entero, para, cada uno de aquellos docentes, emitir un juicio que combinar con los de los otros profesores en una media.

Pero no se nos debe olvidar que el acto de poner una nota a un alumno o examen POR UN SOLO PROFESOR es, en el fondo, una apuesta muy arriesgada. ¿Cómo de arriesgada? Pues sería muy fácil de comprobar: tómense unos cuantos miles de exámenes de asignaturas diferentes, y dése cada examen a corregir a varias docenas de profesores (sin que puedan comunicarse entre ellos, claro está), con el fin de determinar la desviación típica de sus evaluaciones. Sería más difícil (y caro) de hacer para otros tipos de evaluación, pero no imposible.

Una vez encontrada esta desviación típica (tal vez diferente para distintas asignaturas o tipos de examen), ello quedaría como un dato PÚBLICO, de modo que, cuando un alumno recibiera un boletín de calificaciones, en cada asignatura constase dicha desviación (lo que quiere decir que, por término medio, si un profesor ha puesto un 5, la MEDIA de un elevado número de correcciones independientes de ese mismo alumno podría estar tantos o cuantos puntos o décimas por encima o por debajo del 5).

Ver esto así (que es, indudablemente, como DEBE contemplarse), nos haría, sin duda, ser más modestos a los profesores en nuestra tarea de evaluación.

7 comentarios:

José Luis Ferreira17 de marzo de 2010 a las 17:03
En mi departamento, los exámenes de reválida tras los curso de doctorado se corrigen independientemente por dos profesores, que luego hacen una puesta en común. La experiencia es que las diferencias no son grandes en la mayoría de las ocasiones, aunque de vez en cuando (¿uno de cada 20 exámenes?) la diferencia es sustancial (de 2 ó más puntos sobre 10).

Recordemos que cuando en un examen se juega mucho (como esa reválida), el problema es más importante y convendría hacer el esfuerzo de la corrección por más de un profesor, garantizar el proceso de revisión y tal vez la repetición del examen.

Cuando es un examen entre muchos, en un proceso de evaluación continua. Los errores de corrección en los distintos exámenes se deberían compensar.
ResponderEliminar
Respuestas
Adrian17 de marzo de 2010 a las 17:28
No es que usted lo haya dicho explicitamente, pero suponer que las notas se distribuyen segun una distribucion normal gaussiana, como hace suponer su imagen, es exagerado.

En lo demas, me quito el sombrero.
ResponderEliminar
Respuestas
telenieko17 de marzo de 2010 a las 19:16
Muy interesante. Solo un apunte:

La nota es un dato objetivo, y como tal está afectado por el entorno del profesor. Un profesor rodeado de alumnos mediocres mucho tiempo puntuará trabajos "no tan mediocres" alto. Pero un profesor rodeado de muy buenos alumnos mucho tiempo puntuará el mismo trabajo más bajo.

Simplemente porque su percepción del trabajo "suficiente","deficiente" y "excelente" se ve alterada por el nivel que ve dia a dia: "Lo que veo normalmente es lo normal(suficiente) lo que salga por arriba y por abajo es lo deficiente y lo excelente."
ResponderEliminar
Respuestas
Jesús P. Zamora Bonilla17 de marzo de 2010 a las 20:06
Jose Luis: muchos examenes corregidos por un solo profesor pueden hacer promediar sus errores de medida, pero no sus sesgos, entre ellos los indicados por Telenieko.
.
Adrián: no me juego el pescuezo a que la distribución es muy ajustada a la gaussiana, pero sí apostaría a que es relativamente campaniforme.
ResponderEliminar
Respuestas
J.E.18 de marzo de 2010 a las 1:34
Aparte del sesgo aportado por Telenieko (llamémoslo "sesgo de entorno"), también encuentro otro sesgo, que podríamos llamarlo el "sesgo de expectativas". Básicamente es "¿Que se supone que espera el profesor de esta evaluación?".

Por poner un ejemplo: En la carrera de Historia pueden convivir profesores que, en virtud de los datos que les llegan, se autoconvenzan que están enseñando a futuros profesores de Bachillerato y ESO y profesores que opinan que la carrera de Historia es para historiadores.
Los primeros pueden hacer incidencia en ciertos aspectos (Presentación formal, síntesis, capacidad para exponer los hechos) y los segundos pueden hacer incidencia en otros aspectos (Capacidad para explicar los hechos, profundización de la explicación...).

La única manera consiste en aunar criterios... pero ¿es posible?
ResponderEliminar
Respuestas
José Luis Ferreira18 de marzo de 2010 a las 1:56
Jesús:

Es claro que es así. Pero afortunadamente al alumno le evalúan varios profesores (en cada asignatura). Quiero decir con todo esto que el problema es menor de lo que pueda parecer a primera vista, aunque existir exista.

Por seguir abundando: En las asignaturas con varios grupos hacemos correcciones colectivas. Cada profesor corrige la misma pregunta de todos los grupos. Si hay un sesgo, es el mismo para todos y, además, está diluido por las demás correcciones.

No solo se aminora ese problema, sino que se consigue que en cada grupo los alumnos sepan que está en su interés acabar el programa y hacer ejercicios. No podrán presionar al profesor para que no entre un tema o que corrija "con comprensión". Y sirve para que los profesores vean si enseñan mejor o peor que el de al lado y ponerse las pilas en caso negativo.
ResponderEliminar
Respuestas
Ender18 de marzo de 2010 a las 10:19
Cuando yo estudiaba Industriales en la Politécnica de Madrid, las asignaturas de "Física" (1º), "Mecánica" (2º) y "Campos y Ondas" (3º), asignadas a una misma cátedra, eran muy controvertidas (por el temario extenso, el tipo de examen y otros motivos que no vienen al caso...).

El catedrático me aseguró en una entrevista (por aquel entonces yo dirigía la revista de la Escuela) que TODOS los exámenes finales, en línea con lo apuntado por José Luis Ferreira, se daban a corregir a dos profesores. Si ambas notas eran cercanas, se calificaba con la media. Si eran dispares, se volvían a corregir los exámenes afectados.

Está claro que los sesgos que apuntan los comentaristas siempre existirán. Pero desde luego supondría un incremento indudable en la objetividad frente a la calificación por un solo profesor.

Como dice José Luis, debería generalizarse éste método en aquellos exámenes particularmente importantes, o en asignaturas controvertidas.

En cuanto a "automatizar" este mecanismo utilizando la varianza "conocida", como apunta Jesús, sería muy interesante empezar a hacer algún piloto con alguna asignatura, que nos permita valorar la bondad del método, si la curva se ajusta o no a una normal, etc.

Saludos.
ResponderEliminar
Respuestas

Añadir comentario

Nota: solo los miembros de este blog pueden publicar comentarios.