Evaluation – Didac Sciences

Introduction et balises

L’évaluation peut avoir de nombreuses fonctions, mais celle qui nous intéresse ici est sa fonction didactique/pédagogique. Elle peut être définie de nombreuses manières en fonction de la branche des sciences humaines considérée. Toutefois, nous avons choisi de citer Elisabeth Verfaillie-Menouar qui définit l’évaluation comme « une prise d’information qu’effectue un enseignant (ou une personne déléguée) sur les performances et comportements mis en œuvre par les élèves en activité en les rapportant aux normes et objectifs fixés par l’enseignant, voir son délégué ou l’institution, ces normes et objectifs étant référés/référables à des disciplines scolaires ». Nous avons fait ce choix en raison de l’entrée didactique prise par l’auteure et de la dimension disciplinaire qui est prise en compte dans cette définition. De Ketele (1988) a également insisté sur le fait que l’évaluation avait, d’après lui, une visée de prise de décision. Notons que d’autres définitions existent en fonction que son auteur se situe dans le champ de la docimologique, de la philosophie, de la psychologie, de la pédagogique ou encore de la sociologie (Verfaillie-Menouar 2022). On voit à travers cette définition que l’évaluation a une portée, non seulement rétroactive, mais également prospective.

D’après Brigitte Petitjean, le but d’une évaluation est « d’apprécier le degré de réussite d’un apprentissage, en le rapportant à une norme fixée au préalable, en instaurant la possibilité d’une comparaison des performances d’un apprenant à l’autre, au sein d’un même niveau d’enseignement ». Les repères normatifs qui définissent les objectifs à atteindre peuvent être les référentiels, dont découlent les programmes propres aux différentes disciplines, mais il nous parait important de rappeler l’existence d’autres normes susceptibles de définir les objectifs à atteindre. Nous mentionnerons ici la norme dictée par les savoirs constitués de longue date, donc selon des repères épistémologiques. L’objectif défini par Petitjean peut être complété d’une visée formative en fonction du type d’évaluation mis en place.

En effet, on peut distinguer plusieurs types d’évaluation en fonction du moment auquel ces évaluations surviennent dans le processus d’apprentissage, mais également en fonction de leurs objectifs. On peut ainsi définir :

L’évaluation prédictive, également appelée évaluation diagnostic ou pronostic, qui a pour but d’évaluer les acquis des apprenants au début d’une séquence de cours (Petitjean, 1984). Elle s’organise donc en début de processus d’apprentissage et peut amener à différentes régulations qui auront pour but de permettre aux apprenants de remédier à leurs éventuelles lacunes en vue de l’acquisition de connaissances et compétences nouvelles.
L’évaluation sommative, qui peut parfois être certificative, prend généralement la forme de « bilans » et vise à permettre une prise de décision quant à l’orientation d’un élève. Notons que ce type d’évaluation a été décriée comme étant globale, synthétique, extérieure, implicite et normative (Petitjean, 1984). De nombreux effets pervers peuvent également être liés à ce type d’évaluation (anxiété provoquée chez les apprenants par l’évaluation qui diminue la fiabilité des résultats, évaluations arrivant en fin de période d’apprentissage quand il est trop tard pour apporter des corrections, …) (Petitjean 1984, Monney 2020). De plus, il est difficile d’identifier les obstacles cognitifs rencontrés par les apprenants lors de ces interrogations (Perrenoud, 1997). Les évaluations sommatives restent pourtant des évaluations courantes dans les écoles actuellement.
L’évaluation formative qui, si elle est effectuée en cours d’apprentissage, peut avoir un triple intérêt. En effet, ce type d’évaluation permet de rencontrer des fonctions de renforcement, de correction et de régulation des pratiques pédagogiques (Petitjean, 1984). Les évaluations formatives peuvent être qualifiées d’internes au processus d’apprentissage et sont plus focalisées sur l’apprenant que sur le produit fini (Petitjean, 1984). Ce type d’évaluation ne considère pas les erreurs des apprenants comme des échecs, mais comme de réelles opportunités de les soutenir et d’identifier leurs difficultés (Monney, 2020).

Notons que ces différents types d’évaluations ne s’opposent pas nécessairement, mais peuvent se compléter dans certaines approches (Lepareur, 2023).

En plus de différents types d’évaluation, il existe également différentes modalités parmi lesquelles on peut citer :

Les évaluations externes (dont les tests PISA sont un exemple), qui ne sont pas élaborées par des acteurs du processus d’apprentissage (chef d’établissement, gouvernement, …). C’est avec des objectifs de contrôle et/ou d’orientation que ces modalités d’évaluations sont mises en place (Petitjean, 1984).
Les évaluations internes, qui sont élaborées par des acteurs du processus d’apprentissage (apprenants, enseignants, …). Au sein de cette modalité, on peut encore définir deux subdivisions, les hétéroévaluations (évaluateur et évalué étant deux personnes distinctes) et les autoévaluations (évaluateur et évalué étant confondus). Remarquons qu’un prérequis aux autoévaluations est l’évaluation formative afin de permettre aux apprenants de développer cette capacité (Petitjean, 1984).

Un point auquel il faut être particulièrement attentif lors de l’élaboration d’une évaluation est la cohérence des objectifs et des compétences réellement évaluées. Cette cohérence est couramment appelée « validité » de l’évaluation. Il existe différents moyens d’estimer la validité d’une évaluation (voir partie écrits scientifiques).

Une fois que le type ainsi que la modalité de l’évaluation ont été définis et qu’on estime que cette dernière est valide du point de vue des objectifs poursuivis, il est bon de se questionner sur la notation de telles évaluations. En effet, de nombreux biais cognitifs, conscients ou non, sont susceptibles d’influencer positivement ou négativement les notes des apprenants (effet Pygmalion, d’assimilation, de contraste, …). Bien que tous ces biais soient généralement inconscients, ils sont pourtant bien présents et il convient de tenter de les réduire dans l’intérêt des apprenants. Pour cela, l’utilisation d’une grille d’évaluation critériée reprenant des informations, non seulement sur le contenu attendu, mais également sur la forme ou les démarches mises en place par les apprenants peut représenter une piste de solution. Ces grilles sont également un moyen d’alléger le travail de correction de l’évaluateur, mais peuvent également représenter un objet d’apprentissage quand elle est constituée avec les apprenants, en les entrainant à l’autoévaluation (Petitjean, 1984).

En ce qui concerne l’évaluation des sciences de manière plus ciblée, la recherche de Verfaillie-Menouar de 2022 menée en France a permis de mettre en évidence plusieurs éléments. Le premier est que, de manière générale, la passation des évaluations de sciences se faisait de manière plutôt classique et protocolaire. Toutefois, il semblerait que les enseignants anticiperaient l’épreuve en orientant les apprenants sur les questions possibles en guise de révision avant l’évaluation. Un second élément concerne les consignes. Elles sont généralement lues à voix haute et explicitées. Une attention particulière peut être portée à la forme des réponses attendues en fonction des questions posées. Finalement, pendant la phase d’échange qui suit l’évaluation, les apprenants expliquent parfois ne pas avoir bien compris ce qu’on attendait d’eux pendant l’évaluation. Cela viendrait du fait que les apprenants ont du mal à transposer la matière vue dès qu’une situation s’éloigne des simples questions de restitution. Il a également été mis en lumière que les évaluations de sciences se centrent beaucoup sur la maitrise langagière et assez peu sur les niveaux de raisonnements scientifiques (Lepareur 2023, Monney 2020).

Actuellement, la préconisation est à l’organisation d’évaluations formatives et ce pour plusieurs raisons, mais principalement car elles ont pour vocation d’induire une régulation des apprentissages (Perrenoud, 1997). Ces régulations peuvent prendre plusieurs formes et ont des dimensions à la fois cognitives et socioaffectives. Il est important de noter que, bien qu’elles les incluent, les régulations ne se limitent pas aux simples feedbacks (Perrenoud, 1997). En effet, pour être efficaces, les régulations doivent prendre en compte de nombreux paramètres, à la fois généraux et particuliers, ce qui implique généralement que pour pouvoir réguler des processus d’apprentissage, l’enseignant doit consacrer beaucoup de temps à un seul apprenant, ce qui n’est généralement pas possible dans la configuration des classes qu’on connait traditionnellement (Perrenoud 1997, Monney 2020). Remarquons cependant que l’évaluation n’a pas le monopole des régulations et que ces dernières peuvent être de natures variées et provenir d’acteurs différents (enseignants, autres apprenants, intervenants extérieurs, aide du numérique, …). Notons également que les apprenants ont tous, de manière variable, une capacité d’autorégulation et que, chez certains, cette dernière complète les régulations externes et peuvent même les remplacer. Toutefois, une pédagogie trop frontale limite intrinsèquement les possibilités de régulations en séparant les temps d’évaluation et ceux d’apprentissage, même en proposant une régulation rétroactive après la correction de ladite interrogation (Perrenoud, 1997).

En conclusion, bien qu’il existe autant de manière de penser l’évaluation et les régulations qui en découlent qu’il existe de conceptions de l’enseignement, un point important est de questionner sa pratique et de s’assurer de l’existence d’un lien et d’une cohérence entre les objectifs poursuivis, l’évaluation et les régulations apportées aux apprenants. Ce sont des réflexions qui dépassent en bonne partie les disciplines et qui peuvent donc être transférées au cours de sciences et plus largement de STEM, entre autres.

Entrées faciles

L’article de Brigitte Petitjean permet d’avoir un premier aperçu des différents types d’évaluations et des « effets pervers » que certains peuvent avoir. De plus, cet écrit distingue les différentes fonctions de l’évaluation, les exercices des problèmes ainsi que les différents niveaux de régulation possibles. Les différentes modalités et techniques d’évaluations, tout comme leurs limites, sont discutées. Cet article accessible permet d’avoir une première vision du caractère complet et interconnecté du processus d’évaluation.

Un second article permettant de se familiariser avec les problématiques liées à l’évaluation a été rédigé par Philipe Perrenoud. En effet, celui-ci aborde des notions telles que celle du feedback et son importance dans l’activité de régulation, mais également les conditions auxquelles ces régulations sont efficaces. En plus de cela, on retrouve une distinction entre les régulations portant sur les activités et celles portant sur les processus d’apprentissage des apprenants ainsi qu’une discussion sur la place de l’évaluation formative. En lien avec ces notions, l’auteur présente également l’intérêt de la différenciation pédagogique pour répondre à « l’indifférence aux différences » des apprenants.

Ecrits scientifiques

La littérature sur le sujet de l’évaluation est très riche. Nous nous contenterons donc ici de proposer quelques articles visant des points particuliers de l’évaluation en sciences, sans prétendre à une liste exhaustive.

Le premier document que nous citons est l’introduction de Nicolas Décamp et Denise Orange Ravachol du numéro 27 de la revue « Recherches en didactique des sciences et des technologies ». Cette présentation est un bon moyen de mettre un premier pied dans les écrits scientifiques liés à l’évaluation en faisant un tour d’horizon de notions centrales comme celle de compétence et les difficultés liées à leur évaluation, les rétroactions et régulations possibles en classe, la conception d’une évaluation, l’importance de prendre en compte la dimension disciplinaire des savoirs dans la réflexion autour de l’évaluation, l’interdisciplinarité liée au processus évaluatif ainsi qu’un mot sur l’évaluation dans un cadre international.

Un deuxième écrit que nous recensons est celui d’Elisabeth Verfaillie-Menouar. Cet article traite des variations qu’il existe en termes d’évaluation en fonction des différentes disciplines, dont les sciences, mais présente également un modélisation détaillant chacun des moments de l’évaluation. L’auteure structure l’évaluation en six micro-phase, qu’elle détaille de manière éclairante. L’article s’attèle finalement à caractériser l’évaluation en fonction des différentes disciplines.

Une autre « entrée scientifique » que nous listerons ici est la note de synthèse rédigée par Nathalie Sayac pour l’habilitation à diriger des recherches. Dans ce document, on retrouve une partie importante dédiée à l’analyse didactique de situation d’évaluation dans le cadre du cours de mathématiques, ce qui n’est pas notre sujet central, mais on y trouve également une revue des littératures francophones et anglophones portant sur l’évaluation qui peut intéresser l’évaluation en sciences. La partie francophone de cette revue littéraire aborde des sujets tels que la régulation, la validité, la pertinence ainsi que la fiabilité de l’évaluation.

Dans un autre article de Monney, Couture, Duquette et Boulay (2020), ce sont les méthodes de rétroaction que les enseignants de primaire de sciences et technologies peuvent mettre en place qui sont présentées, et plus particulièrement comment permettre un arrimage entre les activités didactiques mises en place et les activités d’évaluation des enseignants. Un autre point intéressant de cette recherche est qu’elle prend la forme d’une recherche collaborative permettant aux enseignants et aux chercheurs de croiser leurs regards et d’ancrer la recherche dans le quotidien des praticiens.

La recherche de Lepareur, Marlot et Ducrey Monnier (2023) traite de deux questions. La première traite de l’alignement entre l’enseignement des sciences et son évaluation tandis que la seconde se penche sur les déterminations pesant sur les pratiques évaluatives des enseignants.

Un autre écrit intéressant de Nadine Grapin, Marc Vantourout et Brigitte Grugeon-Allys (2022) porte sur la conception de l’évaluation en tant que telle, mais également sur l’interprétation des résultats que les élèves vont produire lors de cette évaluation, tout en définissant cette notion de validité selon deux approches. La première approche, plutôt anthropologique qui est plus liée à l’analyse d’évaluations à grande échelle, et la seconde approche, psycho-didactique, qui vise l’élaboration et l’analyse d’évaluations au sein d’une classe.

Finalement, l’article de Denise Orange Ravachol et Catherine Boyer (2022) aborde le fait qu’il existe différents « mondes » (la famille, la classe, les réseaux sociaux, …) et que les apprenants passent constamment d’un monde à l’autre. L’article postule que certaines difficultés que les apprenants pourraient rencontrer dans le cadre d’une évaluation en sciences viendraient du fait qu’ils n’interprètent pas la situation décrite dans l’évaluation dans le même monde que celui dans lequel l’avait pensé l’enseignant, chaque monde étant caractérisé, notamment, de son paradigme de représentation. Cet article appuie ses propos sur un exemple lié à l’éducation à l’alimentation.

Pistes de réflexion pour les TFE et mémoires

A venir.