Vie de la discipline

La question de l'évaluation au baccalauréat

Paul Caron, professeur de SES au lycée Auguste-Mariette de Boulogne-sur-Mer (62)

Depuis trente ans, la question de l'évaluation de l'épreuve de SES au baccalauréat anime la discipline, ses enseignants et parfois l'Inspection puisque c'est à B. Simler (alors IPR de l'académie de Lille) que revient la paternité des premiers travaux sur ce thème. C'est aussi à son initiative qu'a eu lieu l'université d'été du Touquet, en 1990, qui devait conduire à mettre en place ce que l'on appelle maintenant la "question de synthèse".

Pour savoir où l'on va, et au moins savoir où l'on est, il est préférable de savoir d'où on vient. En effet, la forme de l'épreuve proposée à nos élèves le jour du bac a une histoire liée au projet fondateur des SES.

Premières instructions et premières difficultés

Le texte initial

La circulaire du 14 octobre 19681 (on peut penser que son auteur était le doyen Palmade) fixait en ces termes les caractéristiques de l'exercice :

"[...] une épreuve combinant les qualités probantes d'une dissertation et d'un commentaire de documents. [...] Il s'agira, non pas de répondre à une série de questions isolées mais de traiter un problème (dont la formulation simple mais, autant que possible originale, ne coïncidera pas avec celle d'une "question de cours"). Il conviendra de manifester d'abord qu'on l'a compris, en le posant d'une façon claire et réfléchie, puis d'en articuler le développement selon un plan non pas conforme à telle ou telle tradition rhétorique de la division des devoirs en deux, trois ou x parties, mais net, adéquat au sujet, logiquement organisé [...]. Pour aider les candidats, limiter l'effort de mémoire (indispensable, dans une mesure raisonnable) qui leur est tout de même demandé, éviter autant que possible que leurs facultés de raisonnement ne s'exercent dans le vide ou dans le vague, on leur fournira d'autre part une documentation [...] dont ils devront se servir comme d'un ensemble de références destinées à nourrir leur réflexion et à asseoir leur travail sur des bases positives, sans y chercher un prétexte à paraphrase ou à commentaire systématique et détaillé."

Cette citation me semble nécessaire pour déterminer quelles étaient les attentes des concepteurs de la discipline. Ce qui ne signifiait en aucun cas que ces principes devaient avoir un caractère immuable, puisque le texte de cette circulaire se terminait en précisant que la formule adoptée était évolutive dans sa forme : "elle pourra, bien entendu, recevoir les aménagements et les améliorations que rendraient éventuellement nécessaires [...] les échanges de vues qui donneront prochainement aux professeurs l'occasion d'exprimer leurs opinions et leurs désirs."

Quelques remarques sur ce texte

Le libellé du sujet tout d'abord : celui-ci devait amener le candidat à traiter un problème. Si ce souci a été permanent, il s'exprime parfois davantage par le point d'interrogation qui clôt le libellé que par sa formulation. Dire que cette formulation doit être "simple" ne signifie pas que le sujet doive l'être, d'autant plus que le problème doit, de préférence, être original au sens où il ne s'agit pas d'une question de cours.

Le rôle du dossier documentaire ensuite : l'originalité de l'épreuve réside dans le fait que les exigences sont à la fois celles de la dissertation et du commentaire de documents. La formulation semble indiquer que le dossier documentaire, dont l'importance fut longtemps très variable, doit nécessairement être utilisé par le candidat. Ce qui ne signifie pas qu'il devait mobiliser l'ensemble des informations qu'il contenait compte tenu de la liberté d'argumentation qui lui était laissée. Il s'agit de "références" mises à sa disposition... et qu'il ne doit, en principe, pas ignorer.

On peut être surpris de la liberté laissée au candidat quant à la forme du devoir. Le choix de la méthode d'exposition est en effet laissé à son appréciation. La seule exigence concerne le fait que le développement soit adéquat au sujet et logiquement organisé. Foin de la "tradition rhétorique".

Les premières difficultés2

Malgré la remarque terminale précisant le caractère évolutif d'une épreuve novatrice dans sa forme, il faudra attendre longtemps de nouveaux textes organisant l'épreuve de baccalauréat en SES. De nombreux problèmes devaient cependant surgir très vite, notamment lors des commissions d'harmonisation ou des stages de Sèvres. H. Lanta, alors chargé de mission d'Inspection générale, s'en est fait l'écho à travers deux articles parus dans DEES (n° 23 et n° 26). Quels sont les principaux problèmes qu'il aborde ?

La diversité des pratiques et des contenus enseignés est préjudiciable à une communauté d'attentes de la part des correcteurs à l'égard des élèves. La solution qu'il propose consiste en "un renforcement sensible du rôle des documents". Au-delà des aspects formels liés à leur utilisation, il considère que l'on doit sanctionner "l'absence dans le devoir d'un fait, d'une idée, d'une évolution importante se trouvant dans tel ou tel document."

H. Lanta déplore également "la difficulté excessive de certains des sujets proposés [...]. Certains des documents les accompagnant étant eux-mêmes fort complexes". Je ne suis pas convaincu que la question de la difficulté des sujets a été résolue. Ceux soumis aux candidats en France métropolitaine en 2005 étaient compliqués. L'ambition contraint les correcteurs à en rabattre en ce qui concerne les attentes. Il me semble également que cela constitue un facteur de perturbation de la correction qui risque de se faire sur des critères plus subjectifs et moins sur la bonne compréhension du sujet, les connaissances et l'utilisation judicieuse des documents par les candidats.

Le texte de la circulaire de 1968 laissait ouverte la question de la forme du devoir qui n'était absolument pas imposée aux candidats. Il leur suffisait de montrer que le sujet était correctement compris et de le traiter à travers un développement "logiquement organisé". Il semble que l'aspect formel ait pris assez rapidement une importance qu'il n'avait pas initialement. En effet, dans l'article paru dans DEES n° 23,

H. Lanta fait référence à des exigences de la part des correcteurs en matière de parties et sous-parties du devoir. Cependant "l'unanimité paraît s'être réalisée sur la nécessité de ne pas donner trop d'importance aux aspects quelque peu formels de l'exercice de la dissertation".

Cet article sera suivi de beaucoup d'autres. En octobre 1980, deux animateurs du CRDP de Paris font circuler un texte dans lequel ils expriment "quelques réflexions rageuses sur le bac, proposées à la discussion". Leur acrimonie porte sur le fonctionnement des commissions d'harmonisation et, au-delà, sur la qualité et la difficulté des sujets, les attentes à l'égard des élèves et la pertinence de la note.

Au début des années 1980, plusieurs numéros de DEES se font l'écho des questions exprimées par les enseignants concernant l'épreuve du baccalauréat et des problèmes de correction qu'elle pose. Le compte rendu du travail effectué par les professeurs de l'académie de Clermont-Ferrand en 19823 est à cet égard significatif de préoccupations récurrentes et qui n'ont cessé d'animer la discipline depuis près de quarante ans ; on retiendra : la difficulté des sujets4, les critères de notation, la "revendication d'indulgence", des "attentes réalistes par rapport aux possibilités des élèves", l'efficacité incertaine de la commission d'entente "considérée comme une perte de temps compte tenu de la stérilité de son travail" (et pourtant seuls quatorze professeurs de SES corrigeaient le bac dans cette académie en 1982). Mais alors, s'inquiètent les collègues, la façon de noter de chacun risque d'être polluée par beaucoup d'implicite et d'éléments subjectifs. "La mise en lumière de critères explicites de notation est donc dès lors un impératif." Il est par conséquent proposé de tenir compte dans la notation de la pertinence de l'analyse des documents et des apports de connaissances, de la bonne compréhension du sujet et enfin des qualités formelles du devoir. Une première grille d'évaluation en quelque sorte.

Ce sont les mêmes critères d'évaluation que l'on retrouve par exemple dans une fiche établie par un professeur du lycée de Sisteron5 qui propose un barème de correction articulé autour de quelques grandes capacités (qu'il explicite ensuite) : comprendre la question posée ; utiliser les informations fournies dans les documents ; mobiliser ses connaissances pour approfondir la question ; construire une réponse ordonnée en la rédigeant correctement.

Un problème récurrent à l'origine de nouvelles instructions

Les articles publiés dans DEES n'épuisent pas la multiplicité des stages et réunions diverses qui se déroulent dans toutes les académies concernant l'épreuve du baccalauréat et subséquemment l'enseignement des SES. À titre d'illustration, citons un stage organisé conjointement par l'APSES de Nancy-Metz et la Mission académique de formation en 1983-1984. Du compte rendu de ce stage6, il ressort le besoin unanimement ressenti de préciser les capacités attendues des élèves dans le cadre de la dissertation (répondre au sujet, argumenter, structurer). De cette harmonisation des exigences doit, bien sûr, découler un ajustement des pratiques. La réflexion conduit les enseignants à mettre en place un barème de correction. Le compte rendu estime en conclusion que "la mise en évidence [...] de la grande diversité des critères d'évaluation retenus par chacun conduit à faire reposer la notation à l'épreuve écrite du baccalauréat sur le plus petit dénominateur des exigences de tous les collègues ; dans la pratique, le plus souvent, chacun d'entre nous évalue une copie sur ses propres critères et non pas sur ceux du collègue qui a formé les élèves".

On s'aperçoit finalement que le souhait du rédacteur des premières instructions concernant l'épreuve de bac, à savoir procéder à des "échanges de vues qui donneront prochainement aux professeurs l'occasion d'exprimer leurs opinions et leurs désirs", a été largement exaucé.

Il semble, cependant, que les griefs à l'égard des sujets et les inquiétudes en ce qui concerne la cohérence de la notation se soient davantage exprimés à la fin des années 1970 et au cours des années 1980 que durant la première dizaine d'années d'existence de la discipline. Le problème n'existait pas. Entendons par là que la question des sujets et de la correction n'existait pas en tant que problème fondamental pour les professeurs. Des débats ont probablement eu lieu mais ils n'ont guère laissé de traces. La très grande hétérogénéité du corps était peut être compensée par l'effet socialisateur des stages de Sèvres auxquels participaient, durant une semaine, tous les lauréats du Capes. Ces stages ont été supprimés en 1978.

De nouvelles instructions seront rédigées en 19837, soit quinze ans après les premières. La formule adoptée pour l'épreuve, "celle d'une dissertation appuyée sur un dossier", est maintenue, de même que la nature du sujet qui ne consiste pas en une "question de cours" mais "doit inviter le candidat à poser [...] un problème". La finalité du dossier documentaire reste identique (les termes employés sont les mêmes) mais des précisions sont apportées concernant le volume du dossier (sept à huit documents) et la nature des documents : un équilibre doit être recherché entre textes et documents statistiques ; en outre, le dossier doit apporter des informations "principalement factuelles, plutôt que de suggérer des interprétations toutes faites". L'étude des sujets de bac, au cours des années 1980, ne fait cependant pas apparaître de modifications sensibles dans la nature des documents8.

Incertitudes quant à l'évaluation et nouvelle épreuve

Les travaux de l'Académie de Lille

Au milieu des années 1980, B. Simler, alors IPR dans l'académie de Lille, va conduire un ensemble de travaux dont le point de départ est constitué par un double constat : "les mauvais résultats obtenus par l'académie de Lille au baccalauréat, et plus particulièrement au baccalauréat B9" et la baisse de ceux-ci, dans l'académie de Lille notamment. Les recherches menées vont très vite déboucher sur une investigation des problèmes posés par l'évaluation dans notre discipline dans le cadre du bac.

Entre 1983 et 1984, le taux de réussite au bac B passe de 63,9 % à 58,2 % (à titre de comparaison, il a été de près de 85 % en 2005 pour le bac ES). Dans l'académie de Lille, le taux de réussite n'est alors que de 53,4 %10. Rappelons qu'à cette époque la moyenne obtenue par les candidats à l'épreuve de SES se situe entre 8 et 9.

La méthode adoptée par B. Simler consiste à faire corriger le même paquet de copies par des professeurs d'académies différentes (Lille, Poitiers et Nancy-Metz). On peut toujours discuter de la pertinence de la procédure et du choix des correcteurs, il n'en demeure pas moins que sur les 120 copies corrigées la moyenne est plus d'un point inférieure à Lille qu'à Poitiers ou à Nancy-Metz. Par ailleurs, il se trouve que, copie par copie, les appréciations - et les notes - peuvent être très différentes d'un correcteur à un autre. Ce dernier constat, chacun a pu le faire lors des commissions d'harmonisation lorsque nous corrigeons les "copies test". Il apparaît cependant que, sur le même critère d'appréciation, les jugements de deux correcteurs peuvent être contradictoires : "Une assez bonne utilisation des documents" (note 15) et "Les documents sont mal exploités" (note 5). Et cependant les deux correcteurs semblent d'accord pour considérer que les documents du dossier doivent être utilisés pour traiter le sujet.

Entre 1979 et 1985, nous avons comparé les résultats obtenus par les élèves du lycée Auguste-Mariette de Boulogne-sur-Mer aux trois bacs blancs avec ceux de l'examen, les coefficients de corrélation se situent entre 0,26 et 0,80. Ces deux extrêmes sont cependant atypiques, le plus souvent le coefficient est de l'ordre de 0,50.

"Bref, il existe aujourd'hui des doutes sur le contenu à évaluer et ce qu'il faut d'abord évaluer" (B. Simler, 1987). Ce constat va conduire d'une part à une plus grande précision dans les programmes pour tenter de réduire l'incertitude relative à ce qu'il faut enseigner - et donc évaluer - en matière de contenu de connaissances, d'autre part à concevoir une université d'été consacrée aux "modes d'évaluation en sciences économiques et sociales"12.

Si on retient surtout de l'université d'été du Touquet de juillet 199013 (qui se poursuivra à Lille en 1991, 1992 et 1993) la mise en place de la "question de synthèse étayée par un travail préparatoire", son objet initial était de parvenir à une harmonisation améliorée des critères d'évaluation pour le bac. Je ne suis pas totalement convaincu que ce nouveau type d'épreuve contribue à une notation plus cohérente, ni en ce qui concerne le travail préparatoire ni pour ce qui est de la synthèse.

Mais, avant d'aller plus loin, je voudrais dire quelques mots d'un travail conduit à la même époque et s'inscrivant dans la même perspective.

Une recherche trop méconnue

Le travail le plus élaboré concernant la question de l'évaluation au bac B est, à ma connaissance, celui réalisé par É. Chatel14 au début des années 1990. Un résumé en a été présenté dans le n°100 (juin 1995) de DEES. Les données portent sur 4 302 élèves ayant passé l'examen en 1992 dans les académies de Paris, Versailles, Rouen, Montpellier et Lille. L'auteur compare notamment les résultats obtenus par les élèves au bac dans cinq disciplines (SES, philosophie, mathématiques, histoire-géographie et LV1) avec les notes au cours de l'année. La corrélation est faible en ce qui concerne notre discipline : 0,410 (elle l'est plus encore - 0,367 - si on la calcule en tenant compte du seul troisième trimestre). Seule la philosophie fait moins bien (0,34), pour les mathématiques et la LV1 le coefficient de corrélation est de 0,64. Il faut cependant noter une sorte de phénomène de compensation puisque, toutes disciplines confondues, on arrive à un coefficient de 0,71. En effet, chacun d'entre nous a pu observer que les résultats d'ensemble au bac reflètent quand même assez largement un niveau général de l'élève15.

Plusieurs éléments peuvent expliquer la faible corrélation mise en évidence entre les notes attribuées aux élèves en SES au cours de l'année scolaire et les résultats au baccalauréat.

Le type d'épreuve, la dissertation, oblige à évaluer simultanément un ensemble de compétences étroitement liées. On retrouve d'ailleurs le même problème en philosophie et, à un degré moindre, en histoire-géographie. La moyenne trimestrielle n'est en outre pas attribuée en fonction des seuls résultats aux exercices de type bac, et différents éléments entrent en jeu dans la notation au cours de l'année. La note a aussi une fonction de régulation des apprentissages, et il est plus aisé de pratiquer une évaluation "normative" à l'occasion d'une dissertation que si l'épreuve consiste à résoudre un problème, à réaliser des exercices (indépendants les uns des autres) ou en un test de langue étrangère ; plus aisé aussi de surnoter un élève travailleur et en progrès de façon à l'inciter à persévérer dans ses efforts. Il me semble inutile de développer ici tout ce qui peut interférer dans l'appréciation chiffrée portée sur un élève, ces choses sont bien connues16.

Plus fondamentalement, il n'est pas garanti que le professeur de la classe et celui qui corrige la copie de l'élève le jour de l'épreuve aient la même appréciation quant aux compétences à évaluer à travers la dissertation. Même s'il existe (mais existe-t-il ?) entre les professeurs de la discipline une convention de qualité d'une copie et des compétences qu'elle doit révéler, celles-ci font souvent l'objet d'interprétations personnelles donc différentes selon les enseignants et ne se traduit pas nécessairement par un consensus sur la note à attribuer. Soit que l'on accorde plus ou moins d'importance à la compétence considérée, soit que, bien qu'en accord sur la compétence attendue, il y ait désaccord sur la manifestation de celle-ci dans la copie.

Enfin, dans un registre voisin, je ne suis pas absolument convaincu que tous les enseignants aient exactement la même perception de ce qu'est "savoir". On peut concevoir ce terme comme un substantif et en avoir une approche un peu réifiée, il existe alors un texte du savoir que l'élève doit apprendre et être capable de reproduire dans un devoir sous la forme de définitions qu'il récite, de mécanismes ou de faits qu'il présente. On peut aussi considérer "savoir" comme verbe, dans ce cas on privilégiera la démarche, la réflexion personnelle de l'élève, la logique d'exposition peut-être plus que le contenu exposé. Certes, ces deux acceptions, loin d'être contradictoires, se complètent. Mais quand certains correcteurs mettent plutôt l'accent sur la première, d'autres valorisent davantage la seconde. Il me paraît évident que la tendance à privilégier l'une ou l'autre par un professeur au cours d'une année va conduire ses élèves à développer une conception de ce qu'est "savoir" en SES qui sera voisine de la sienne, ceci orientera leur façon de travailler et donnera une certaine forme à leur devoir. Laquelle peut ne pas être valorisée de la même façon par tous les correcteurs.

Une université d'été consacrée à l'évaluation

Les motifs de l'université d'été ont été présentés par B. Simler dans le n° 71 de DEES (mars 1988), c'est-à-dire deux ans avant sa réalisation. Un ensemble de travaux et de réflexions avaient été menés dans différentes académies, qu'il fallait "fédérer sous l'autorité de l'Inspection générale". Il s'agissait, à cette occasion, de "faire avancer le consensus en matière d'évaluation sommative". Le souci le plus immédiat étant la question du bac. On ne trouve dans le texte de B. Simler aucune référence à une quelconque modification de l'épreuve, tout juste évoque-t-il un "climat d'innovation" pouvant régner lors de cette rencontre. Pour avoir participé à celle-ci, je n'ai pas le souvenir que la question de la nature de l'épreuve ait été immédiatement abordée, il s'agit du résultat d'un cheminement collectif.

En ce qui concerne les connaissances attendues des élèves le jour du bac, un travail a été conduit portant sur une liste de termes et sigles "censés être le minimum connu d'un élève moyen de terminale B dans le cadre des programmes actuels". Outre que la formulation n'est pas très heureuse, on se rend compte avec le recul, et à la lumière de ce qui figure actuellement dans les programmes, que cette liste était extrêmement ambitieuse17 (j'ai compté 471 termes). Toutefois, l'essentiel est peut-être ailleurs. Si cette production d'une liste de termes dont on peut demander aux élèves la définition dans le cadre de l'épreuve terminale s'inscrit dans un louable souci d'harmonisation et de limitation (près de 500 quand même !) des exigences le jour de l'examen, elle risque aussi de conduire à orienter l'épreuve dans un certain sens : on va demander aux élèves de définir des mots. Ceci ne me semble pas s'inscrire dans la logique de conceptualisation telle qu'elle est présentée notamment dans les objectifs de référence pour la classe de seconde et qui correspond davantage à une démarche qu'à une capacité à mémoriser.

Si l'idée d'une modification du type d'épreuve s'est assez rapidement imposée, la forme qu'elle devait prendre fut longue à concevoir. Fallait-il maintenir la dissertation ? Sous quelle forme ? Quel autre type d'épreuve lui associer ? Quelles compétences18 chaque type d'épreuve devait-il permettre d'exprimer ? De groupes de travail en expérimentations, de discussions au sein de l'APSES19 en stages de suivis de l'université d'été, il fallut plusieurs années pour pouvoir goûter au plaisir du bac nouveau.

La phase d'expérimentation a essentiellement porté sur le nouveau type d'épreuve, elle a également concerné la dissertation sous sa forme un peu modifiée20. Au cours de l'année scolaire 1992-1993, 43 professeurs ont proposé à leurs élèves une dissertation qui se voulait "expérimentale". Un questionnaire à leur intention était associé au sujet pour déterminer quelles étaient leurs attentes en matière de capacités que les élèves doivent exprimer dans leur devoir. Ces capacités étant définies a priori par le "groupe de pilotage" de l'expérimentation :

  • mobiliser des informations (connaissances personnelles et contenu du dossier documentaire) ;
  • produire des idées pertinentes (illustrer, nuancer, relier, opposer, expliquer...) ;
  • s'approprier le problème et construire une argumentation cohérente.

Les résultats de l'expérimentation ont montré que derrière ces capacités les enseignants mettaient le plus souvent des choses très diverses. Les exigences variant considérablement d'un professeur à un autre. En matière de pondération des différentes capacités pour fixer la note attribuée à la copie, c'est encore la diversité qui prévaut. Certains n'adhèrent même pas à l'idée d'un barème de correction.

Les instructions de 1994

En juin 1994, paraissent au BOEN21 les nouvelles instructions relatives aux épreuves de SES. Concernant la dissertation, c'est la brièveté qui prévaut, on retrouve des formulations inchangées depuis près de vingt ans. Cependant, des précisions sont apportées à propos du volume (réduit) du dossier documentaire. En revanche, s'agissant d'une épreuve nouvelle, la nature de la question de synthèse est plus longuement présentée, en particulier quant à ce qui est attendu des élèves.

On remarque toutefois que, pour la première fois, les compétences évaluées à travers ces épreuves figurent dans le texte relatif à leur nature. Pour plus de transparence, il est même précisé que "la définition des compétences évaluées figurera en introduction de chacun des sujets distribués aux candidats". En fait, le texte du BO en dit plus que ce qui figure sous la seule rubrique "compétences évaluées". Il y est explicitement précisé que l'élève doit : avoir des connaissances et maîtriser des savoir-faire, faire preuve de capacités d'analyse, être capable d'effectuer une démonstration, de rassembler des informations, d'argumenter, de mettre en ordre, de faire preuve d'esprit critique et de s'exprimer correctement.

De nombreuses questions non résolues

Quelles compétences évaluer ?

La question de la forme de l'épreuve s'est presque toujours posée à partir des problèmes de correction (donc sur un mode pratique) et moins sur le fait de savoir si le type d'exercice22 était adapté à la nature de l'enseignement de cette discipline, aux compétences qu'elle cherche à développer chez les élèves. Les remarques des professeurs ont été nombreuses dans ce sens. La "nouvelle" épreuve s'est attachée à pallier ce problème. Parler des compétences c'est amener la redoutable question : à quoi sert de faire des SES ? Entendons-nous, il ne s'agit pas de l'utilité pratique ou professionnelle des SES mais de la formation, de la discipline intellectuelle à laquelle elle habitue les élèves. Faire des SES ce n'est donc pas seulement acquérir des connaissances23.

Au début des années 1990, les "objectifs de références pour la classe de seconde" ont précisé un peu les choses. Nonobstant le fait que la définition de ces objectifs24 débouchait sur des préconisations en matière de pratiques pédagogiques qui s'apparentaient à une pédagogie par objectifs à laquelle beaucoup de professeurs se sont montrés réticents à souscrire, ce travail de mise au point réalisé par une dizaine de collègues me semblait très utile. Il aurait pu donner lieu à une réflexion, sinon sur la nature de l'épreuve de bac du moins sur les compétences attendues et à évaluer. On sait aussi que ce que l'on évalue au bac rejaillit sur les pratiques qui préparent les élèves à l'épreuve terminale.

Néanmoins, sans que cela ait jamais été explicitement défini de façon institutionnelle, les compétences que nos élèves doivent exprimer concernent : des connaissances en rapport avec le sujet ; la maîtrise de savoir-faire ; des capacités à analyser un document, à l'interpréter par rapport au sujet, à le mettre en relation avec d'autres ; capacités aussi à produire une argumentation organisée, à rassembler des informations, à argumenter et à faire preuve d'esprit critique (d'après B. Simler, DEES, déc. 1993, n° 94). Si ces compétences concernaient l'"épreuve alternative" elles valent tout autant pour la dissertation. De nombreux documents expriment les compétences attendues des élèves et évaluées (partiellement) lors du baccalauréat.

Plus récemment, une note de l'Inspection générale de SES (en date du 9 avril 1998) relative à l'harmonisation de l'évaluation des épreuves précisait que "la dissertation a pour objectif d'évaluer quatre grandes compétences" :

  • élaborer une problématique adéquate à la question posée et construire un plan ;
  • mobiliser des connaissances ;
  • conduire un raisonnement rigoureux ;
  • utiliser les informations "pertinentes par rapport à la problématique choisie" contenues dans le dossier documentaire.

La "question de synthèse" ayant pour objectif d'évaluer la capacité de l'élève à analyser des documents, à mobiliser des connaissances, à synthétiser des informations (travail préparatoire et connaissances personnelles) en les organisant de manière structurée.

Évaluation et pertinence des sujets

L'université d'été du Touquet, la nouvelle épreuve, les nouvelles instructions pour le bac n'ont certainement pas réglé tous les problèmes d'évaluation. Dans un article paru dans DEES25, D. Brohard rend compte d'un important travail statistique effectué à l'issue du baccalauréat 1995, année de la mise en oeuvre des nouvelles épreuves. On retient de sa conclusion "la nécessité de progresser dans l'harmonisation des corrections, en particulier pour l'épreuve de synthèse, où l'on a mis en évidence une forte irrégularité dans la distribution des notes".

La qualité de l'évaluation est cependant subordonnée à la pertinence des sujets, or celle-ci n'est, semble-t-il, pas toujours observée. C'est l'idée que défendent G. Grosse et D. Rallet dans un article très critique d'un sujet de dissertation proposé aux candidats en juin 199726.

Le sujet est, selon eux, "tellement présomptueux qu'il valorise finalement les seules qualités académiques et qu'il conduit les correcteurs à abandonner presque toutes les exigences de contenu". Notons cependant qu'il "a été jugé classique, voire même pour certains [correcteurs] trop classique" dans l'académie de Clermont-Ferrand. À Grenoble, "la commission considère que le sujet est classique et correspond bien au cahier des charges. Elle apprécie le travail effectué par les concepteurs du sujet". Toutes les commissions d'harmonisation relèvent cependant les difficultés rencontrées par les élèves à étudier à la fois comment la fécondité agit sur le développement et l'action du développement sur la fécondité. En fait, la condamnation sans appel du sujet par G. Grosse et D. Rallet aurait gagné en crédibilité si le libellé avait été correctement reproduit. Il n'était en effet pas, comme ils le disent, "Fécondité et développement dans les PED" mais "Quelles relations peut-on établir entre fécondité et développement dans les pays en développement ?".

Le dossier documentaire est condamné en bloc par les auteurs de l'article, aucun document n'étant pertinent à leurs yeux, soit parce que trop difficile à utiliser dans le cadre du problème posé par le sujet, soit parce que se prêtant trop à la paraphrase. Dans les différentes académies où ce sujet a été posé quelques réserves ont été émises concernant le choix des documents, notamment la présence d'un schéma d'implication.

Je n'ai guère le souvenir de sujets de bac qui n'aient fait l'objet de critiques plus ou moins vives et parfois contradictoires. La confection d'un sujet est cependant une affaire sérieuse faite sérieusement. Si un professeur se trouve généralement à l'origine d'un sujet, il travaille en groupe au sein d'une commission (sous l'autorité d'un inspecteur général et d'un universitaire) qui critique (parfois sans aménité), amende, fait des propositions... Le sujet est ensuite testé par des professeurs qui sont invités à faire toutes les remarques qu'ils souhaitent, ce qui conduit à retravailler le sujet qui sera - ou non - soumis aux candidats27.

G. Grosse et D. Rallet posent dans leur article un véritable problème, celui des liens entre la nature du sujet, la pertinence de l'évaluation et finalement les pratiques de cours. Beaucoup de sujets, disent-ils, "ne suscitent plus beaucoup d'analyse en profondeur des compétences qu'ils sont censés évaluer". De sorte que l'on finit par évaluer autre chose que le travail effectué avec les élèves durant l'année scolaire, et que l'on se satisfait de réalisations qui ne traitent pas réellement le sujet et qui paraphrasent (habilement quand même) les documents. En outre, ce sujet "révèle la faiblesse de notre réflexion - nous, professeurs de SES - sur la question de l'évaluation, depuis longtemps polarisée sur les formes (la nouvelle épreuve, l'évaluation de la spécialité, la bataille contre la dissertation sans documents) et pas assez sur le contenu de l'évaluation".

Quel est le rôle du dossier documentaire ?

Depuis ses origines, et surtout depuis la fin des années 1970, l'enseignement des SES paraît indissolublement lié au travail sur documents. On comprend donc que l'épreuve du bac s'appuie sur un dossier documentaire. Si l'idée d'une dissertation sans document est néanmoins envisagée de façon récurrente, elle l'a été notamment lors de l'université d'été du Touquet, sans recueillir l'assentiment de beaucoup de professeurs, c'est parce que les documents posent quelques problèmes. Ceux-ci sont de deux ordres (au moins) liés l'un à l'autre : la nature du dossier d'une part, son utilisation par les élèves d'autre part.

C'est la fonction des documents qui mériterait d'être éclaircie. Quand il est dit que "l'exploitation des éléments pertinents du dossier est obligatoire28", ce qui n'est pas la règle dans toutes les académies, il faut encore préciser ce que nous entendons par là, quelle(s) compétence(s) nous cherchons à apprécier à travers cette utilisation et quels seront les critères qui nous permettront de l'(les) évaluer ? C'est la réponse à cette question qui déterminera la nature du dossier proposé aux candidats. Dès lors, on est amené à se demander : qu'est-ce qu'un bon dossier documentaire ?29 C'est celui qui sera le plus utile au candidat pour montrer qu'il maîtrise les compétences que nous cherchons à évaluer. À cet égard, il ne semble pas, si l'on s'en tient aux instructions pour le bac, que la fonction des documents soit la même pour la dissertation et pour la question de synthèse étayée par un travail préparatoire. Dans le premier type d'épreuve, le dossier est là "pour aider le candidat à asseoir son travail sur des bases positives et des références précises". Dans la synthèse, à la différence de la dissertation, les documents doivent faire l'objet d'un travail d'analyse à travers lequel il est attendu que le candidat fasse preuve de compétences particulières révélées par ses réponses. Cette distinction formelle ne me paraît toutefois pas pertinente sur le fond.

La question de la fonction et de l'utilisation des documents semble beaucoup plus claire en ce qui concerne la synthèse que pour la dissertation où le dossier n'est là que pour "aider le candidat"... qui peut donc s'en passer ? Mais cette formule n'aide pas beaucoup le correcteur. En effet, en en-tête du sujet de dissertation figure systématiquement la note : "Il est demandé au candidat [...] de mobiliser des connaissances et des informations pertinentes pour traiter le sujet notamment celles figurant dans le dossier". Cette fois, l'utilisation des informations apportées par les documents devient une contrainte et constitue un élément de l'évaluation. L'incertitude ne semble cependant pas complètement levée, bien que l'Inspection générale ait cherché à préciser un peu les choses à travers une note de son doyen en date du 9 avril 1998. On peut y lire que la dissertation vise notamment à évaluer "la capacité à utiliser les informations documentaires pertinentes par rapport à la problématique choisie". Ceci suppose implicitement que l'élève ait un véritable choix en matière d'orientation de la question à traiter, choix qui l'autorise à ne pas tenir compte de certaines informations documentaires (cependant nécessairement importantes puisque la commission a jugé bon de les faire figurer dans un dossier dont le volume est réduit). Par ailleurs, précise cette note, "il importe de garder à l'esprit que les documents proposés dans le dossier doivent davantage être considérés comme une ressource pour aider l'élève à étayer son argumentation que comme une contrainte destinée à rendre son travail plus difficile". Ici, les choses me semblent plus claires, les documents fournis dans l'épreuve de dissertation ne seraient pas en eux-mêmes objet d'évaluation au sens où on ne sanctionnera pas (c'est-à-dire qu'il peut avoir 20) un élève qui, dans un sujet portant sur la mobilité sociale, aura (pour ne pas risquer de se tromper entre destinée et recrutement) prudemment évité de citer quelques pourcentages de la table de mobilité systématiquement présente dans le dossier. Mais, dans ce cas, que devient la "capacité à utiliser les informations documentaires"?

Un silence assourdissant

Depuis bientôt dix ans la question de l'évaluation ne fait plus guère l'objet d'articles dans DEES (devenue idees). Ce qui ne signifie pas pour autant que cette question soit résolue. Au mois de juin, la "liste" Internet se fait régulièrement l'écho des problèmes soulevés, des critiques et des incertitudes des enseignants de la discipline. Les commissions d'entente sont parfois houleuses et la correction des copies test révèle des attentes très diverses des correcteurs. Il semble cependant que l'on se satisfasse de compromis locaux.

Un exemple nous est donné par la façon de procéder dans l'académie de Clermont-Ferrand30, qui peut être résumée brièvement. Réunis en stage, les professeurs de l'académie ont adopté une "charte de l'évaluation" permettant de "clarifier les exigences formelles". Ce travail en amont a le mérite de préciser les attentes de la collectivité enseignant la discipline dans le cadre de l'épreuve du bac. Il permet aussi, lors de la commission d'entente qui précède la correction des copies, d'aller à l'essentiel à partir d'une base commune : comment cette charte sera-t-elle appliquée compte tenu des sujets proposés ?

J'imagine qu'il fut difficile de parvenir à élaborer cette "charte", que certains enseignants demeurent critiques à son égard, qu'elle a donné lieu à des compromis, mais elle a le mérite d'exister et de contribuer à l'harmonisation de l'évaluation. Elle constitue, comme le dit Ch. Dubois, un moyen terme entre un "individualisme négateur" et "une rationalisation bureaucratique".

Depuis, sous des formes diverses, plusieurs académies ont produit ce type de "charte". Celles de Poitiers ou d'Amiens (mais le recensement n'est pas exhaustif) sont consultables sur Internet. Ailleurs, des stages portant sur la correction des copies ont été organisés. Autant d'initiatives qui témoignent d'un problème et d'un besoin ressenti par les professeurs qui enseignent et corrigent le bac.

Contre l'excès d'exigences formelles

On remarque que les textes produits au niveau académique portent parfois beaucoup plus sur des exigences formelles que sur les compétences attendues des candidats. Que de chemin parcouru en quarante ans ! La capacité à s'approprier et à traiter un problème passe-t-elle nécessairement par la rédaction d'une introduction en trois parties et d'une conclusion en deux ? La définition (quelle définition ?) d'un terme en introduction témoigne-t-elle de la maîtrise du concept ?

S'il me paraît nécessaire de parvenir à un accord concernant les attentes formelles, il ne me semble cependant pas judicieux d'accorder trop d'importance à un formalisme outrancier et a priori. Doit-on exiger de nos candidats qu'ils fassent une introduction en deux ou trois parties (voire quatre ou cinq dans certaines annales corrigées) dans laquelle ils vont définir, souvent de façon très maladroite et irritante pour le correcteur, les termes du sujet ; qu'ils développent ensuite en deux ou trois parties, chacune d'elles étant introduite et liée à la précédente par une phrase de transition ; qu'ils terminent enfin par une conclusion impérativement constituée de deux parties ? S'agit-il d'un exercice de style destiné à mesurer leur docilité ou l'expression d'une compétence ?

Les SES ne reproduisent-elles pas à leur façon la scolastique du XIIIe siècle ? Il s'agit, selon une démarche très standardisée, de poser un problème - quaestio - puis d'étudier les arguments qui inclinent à conclure dans un sens puis dans l'autre - disputatio.

Depuis une quinzaine d'années s'est développée peu à peu une exigence relative à la définition des termes. Celle-ci me semble dater du moment où des "notions" ont été associées au programme, les élèves étant supposés savoir les définir. Je ne sais pas ce que la récitation d'une définition révèle comme compétence. Pour autant qu'il y ait accord sur la définition d'un concept économique ou sociologique (que l'on songe, par exemple, à "anomie", mot qui, selon Ph. Besnard31, a recouvert des significations si différentes qu'il convient d'en sonner le glas), évaluer les élèves sur leur capacité à définir (je préfèrerais "expliquer") n'est-ce pas confondre l'accessoire et l'essentiel ? Une sorte de catéchisme qui se prendrait pour la théologie.

Un concept est un outil dont la compréhension se révèle à travers l'utilisation que l'élève en fait dans son devoir, pour analyser un problème qu'il doit traiter, et non dans la restitution d'une définition plus ou moins bien appropriée.

Considérations conclusives

Finalement, poser la question de l'évaluation revient à se demander à quelles compétences nous souhaitons faire accéder les élèves. La réflexion s'est le plus souvent focalisée sur les contenus des programmes et sur le constat d'une relative incertitude quant à la validité de l'appréciation chiffrée des copies. La principale réponse apportée aura été de préciser davantage le texte des programmes. Dans cette perspective, certaines académies travaillent actuellement sur ce que l'on pourrait appeler des "fondamentaux" relatifs à chaque partie à enseigner en classe de terminale. On peut critiquer cette démarche, on peut aussi lui reconnaître le mérite de contribuer à une amélioration de l'évaluation en précisant davantage les exigences en matière de contenus de connaissances. Il me semble cependant que la difficulté de l'évaluation ne se réduit pas à cela. Qu'est-ce que l'on note le jour du baccalauréat ? Les connaissances des candidats certes, mais pas uniquement. Faire des SES c'est aussi acquérir un ensemble de compétences, de savoir-faire.

G. Grosse et D. Rallet32 considèrent, fort justement, que "dans une discipline comme la nôtre, les pratiques d'évaluation ne peuvent être régulées que par des conventions". Ils n'en appellent pas moins à développer la réflexion sur le contenu de cette évaluation.

Parvenir à une meilleure harmonisation de la correction supposerait, à mon avis, que nous nous accordions, au-delà des contenus enseignés qui sont du ressort des programmes officiels, sur les compétences que nous cherchons à faire acquérir aux élèves et les critères nous permettant d'apprécier le degré de maîtrise de ceux-ci. Il me paraît navrant que les commissions d'entente se transforment en d'interminables discussions portant sur le fait qu'il faille ou non sanctionner la non-utilisation du dossier documentaire ou la valorisation de connaissances hors sujet. Il ne s'agit pas d'une quelconque adhésion à l'évaluation critériée, dont Mme Barthélémy-Descamps nous a présenté les "avatars" lors d'une conférence tenue à l'occasion de l'université d'été du Touquet33, mais d'un souci de parvenir à des critères d'évaluation partagés.

Développer une réflexion collective, au niveau national, dans cette perspective permettrait non seulement d'évaluer les candidats d'une façon moins aléatoire mais fournirait également des repères plus sûrs aux enseignants pour préparer leurs élèves et aux auteurs de sujets pour sélectionner les document et libeller les questions. Il s'agit finalement de parvenir à se mettre d'accord sur la réponse à apporter à une question simple mais, me semble-t-il, non résolue : "Qu'est-ce que l'on évalue ?"

Depuis quinze ans beaucoup de réflexions ont été conduites. Il me semble que le moment est propice à une synthèse nationale qui permettrait de donner une assise institutionnelle et d'officialiser davantage ce qui relève, mais c'est déjà beaucoup, de compromis locaux. C'est pourquoi j'en appelle à la convocation d'une université d'été portant sur cet objet, dans le cadre d'épreuves dont l'architecture n'est a priori pas en cause.


(1) BO n° 37, 24 octobre 1968.

(2) Pour une étude plus approfondie des problèmes du baccalauréat jusqu'aux années 1980, on pourra consulter : Chatel (dir.), Caron, Chalaye-Fenet, Le Merrer, Pasquier, Simula : Enseigner les sciences économiques et sociales, le projet et son histoire, Paris, INRP, 1990.

(3) Pierre Danel, "Les enseignants de sciences économiques et sociales de l'académie de Clermont-Ferrand et l'épreuve du baccalauréat", DEES, juin 1983, n° 52.

(4) Il serait cependant faux de dire que les sujets sont généralement perçus comme difficiles par les correcteurs du baccalauréat. B. Magliulo écrivait, en 1986 (à propos du bac 85 dans les académies de Paris-Créteil-Versailles), "dans l'ensemble les sujets ont été considérés comme bons. Les correcteurs disent fréquemment qu'il leur semble même exister une nette tendance à concevoir des sujets plus "réalistes", plus adaptés au "niveau réel des élèves de B d'aujourd'hui"", DEES, n° 62/63, mars 1986.

(5) DEES, n° 56, juin 1984.

(6) "Harmonisation des objectifs dans l'enseignement des sciences économiques et sociales", stage APSES-MAF, 25 novembre 1983 et 15/16 février 1984, document ronéoté.

(7) Note de service du 27 juin 1983, BO n° 27 du 7 juillet 1983.

(8) Pour davantage de précisions, on peut consulter : Caron P., "Les documents dans l'épreuve du baccalauréat en SES : évolution et problèmes", in Documents : des moyens pour quelles fins ?, Actes du septième colloque de la didactique de l'histoire, de la géographie et des sciences sociales, INRP, avril 1992.

(9) Simler B., "L'épreuve écrite de sciences économiques et sociales au baccalauréat B ; comportement de notation au baccalauréat, une étude comparée dans trois académies : Lille, Nancy-Metz, Poitiers", document de travail diffusé par l'Inspection pédagogique régionale de l'académie de Lille, avril 1985.

(10) Magliulo B., "Brève étude sur l'importante chute du taux d'admission au baccalauréat B constatée lors de la session de 1984", DEES, décembre 1984, n° 58.

(11) L'Évaluation en sciences économiques et sociales, réflexions, recherches et expériences, CRDP de Lille, premier trimestre 1987.

(12) Voir DEES, mars 1988, n° 71.

(13) Voir DEES, mars 1991, n° 83, pour le compte rendu.

(14) Efficacité de l'interaction élèves-enseignants et évaluation au baccalauréat, IEPE, 1994.

(15) Les élèves pour lesquels la corrélation est particulièrement faible sont ceux qui obtiennent entre 9 et 10 de moyenne annuelle.

(16) Pierre Merle montre la dimension interactive de l'évaluation au quotidien. La fonction de la note ne se limite pas à évaluer les acquis se donnant à voir dans la production (Sociologie de l'évaluation scolaire, Paris, Puf, 1998, coll. "Que sais-je ?").

(17) Elle est reproduite dans DEES, mars 1991, n° 83.

(18) Compétences et capacités sont ici prises dans le même sens, ce qui est généralement le cas dans leur acception courante. Dans L'Évaluation des règles du jeu, Paris, ESF, 1990, Charles Hadji considère que si la capacité est très générale, la compétence se révèle en situation. Dans les productions des élèves nous apprécierions donc des compétences exprimant des capacités.

(19) Voir l'article de Claude Dargent dans DEES, mars 1991, n° 83.

(20) Voir DEES, décembre 1993, n° 94.

(21) NS n° 94-179, BOEN n° 25 du 23 juin 1994. Le texte de 1994 sera abrogé par la nouvelle définition des épreuves publiée au BOEN n° 30 du 4 septembre 1997 (NS n° 97-164 du 30 juillet 1997). Les modifications concernent essentiellement le nombre de questions du travail préparatoire et la documentation : longueur et nature des documents qui "doivent apporter des informations, principalement factuelles, plutôt que de suggérer des interprétations toutes faites".

(22) A concevoir maintenant au pluriel.

(23) Ceci vaut pour la majeure partie des disciplines de l'enseignement général. "Discipline" pouvant être entendu au sens de discipline intellectuelle avec laquelle les élèves doivent se familiariser pour réussir.

(24) Le titre exact de la production était d'ailleurs Utiliser des objectifs de référence en classe de seconde, CRDP de Poitou-Charentes, MEN, 1993. L'ambiguïté était cependant entretenue dans la présentation par la DLC qui parle d'"objectifs de référence en sciences économiques et sociales".

(25) "Enquête sur le bac ES dans l'académie d'Amiens", DEES, décembre 1996, n° 106.

(26) "Bac 1997 : éléments pour l'analyse des pratiques d'évaluation", DEES, mars 1998, n° 111.

(27) C'est ainsi qu'a fonctionné la commission à laquelle j'ai participé et qui réunissait des enseignants des académies d'Amiens et de Lille.

(28) D. Rallet, ibidem.

(29) À la fin de son article consacré à la fonction des documents dans les sujets de bac, D. Rallet cite J. Bremond et H. Lanta : "La pédagogie des sciences économiques et sociales : mythe fondateur ou réalité", in Les Sciences économiques et sociales, P. Combemale dir., CNDP/Hachette, 1995. Cependant, dans cet ouvrage, les auteurs présentent leur conception de ce qu'est un "bon dossier pédagogique", or il ne me semble pas que celui-ci présente les mêmes caractéristiques qu'un bon dossier pour le bac.

(30) Dubois Ch., DEES, octobre 2000, n° 121.

(31) L'Anomie, Paris, Puf, 1987, coll. "Sociologies".

(32) DEES, n° 111, mars 1998.

(33) "Les utilisateurs [de l'évaluation critériée] n'ont pas toujours mesuré qu'en s'emparant de la pédagogie par objectifs et de ses techniques ils empruntaient non seulement une technique mais aussi une conception de la formation. Adeptes d'une conception behavioriste, les promoteurs de la PPO considèrent l'apprentissage comme une opération de transformation des comportements ; ils ont de ce fait une vision réductrice du développement intellectuel, affectif ou social", DEES, n° 83, mars 1991.

Idées, n°146, page 62 (12/2006)

IDEES - La question de l'évaluation au baccalauréat