Etienne BRUNET

Institut National de la langue française, CNRS

 

Un texte sacré peut-il changer? Variations sur l'Évangile

 

 

           

 

Les exposés qu'on vient d'entendre portaient sur les textes médiévaux et l'opposition entre philologie classique et philologie nouvelle pouvait s'y déployer largement. Quand il s'agit de textes contemporains - ce dont je m'occupe habituellement - le choix tend à se réduire à la seule face moderne de l'alternative. Un écrivain de nos jours rédige le plus souvent sur le clavier de son ordinateur.  La machine est le témoin neutre de ses fautes, de ses repentirs, de ses  corrections et de tous les tâtonnements  ou approximations par où passe le texte avant de sortir de sa gangue. Elle pourrait enregistrer, dans l'ordre chronologique, chacune des modifications comme une caméra pourrait fixer chacun des coups de ciseau du sculpteur. La génétique aimerait disposer de cette boîte noire. Mais la machine, obéissant à un auteur peu soucieux de montrer ses faiblesses et ses tentatives avortées,  efface tout de sa mémoire et de sa conscience, comme si elle était liée au secret professionnel. Et son témoignage se perd définitivement dans la poubelle électronique qui détruit à jamais tout ce qu'on lui jette. Ce que l'écrivain donne à l'éditeur, c'est une disquette discrète où le correcteur a effacé les fautes et où les méandres de l'écriture n'ont pas laissé de trace. Plus de brouillon, plus de ces corbeilles à papier où les critiques ont trouvé tant de trésors. Plus de variantes. Partant plus de philologie.

         Le texte que je propose à votre réflexion a une ancienneté vénérable, puisqu'il s'agit de l'Évangile. Des milliers de philologues, d'historiens, de philosophes  et d'exégètes s'étant penchés sur ce texte sacré, il semble illusoire et présomptueux d'espérer trouver quelque source nouvelle ou quelque commentaire inédit, ne serait-ce que sur un seul verset. Notre intention est autre. Partant du fait que les textes sont difficilement comparables quand trop de variables les séparent ( l'auteur, le sujet, le genre, la taille, la date, le public, la langue), nous avons estimé que l'Évangile pouvait offrir le prétexte d'une expérience de laboratoire, où toutes ces variables seraient neutralisées. Comme la culture est ce qui reste, dit-on, quand on a tout oublié, la variation que nous voulons  mesurer est  ce qui reste quand on a tout enlevé, ou presque. On se propose en effet de mettre en parallèle les quatre récits évangéliques dans trois traductions françaises contemporaines. Les sources sont les mêmes, comme aussi la matière racontée, et le public visé. Peu de différences quant à l'étendue, l'état de langue ou  - ce qui est plus dangereux - le genre littéraire.  Car de toutes les forces qui s'exercent sur un texte, le genre semble la plus pesante  et la plus pressante. Nous gardons le souvenir décevant d'une expérimentation, réalisée avec Charles Muller, qui avait consisté à étudier les 60 mots français les plus fréquents dans une dizaine de textes (romanesques,  dramatiques ou poétiques) de Hugo, Lamartine et Musset. Abusé par les méthodes statistiques, l'ordinateur avait reconnu des différences et invitait naïvement à conclure qu'il y avait trois auteurs différents: un romancier, un dramaturge et un poète.[1]

Il n'est pas difficile de se procurer le texte biblique sous forme numérique. Des centaines de sites le proposent dans toutes les langues. Ce n'est pourtant pas à Internet que nous nous sommes adressé, mais à un laboratoire spécialisé, le Centre Informatique et Bible, que dirige Ferdinand Poswick à l'abbaye de Maredsous, en Belgique. L'une des traductions a été produite dans cette enceinte, et nous lui donnerons le nom de l'abbaye (Maredsous). Une autre, qui est antérieure et collective, est le fruit d'une collaboration  qui a réuni protestants et catholiques : elle sera désignée sous le nom de TOB (Traduction Oecuménique de la Bible). La  troisième version est extérieure et liée à la culture juive: elle est due à la plume originale d'André Chouraqui et portera le nom de son illustre auteur.  En réalité notre corpus est constitué des douze textes qu'on obtient en croisant les quatre évangiles et les trois traductions et qu'on désignera en joignant les suffixes -TOB, -MAR ou -CHO au nom de l'évangéliste (MatthieuTob, LucMar, JeanCho, etc).

Plusieurs logiciels sont disponibles sur le marché français pour le traitement des corpus textuels. Nous avons appliqué quelques-uns aux présentes données, et notamment Lexico, Alceste, Sphinx et Cordial-U. Les résultats obtenus concordent entre eux et confirment ceux que propose notre logiciel Hyperbase. On nous pardonnera d'utiliser de préférence ce dernier, que nous maîtrisons mieux que les autres.  Ceux qui ignorent son existence auront une idée de son fonctionnement en voyant le menu principal représenté ci-dessous.

 

Figure 1. La base Évangile.  Menu principal

 

On distingue deux séries de fonctions: celles qui sont accessibles horizontalement au haut de l'écran sont de type documentaire. Elles permettent l'accès direct au texte (Lecture), l'accès sélectif au dictionnaire (Index), et diverses recherches à propos d'une forme, d'un lemme, d'une initiale, d'une finale, d'une expression, d'une cooccurrence, etc.

À titre d'exemple cherchons le diable dans l'Évangile, ne serait-ce que pour vérifier si un message électronique reçu de l'organisateur de ce colloque est tiré ou non de la Bible. Ce message de prudence, qui  prévoyait le pire (le pire n'est pas arrivé), se terminait ainsi: "Le diable ne dort jamais". Cet aphorisme n'aurait pas été déplacé dans le texte sacré, mais force est de reconnaître qu'il n'y est pas comme le prouve la concordance (figure 2). Le diable est d'ailleurs discret dans l'évangile: on le rencontre six fois dans Mathieu et Luc, trois fois chez Jean et Marc l'ignore. Mais il est vrai qu'il porte d'autres noms, principalement  Satan. La recherche de l'aphorisme est négative de ce côté-là aussi. Elle l'est aussi si l'on recense toutes les formes du verbe dormir, en utilisant le conjugueur caché sous le bouton LEMME (figure 3). Cette fois on utilise la fonction CONTEXTE qui restitue le contexte du verset entier.

Figure 2. Concordance du mot diable (triée sur le contexte droit)

 

Figure 3. La fonction Contexte. Le verbe dormir.

 

         Les trois traductions suivant d'un même pas la même source, on a pu mettre en lumière le parallélisme, en alignant les trois versions d'un même verset. Cette technique des "textes alignés" permet de suivre dans le détail les différences d'expression. Elles sont généralement  mineures  lorsque le texte de la Tob est confronté à celui de Maredsous (bruit substitué à voix dans l'exemple de la figure 4), mais elles peuvent avoir une portée considérable quand intervient Chouraqui (souffle substitué à vent mais aussi à Esprit dans le même exemple). Bien entendu la juxtaposition vaut pour tout verset que désigne la souris.

 

Figure 4. Alignement des trois  traductions d'un  même verset

 

 

         Il n'est pas dans notre intention - ni dans nos compétences - de passer en revue toutes ces variantes,  ni même d'examiner, dans l'exemple qu'on vient de proposer, l'intérêt apologétique du syntagme "natif du souffle" par quoi Chouraqui remplace l'expression traditionnelle "né de l'Esprit". Il nous suffit d'essayer l'outil avant de l'abandonner aux mains plus expertes. Si l'outil est d'un maniement aisé quand on se contente de ses fonctions documentaires (un simple clic sur un mot fournit les informations), ses fonctions statistiques nécessitent de plus amples explications. Ce sont celles aussi qui manifestent le plus clairement les écarts qui opposent les textes mis en présence.

         Le texte de l'évangile, pris dans son ensemble et sans distinguer les évangélistes et les traducteurs, offre une singularité que la comparaison avec l'ensemble des données de Frantext souligne avec éclat. La figure 5 (colonne de gauche) donne la liste des éléments lexicaux que le texte évangélique privilégie. La mention de Jésus en tête de liste (devant les noms propres Galilée, Pilate et Abraham) est significative. Au vu de cette série de mots-clés (disciples, Pharisiens, synagogue, sabbat, royaume, parabole, messie, etc.), un martien débarquant sur terre pourrait se faire une idée de l'héritage judéo-chrétien.

 

Figure 5. Les spécificités du corpus par rapport à la base Frantext

 

         Encore n'y a-t-il pas unanimité dans la terminologie employée par les trois traducteurs. La précellence de Jésus aurait été plus forte si Chouraqui ne lui avait pas préféré la graphie Iéshoua. De même les disciples ont souffert de la concurrence du terme adeptes, par quoi Chouraqui exprime la relation au maître. Pour filtrer les spécificités propres à chaque texte (ou à chaque traducteur ou évangéliste), une comparaison  interne s'impose qui prend pour norme non plus une référence externe mais le corpus évangélique lui-même, considéré comme un ensemble clos. Le logiciel fournit, sous forme de listes spécifiques, les profils contrastés des douze textes comparés. Dans la figure 6 deux de ces profils sont mis en parallèle. Dans les deux cas le texte est emprunté à Chouraqui et l'on y retrouve Iéshoua et ses adeptes, et plus généralement l'écriture particulière des noms propres, que Chouraqui rapproche autant qu'il peut de l'hébreu (Adôn, Peroushîm, Elohîm, Iohranân, Iaacob, etc..)  et même des particularités orthographiques (ciels au lieu de cieux) ou lexicales (zizanies, procurateur) par quoi Chouraqui se distingue de l'usage courant.

Figure 6. Les spécificités de Mathieu et Marc traduits par Chouraqui

 

On pourrait s'attendre à trouver dans les hapax (ou mots employés une seule fois) la marque de l'originalité de Chouraqui. La culture des mots rares est souvent le fait d'une coquetterie de plume qui cherche à se faire remarquer. Ce n'est pas le cas. Bien sûr le nombre d'hapax est très faible dans le corpus et cela tient au caractère répétitif d'un même récit - la vie et l'enseignement du Christ - repris douze fois par quatre auteurs et trois traducteurs différents, ce qui explique que la variété lexicale soit la plus faible que nous ayons rencontrée. Or des trois traducteurs, c'est chez Chouraqui  que le vocabulaire est le plus pauvre. Et malgré l'orthographe inédite des noms propres - qui va jusqu'à l'invention de voyelles accentuées étrangères à la langue française - malgré les entorses faites à la tradition dans le choix du vocabulaire biblique, le nombre des hapax est plus faible chez Chouraqui que dans la traduction de Maredsous. Le graphique 7 ne laisse aucun doute sur ce point. Les écarts observés chez Chouraqui ne procèdent donc pas d'un exercice de style, il ne s'agit pas pour lui de piquer la curiosité ni même de dépoussiérer un texte trop convenu, ils tiennent à la volonté du traducteur de retrouver , à travers le texte grec, les réalités historiques qui ont entouré l'événement, et de proposer des équivalents français non pas seulement aux termes grecs de l'original mais au référent qu'ils recouvrent dans la culture  et l'histoire juives.

Figure 7. Histogramme des hapax dans le corpus évangélique

 

 

Le graphique 7 livre en outre une indication précieuse, relative aux quatre évangélistes: quel que soit le traducteur, c'est toujours Luc qui est le plus riche. La tradition veut qu'il ait été médecin et que sa culture - encore approfondie par les leçons de Saint Paul - ait été plus vaste que celle des autres évangélistes. Il a plus que les autres des qualités d'historien et des dons de conteur: son information est plus riche et son expression plus variée.

Mais ce premier résultat reste ambigu: deux clivages apparaissent sans qu'on puisse dire quelle pente est la plus forte. Doit-on mettre en avant l'opposition des traductions, ou celle des évangiles?

Pour en décider, il conviendrait de situer chaque texte par rapport à tous les autres et de trouver une mesure pour apprécier la distance de chacun à chacun. Hyperbase propose un premier algorithme qui consiste, pour deux textes que l'on compare, à faire le rapport entre les termes communs et ceux qui sont privatifs ou exclusifs. Un second algorithme tient compte non plus seulement de la présence-absence mais de la fréquence de chacun des mots dans chacun des textes. Les résultats chiffrés sont consignés dans le tableau des distances ci-dessous (figure 8).

Figure 8. Le tableau des distances intertextuelles

en haut calcul sur V (présence-absence), en bas calcul sur N (fréquence)

 

Arrêtons-nous un instant à la dernière ligne du premier tableau pour en faire un gros plan. Elle concerne l'évangile de Jean dans la traduction Chouraqui. L'histogramme de la figure 9 rend compte des attractions qui s'exercent sur ce texte. La plus forte est celle de l'auteur : d'un traducteur à l'autre, la distance est faible quand la même source est en question (soit JNCH, JNTO et JNMA). Les distances se raccourcissent aussi quand on a affaire au même traducteur (soit JNCH, MTCH,MCCH et LCCH). Les distances les plus longues sont observées quand aucune signature n'est commune, ni celle de l'évangéliste, ni celle du traducteur.

Le tableau des distances se prête mieux encore à une analyse globale qui projette sur une carte l'ensemble des points comme ferait une carte géographique à partir d'un relevé des distances de ville à ville. Le résultat de cette analyse factorielle est illustré dans la figure 10.

Figure 9. Histogramme de la distance lexicale de Jean selon Chouraqui

Figure 10. Analyse factorielle de la distance lexicale

 

La hiérarchie des variables mises en cause est ici clairement établie: l'auteur compte plus que le traducteur. Le premier facteur oppose en effet l'évangile de Jean ,  qui réunit sur la gauche les trois traductions de ce texte, aux autres évangiles, tous situés sur la droite. Le second facteur pourrait isoler un autre évangile, si l'influence des sources était souveraine. Or tel n'est pas le cas: ce qui distingue le haut et le bas du graphique fait référence à la traduction: celle de Chouraqui impose sa marque puissante aux textes auxquels elle s'applique (MathieuCH, MarcCH, LucCH et même JeanCH), tandis que les autres traductions sont reléguées au bas du graphique.

 

L'analyse arborée  rend encore plus nette la représen­tation des forces d'attraction qui s'exercent dans le champ lexical. Ici  les distances s'apprécient directement en parcourant le chemin qui mène d'un point à un autre. L'analyse souligne l'irrédentisme de Jean qui s'écarte violemment des autres textes, concentrés  sur la branche opposée. Cependant à mi-chemin une déviation conduit, du côté de Chouraqui, tous les textes qu'il traduit et qui portent sa marque.

 

 

Figure 11. Analyse arborée

de la distance lexicale

 

La même analyse s'applique au second tableau des distances, mesurées en tenant compte de la fréquence, selon l'algorithme de Dominique Labbé (partie inférieure de la figure 8). Les enseignements sont à peu près les mêmes: la branche la plus excentrique du graphique 12 isole les trois traductions de Jean, dont le message apparaît irréductible aux autres évangiles. Les trois autres évangiles apparaissent peu différenciés et laissent le champ libre à l'influence du traducteur, les groupements proposés s'ordonnant autour de Chouraqui, Maredsous et Tob respectivement.

 

Figure 12. Analyse arborée de la distance lexicale (calcul sur fréquences)

 

On doit observer toutefois que même en considérant tous les mots sans exception ni filtrage les deux  mesures ne leur donnent pas le même poids. La première donne l'avantage aux mots de faible fréquence, la seconde aux mots courants. La première est plus sensible aux variations thématiques, la seconde aux particularités stylistiques. Les différences qui tiennent au sujet ont fait l'objet de maints commentaires qui soulignent à l'envi l'originalité du texte de Jean, par la  simple juxtaposition linéaire des développements  qu'on lit dans les quatre évangiles. Ainsi le prologue de Jean prend la place de l'enfance du Christ qui occupe les deux premiers chapitres de Mathieu et Luc. Si le récit qui suit a trait à Saint Jean-Baptiste, l'épisode chez Jean n'est pas le même et précède le récit des noces de Cana, qu'on ne trouve pas ailleurs. Quand s'ouvre la mission messianique, Jean n'insiste guère sur les guérisons du Christ là où  les autres évangélistes multiplient les miracles (mais il est le seul à évoquer la résurrection de Lazare).  Quant à l'enseignement même du Christ, sa forme est différente chez Jean: le message n'y passe plus par ces paraboles dont Mathieu, Marc et surtout Luc sont prodigues. Le détail de ces différences n'a pas sa place ici. Mais ces indications succinctes permettront de s'expliquer pourquoi les chiffres tiennent la thématique de Jean à l'écart. Une interprétation plus approfondie pourrait montrer en quoi diffèrent, non seulement les épisodes traités, mais même les enseignements livrés. La leçon de Jean est plus tournée vers l'amour, la parole et la vérité. Ces valeurs sont hautement spécifiques chez lui, comme les verbes correspondants aimer, croire  etet dire et l'adjectif vrai.

Reste à comprendre pourquoi les critères proprement stylistiques isolent aussi le texte de Jean. La critique traditionnelle a depuis longtemps observé que le ton de Jean était plus personnel et plus direct. Elle a vu un aveu dans la men­tion qui est faite, dans les derniers versets, du "disciple que Jésus aimait" et une signature dans le verset 24: "C'est ce disciple qui rend témoignage de ces choses, et qui les a écrites". La statistique dans ce domaine qui touche à la prag­ma­tique offre des moyens puissants d'investigation, en circonscrivant la recherche aux pronoms personnels.L'histogramme 13, qui réunit les trois traductions de Jean, illustre la domination de la première personne et à un moindre degré de la seconde. La troisième personne y est largement déficitaire, surtout lorsqu'il s'agit du pronom sujet (il, ils) dont le récit au contraire est si friand. Jean est éminemment l'homme du dialogue.

 

Figure 13. Les pronoms personnels dans l'évangile de Jean

 

L'analyse factorielle appliquée à l'ensemble des pronoms de dialogue souligne ce ton personnel si remarquable dans l'évangile de Jean et si propre à inspirer les mystiques. L'opposition la plus forte est entre Jean associé à la première personne, à droite, et Marc installé à gauche dans la zone dévolue à la troisième personne. Les choix de Luc sont proches de ceux de Marc, tandis que Mathieu propose un compromis qui fait sa place à la seconde personne.

Figure 14. Analyse factorielle des pronoms personnels

 

On ne saurait dire si les pronoms personnels sont à ranger parmi les variables thématiques ou stylistiques. Leur charge sémantique est pleine et entière, qu'ils jouent un rôle anaphorique ou non. Mais en même temps ils participent grandement à la forme de l'écriture, au point qu'il suffit parfois de connaître leur dosage pour deviner à quel genre littéraire on a affaire.

Le dosage des catégories grammaticales permet une décantation semblable. En principe le thème intervient peu lorsqu'il s'agit de choisir entre un verbe, un substantif ou un adjectif, car les mêmes sèmes peuvent être communs au substantif et au verbe ou à l'adjectif qui lui correspondent, ce qu'on vient d'observer pour les couples amour/aimer, parole/dire et vérité/vrai. En réalité dans la répartition des parties du discours comme ailleurs, s'affirme l'originalité de Jean, quel que soit le traducteur. Dans la figure 15 les trois traductions de Jean affirment leur proximité sous ce rapport, au haut du graphique. Tout se passe comme si les variables stylistiques comme les thématiques appartenaient de façon indélébile à l'original  grec et s'imposaient au traducteur.

Figure 15. Analyse arborée des parties du discours avec représentation des textes, puis des catégories


Le même graphique dans sa moitié inférieure analyse les alliances et les oppositions dans la bataille que se livrent les catégories grammaticales. Comme on l'a observé en de multiples occasions, il y a deux clans qui s'arc-boutent aux deux extrémités de la chaîne. Le substantif tire d'un côté, aidé de l'adjectif, des déterminants et  des prépositions, le verbe tire dans l'autre sens, avec ses alliés: adverbes, pronoms et subordonnants. Les participes se situent dans l'entredeux, le participe passé plus près du verbe et le présent plus près de l'adjectif.

Reste à superposer les deux représentations de la figure 15 et à vérifier dans quel camp se rangent chacun des textes. L'analyse de correspondance opère ce recouvrement dans la figure 16. Comme on pouvait s'y attendre, Jean accapare la catégorie verbale, à gauche du graphique, les autres évangélistes étant rejetés à droite, dans l'environnement des classes nominales. Ce ne sera pas une surprise pour les exégètes qui ont insisté depuis longtemps sur le caractère concret du récit des premiers évangélistes, surtout de Marc, contrastant avec la communication plus personnelle et plus mystique qui est le propre de Jean. On connaît le jeu de mot de Hugo ("Car le mot c'est le verbe et le Verbe c'est Dieu."), qui prend sa source dans le Prologue de Jean: "Au commencement était le Verbe… et le Verbe s'est fait chair." Oserons-nous imiter Hugo et surimposer un second calembour au sien, en donnant au verbe un sens grammatical?

Figure 16. Analyse factorielle des parties du discours

 

À lui seul le premier facteur qui rend compte de cette opposition absorbe 73% de la variance. Le second facteur ne représente que 13% et est presque négligeable. Il fait la distinction entre les traductions ( Chouraqui en haut, Tob et Maredsous en bas) et la fonde, non pas sur quelque goût particulier pour telle ou telle partie du discours, mais sur la tendance à cultiver le singulier ou le pluriel. Dans l'étiquetage du corpus en effet , la marque du nombre avait été notée, lorsqu'il s'agissait d'une flexion distincte, qu'il s'agisse d'un verbe, d'un déterminant, d'un pronom, d'un substantif ou d'un adjectif.  Mais cette opposition singulier/pluriel n'est pas tout à fait indépendante de la première: lorsque le texte à traduire est celui de Jean, c'est le singulier qui l'emporte, même sous la plume de Chouraqui. Là encore s'affirme la relation individuelle que le Fils entretient avec le Père, l'apôtre avec le Messie, et le fidèle avec Dieu.

 

         Au terme de ce parcours trop rapide, la statistique n'a pas invalidé les acquis d'une critique,  dévote ou irrespectueuse, qui s'est exercée depuis des siècles sur le texte sacré. Dans toutes les analyses qu'on vient de passer en revue, elle invite à conclure que l'auteur a plus d'importance que le traducteur, du moins lorsque l'auteur a la personnalité et l'originalité de Saint Jean. S'agissant des autres évangiles, qui ne sont pas sans s'être inspirés les uns des autres, leur individualité s'efface parfois devant le tempérament, vigoureusement affirmé, de l'interprète, surtout lorsque le traducteur a l'autorité et l'audace de Chouraqui.

Il serait pourtant imprudent de trop compter sur les méthodes quantitatives pour résoudre des énigmes encore en suspens et décider si oui ou non l'apôtre Jean est le même homme que l'évangéliste. Encore faudrait-il faire entrer dans le calcul d'autres textes qu'on attribue à la même plume, l'Apocalypse et trois Epîtres. Mais des interférences se produiraient sans doute liées au sujet, au genre, au destinataire, et l'expérience perdrait alors de sa pureté.


 



[1]  "La statistique résout-elle les problèmes d'attribution?", en collaboration avec Charles Muller, Strumenti critici, III, n°3, 1988, Florence, p. 367-387.