Etienne BRUNET
Institut National de la langue
française, CNRS
Un texte sacré peut-il
changer? Variations sur l'Évangile
Les exposés qu'on vient d'entendre portaient
sur les textes médiévaux et l'opposition entre philologie classique et
philologie nouvelle pouvait s'y déployer largement. Quand il s'agit de textes
contemporains - ce dont je m'occupe habituellement - le choix tend à se
réduire à la seule face moderne de l'alternative. Un écrivain de nos
jours rédige le plus souvent sur le clavier de son ordinateur. La machine est le témoin neutre de ses
fautes, de ses repentirs, de ses
corrections et de tous les tâtonnements
ou approximations par où passe le texte avant de sortir de sa
gangue. Elle pourrait enregistrer, dans l'ordre chronologique, chacune des
modifications comme une caméra pourrait fixer chacun des coups de ciseau du
sculpteur. La génétique aimerait disposer de cette boîte noire. Mais la
machine, obéissant à un auteur peu soucieux de montrer ses faiblesses et
ses tentatives avortées, efface tout de
sa mémoire et de sa conscience, comme si elle était liée au secret
professionnel. Et son témoignage se perd définitivement dans la poubelle
électronique qui détruit à jamais tout ce qu'on lui jette. Ce que
l'écrivain donne à l'éditeur, c'est une disquette discrète
où le correcteur a effacé les fautes et où les méandres de
l'écriture n'ont pas laissé de trace. Plus de brouillon, plus de ces corbeilles
à papier où les critiques ont trouvé tant de trésors. Plus de
variantes. Partant plus de philologie.
Le
texte que je propose à votre réflexion a une ancienneté vénérable,
puisqu'il s'agit de l'Évangile. Des milliers de philologues, d'historiens, de
philosophes et d'exégètes
s'étant penchés sur ce texte sacré, il semble illusoire et présomptueux
d'espérer trouver quelque source nouvelle ou quelque commentaire inédit, ne
serait-ce que sur un seul verset. Notre intention est autre. Partant du fait
que les textes sont difficilement comparables quand trop de variables les
séparent ( l'auteur, le sujet, le genre, la taille, la date, le public, la
langue), nous avons estimé que l'Évangile pouvait offrir le prétexte d'une
expérience de laboratoire, où toutes ces variables seraient
neutralisées. Comme la culture est ce qui reste, dit-on, quand on a tout
oublié, la variation que nous voulons
mesurer est ce qui reste quand
on a tout enlevé, ou presque. On se propose en effet de mettre en
parallèle les quatre récits évangéliques dans trois traductions
françaises contemporaines. Les sources sont les mêmes, comme aussi la
matière racontée, et le public visé. Peu de différences quant à
l'étendue, l'état de langue ou - ce qui
est plus dangereux - le genre littéraire.
Car de toutes les forces qui s'exercent sur un texte, le genre semble la
plus pesante et la plus pressante. Nous
gardons le souvenir décevant d'une expérimentation, réalisée avec Charles
Muller, qui avait consisté à étudier les 60 mots français les plus
fréquents dans une dizaine de textes (romanesques, dramatiques ou poétiques) de Hugo, Lamartine et Musset. Abusé par
les méthodes statistiques, l'ordinateur avait reconnu des différences et
invitait naïvement à conclure qu'il y avait trois auteurs
différents: un romancier, un dramaturge et un poète.[1]
Il n'est pas difficile de se procurer le
texte biblique sous forme numérique. Des centaines de sites le proposent dans
toutes les langues. Ce n'est pourtant pas à Internet que nous nous
sommes adressé, mais à un laboratoire spécialisé, le Centre Informatique et Bible, que dirige
Ferdinand Poswick à l'abbaye de Maredsous, en Belgique. L'une des
traductions a été produite dans cette enceinte, et nous lui donnerons le nom de
l'abbaye (Maredsous). Une autre, qui est antérieure et collective, est le fruit
d'une collaboration qui a réuni
protestants et catholiques : elle sera désignée sous le nom de TOB (Traduction
Oecuménique de la Bible). La troisième
version est extérieure et liée à la culture juive: elle est due à
la plume originale d'André Chouraqui et portera le nom de son illustre
auteur. En réalité notre corpus est
constitué des douze textes qu'on obtient en croisant les quatre évangiles et
les trois traductions et qu'on désignera en joignant les suffixes -TOB, -MAR ou
-CHO au nom de l'évangéliste (MatthieuTob, LucMar, JeanCho, etc).
Plusieurs logiciels sont disponibles sur le
marché français pour le traitement des corpus textuels. Nous avons appliqué
quelques-uns aux présentes données, et notamment Lexico, Alceste, Sphinx et Cordial-U.
Les résultats obtenus concordent entre eux et confirment ceux que propose notre
logiciel Hyperbase. On nous pardonnera d'utiliser de préférence ce dernier, que
nous maîtrisons mieux que les autres.
Ceux qui ignorent son existence auront une idée de son fonctionnement en
voyant le menu principal représenté ci-dessous.
Figure 1. La base Évangile. Menu
principal
On distingue deux séries de fonctions: celles
qui sont accessibles horizontalement au haut de l'écran sont de type
documentaire. Elles permettent l'accès direct au texte (Lecture),
l'accès sélectif au dictionnaire (Index), et diverses recherches
à propos d'une forme, d'un lemme, d'une initiale, d'une finale, d'une
expression, d'une cooccurrence, etc.
À titre d'exemple cherchons le diable dans
l'Évangile, ne serait-ce que pour vérifier si un message électronique reçu de
l'organisateur de ce colloque est tiré ou non de la Bible. Ce message de
prudence, qui prévoyait le pire (le
pire n'est pas arrivé), se terminait ainsi: "Le diable ne dort jamais".
Cet aphorisme n'aurait pas été déplacé dans le texte sacré, mais force est de
reconnaître qu'il n'y est pas comme le prouve la concordance (figure 2). Le
diable est d'ailleurs discret dans l'évangile: on le rencontre six fois dans
Mathieu et Luc, trois fois chez Jean et Marc l'ignore. Mais il est vrai qu'il
porte d'autres noms, principalement
Satan. La recherche de l'aphorisme est négative de ce côté-là
aussi. Elle l'est aussi si l'on recense toutes les formes du verbe dormir, en utilisant le conjugueur caché
sous le bouton LEMME (figure 3). Cette fois on utilise la fonction CONTEXTE qui
restitue le contexte du verset entier.
Figure 2. Concordance du mot diable (triée sur le
contexte droit)
Figure 3. La fonction Contexte. Le verbe dormir.
Les
trois traductions suivant d'un même pas la même source, on a pu
mettre en lumière le parallélisme, en alignant les trois versions d'un
même verset. Cette technique des "textes alignés" permet de
suivre dans le détail les différences d'expression. Elles sont
généralement mineures lorsque le texte de la Tob est confronté
à celui de Maredsous (bruit
substitué à voix dans
l'exemple de la figure 4), mais elles peuvent avoir une portée considérable
quand intervient Chouraqui (souffle substitué
à vent mais aussi à Esprit dans le même exemple). Bien
entendu la juxtaposition vaut pour tout verset que désigne la souris.
Figure 4. Alignement des trois
traductions d'un même
verset
Il
n'est pas dans notre intention - ni dans nos compétences - de passer en revue
toutes ces variantes, ni même
d'examiner, dans l'exemple qu'on vient de proposer, l'intérêt
apologétique du syntagme "natif du souffle" par quoi Chouraqui
remplace l'expression traditionnelle "né de l'Esprit". Il nous suffit
d'essayer l'outil avant de l'abandonner aux mains plus expertes. Si l'outil est
d'un maniement aisé quand on se contente de ses fonctions documentaires (un
simple clic sur un mot fournit les informations), ses fonctions statistiques
nécessitent de plus amples explications. Ce sont celles aussi qui manifestent
le plus clairement les écarts qui opposent les textes mis en présence.
Le
texte de l'évangile, pris dans son ensemble et sans distinguer les évangélistes
et les traducteurs, offre une singularité que la comparaison avec l'ensemble
des données de Frantext souligne avec
éclat. La figure 5 (colonne de gauche) donne la liste des éléments lexicaux que
le texte évangélique privilégie. La mention de Jésus en tête de liste (devant les noms propres Galilée, Pilate et Abraham) est significative. Au vu de cette série de mots-clés (disciples, Pharisiens, synagogue, sabbat,
royaume, parabole, messie, etc.), un martien débarquant sur terre pourrait
se faire une idée de l'héritage judéo-chrétien.
Figure 5. Les spécificités du corpus par rapport à la base Frantext
Encore
n'y a-t-il pas unanimité dans la terminologie employée par les trois
traducteurs. La précellence de Jésus aurait
été plus forte si Chouraqui ne lui avait pas préféré la graphie Iéshoua. De même les disciples ont souffert de la concurrence
du terme adeptes, par quoi Chouraqui
exprime la relation au maître. Pour filtrer les spécificités propres à
chaque texte (ou à chaque traducteur ou évangéliste), une comparaison interne s'impose qui prend pour norme non
plus une référence externe mais le corpus évangélique lui-même, considéré
comme un ensemble clos. Le logiciel fournit, sous forme de listes spécifiques,
les profils contrastés des douze textes comparés. Dans la figure 6 deux de ces
profils sont mis en parallèle. Dans les deux cas le texte est emprunté
à Chouraqui et l'on y retrouve Iéshoua
et ses adeptes, et plus généralement
l'écriture particulière des noms propres, que Chouraqui rapproche autant
qu'il peut de l'hébreu (Adôn, Peroushîm,
Elohîm, Iohranân, Iaacob, etc..) et
même des particularités orthographiques (ciels au lieu de cieux)
ou lexicales (zizanies, procurateur) par quoi Chouraqui se
distingue de l'usage courant.
Figure 6. Les spécificités de Mathieu et Marc traduits par Chouraqui
On pourrait s'attendre à trouver dans
les hapax (ou mots employés une seule fois) la marque de l'originalité de
Chouraqui. La culture des mots rares est souvent le fait d'une coquetterie de
plume qui cherche à se faire remarquer. Ce n'est pas le cas. Bien
sûr le nombre d'hapax est très faible dans le corpus et cela tient
au caractère répétitif d'un même récit - la vie et l'enseignement
du Christ - repris douze fois par quatre auteurs et trois traducteurs
différents, ce qui explique que la variété lexicale soit la plus faible que
nous ayons rencontrée. Or des trois traducteurs, c'est chez Chouraqui que le vocabulaire est le plus pauvre. Et
malgré l'orthographe inédite des noms propres - qui va jusqu'à
l'invention de voyelles accentuées étrangères à la langue
française - malgré les entorses faites à la tradition dans le choix du
vocabulaire biblique, le nombre des hapax est plus faible chez Chouraqui que
dans la traduction de Maredsous. Le graphique 7 ne laisse aucun doute sur ce
point. Les écarts observés chez Chouraqui ne procèdent donc pas d'un
exercice de style, il ne s'agit pas pour lui de piquer la curiosité ni
même de dépoussiérer un texte trop convenu, ils tiennent à la
volonté du traducteur de retrouver , à travers le texte grec, les
réalités historiques qui ont entouré l'événement, et de proposer des
équivalents français non pas seulement aux termes grecs de l'original mais au
référent qu'ils recouvrent dans la culture
et l'histoire juives.
Figure 7. Histogramme des hapax dans le corpus évangélique
Le graphique 7 livre en outre une indication
précieuse, relative aux quatre évangélistes: quel que soit le traducteur, c'est
toujours Luc qui est le plus riche. La tradition veut qu'il ait été médecin et
que sa culture - encore approfondie par les leçons de Saint Paul - ait été plus
vaste que celle des autres évangélistes. Il a plus que les autres des qualités
d'historien et des dons de conteur: son information est plus riche et son
expression plus variée.
Mais ce premier résultat reste ambigu: deux
clivages apparaissent sans qu'on puisse dire quelle pente est la plus forte.
Doit-on mettre en avant l'opposition des traductions, ou celle des évangiles?
Pour en décider, il conviendrait de situer
chaque texte par rapport à tous les autres et de trouver une mesure pour
apprécier la distance de chacun à chacun. Hyperbase propose un premier
algorithme qui consiste, pour deux textes que l'on compare, à faire le
rapport entre les termes communs et ceux qui sont privatifs ou exclusifs. Un
second algorithme tient compte non plus seulement de la présence-absence mais
de la fréquence de chacun des mots dans chacun des textes. Les résultats
chiffrés sont consignés dans le tableau des distances ci-dessous (figure 8).
Figure 8. Le tableau des distances intertextuelles
en haut calcul sur V
(présence-absence), en bas calcul sur N (fréquence)
Arrêtons-nous un instant à la
dernière ligne du premier tableau pour en faire un gros plan. Elle
concerne l'évangile de Jean dans la traduction Chouraqui. L'histogramme de la
figure 9 rend compte des attractions qui s'exercent sur ce texte. La plus forte
est celle de l'auteur : d'un traducteur à l'autre, la distance est
faible quand la même source est en question (soit JNCH, JNTO et JNMA).
Les distances se raccourcissent aussi quand on a affaire au même
traducteur (soit JNCH, MTCH,MCCH et LCCH). Les distances les plus longues sont
observées quand aucune signature n'est commune, ni celle de l'évangéliste, ni
celle du traducteur.
Le tableau des distances se prête mieux
encore à une analyse globale qui projette sur une carte l'ensemble des
points comme ferait une carte géographique à partir d'un relevé des
distances de ville à ville. Le résultat de cette analyse factorielle est
illustré dans la figure 10.
Figure 9. Histogramme de la distance lexicale de Jean selon
Chouraqui
Figure
10. Analyse factorielle de la distance lexicale
La hiérarchie des variables mises en cause
est ici clairement établie: l'auteur compte plus que le traducteur. Le premier
facteur oppose en effet l'évangile de Jean ,
qui réunit sur la gauche les trois traductions de ce texte, aux autres
évangiles, tous situés sur la droite. Le second facteur pourrait isoler un
autre évangile, si l'influence des sources était souveraine. Or tel n'est pas
le cas: ce qui distingue le haut et le bas du graphique fait référence à
la traduction: celle de Chouraqui impose sa marque puissante aux textes
auxquels elle s'applique (MathieuCH, MarcCH, LucCH et même JeanCH),
tandis que les autres traductions sont reléguées au bas du graphique.
L'analyse arborée rend encore plus nette la représentation des forces
d'attraction qui s'exercent dans le champ lexical. Ici les distances s'apprécient directement en
parcourant le chemin qui mène d'un point à un autre. L'analyse
souligne l'irrédentisme de Jean qui s'écarte violemment des autres textes,
concentrés sur la branche opposée.
Cependant à mi-chemin une déviation conduit, du côté de Chouraqui,
tous les textes qu'il traduit et qui portent sa marque. Figure 11. Analyse arborée de la distance lexicale |
|
La même analyse s'applique au second
tableau des distances, mesurées en tenant compte de la fréquence, selon
l'algorithme de Dominique Labbé (partie inférieure de la figure 8). Les
enseignements sont à peu près les mêmes: la branche la plus
excentrique du graphique 12 isole les trois traductions de Jean, dont le
message apparaît irréductible aux autres évangiles. Les trois autres évangiles
apparaissent peu différenciés et laissent le champ libre à l'influence
du traducteur, les groupements proposés s'ordonnant autour de Chouraqui,
Maredsous et Tob respectivement.
Figure 12.
Analyse arborée de la distance lexicale (calcul sur fréquences)
On doit observer toutefois que même en
considérant tous les mots sans exception ni filtrage les deux mesures ne leur donnent pas le même
poids. La première donne l'avantage aux mots de faible fréquence, la
seconde aux mots courants. La première est plus sensible aux variations
thématiques, la seconde aux particularités stylistiques. Les différences qui
tiennent au sujet ont fait l'objet de maints commentaires qui soulignent
à l'envi l'originalité du texte de Jean, par la simple juxtaposition linéaire des
développements qu'on lit dans les
quatre évangiles. Ainsi le prologue de Jean prend la place de l'enfance du
Christ qui occupe les deux premiers chapitres de Mathieu et Luc. Si le récit
qui suit a trait à Saint Jean-Baptiste, l'épisode chez Jean n'est pas le
même et précède le récit des noces de Cana, qu'on ne trouve pas
ailleurs. Quand s'ouvre la mission messianique, Jean n'insiste guère sur
les guérisons du Christ là où
les autres évangélistes multiplient les miracles (mais il est le seul
à évoquer la résurrection de Lazare).
Quant à l'enseignement même du Christ, sa forme est
différente chez Jean: le message n'y passe plus par ces paraboles dont Mathieu,
Marc et surtout Luc sont prodigues. Le détail de ces différences n'a pas sa
place ici. Mais ces indications succinctes permettront de s'expliquer pourquoi
les chiffres tiennent la thématique de Jean à l'écart. Une
interprétation plus approfondie pourrait montrer en quoi diffèrent, non
seulement les épisodes traités, mais même les enseignements livrés. La
leçon de Jean est plus tournée vers l'amour,
la parole et la vérité. Ces valeurs sont hautement spécifiques chez lui, comme les
verbes correspondants aimer, croire et dire et l'adjectif vrai.
Reste à comprendre pourquoi les
critères proprement stylistiques isolent aussi le texte de Jean. La
critique traditionnelle a depuis longtemps observé que le ton de Jean était
plus personnel et plus direct. Elle a vu un aveu dans la mention qui est
faite, dans les derniers versets, du "disciple que Jésus aimait" et
une signature dans le verset 24: "C'est ce disciple qui rend témoignage de
ces choses, et qui les a écrites". La statistique dans ce domaine qui
touche à la pragmatique offre des moyens puissants d'investigation, en
circonscrivant la recherche aux pronoms personnels.L'histogramme 13, qui réunit
les trois traductions de Jean, illustre la domination de la première
personne et à un moindre degré de la seconde. La troisième
personne y est largement déficitaire, surtout lorsqu'il s'agit du pronom sujet
(il, ils) dont le récit au contraire est si friand. Jean est éminemment l'homme
du dialogue.
Figure 13.
Les pronoms personnels dans l'évangile de Jean
L'analyse factorielle appliquée à
l'ensemble des pronoms de dialogue souligne ce ton personnel si remarquable
dans l'évangile de Jean et si propre à inspirer les mystiques.
L'opposition la plus forte est entre Jean associé à la première
personne, à droite, et Marc installé à gauche dans la zone
dévolue à la troisième personne. Les choix de Luc sont proches de
ceux de Marc, tandis que Mathieu propose un compromis qui fait sa place
à la seconde personne.
Figure 14.
Analyse factorielle des pronoms personnels
On ne saurait dire si les pronoms personnels
sont à ranger parmi les variables thématiques ou stylistiques. Leur
charge sémantique est pleine et entière, qu'ils jouent un rôle
anaphorique ou non. Mais en même temps ils participent grandement
à la forme de l'écriture, au point qu'il suffit parfois de connaître
leur dosage pour deviner à quel genre littéraire on a affaire.
Le dosage des catégories grammaticales permet
une décantation semblable. En principe le thème intervient peu lorsqu'il
s'agit de choisir entre un verbe, un substantif ou un adjectif, car les
mêmes sèmes peuvent être communs au substantif et au verbe
ou à l'adjectif qui lui correspondent, ce qu'on vient d'observer pour
les couples amour/aimer, parole/dire et vérité/vrai. En réalité dans la répartition des parties du discours
comme ailleurs, s'affirme l'originalité de Jean, quel que soit le traducteur.
Dans la figure 15 les trois traductions de Jean affirment leur proximité sous
ce rapport, au haut du graphique. Tout se passe comme si les variables
stylistiques comme les thématiques appartenaient de façon indélébile à
l'original grec et s'imposaient au
traducteur.
Figure 15.
Analyse arborée des parties du discours avec représentation des textes, puis
des catégories
Le même graphique dans sa moitié
inférieure analyse les alliances et les oppositions dans la bataille que se
livrent les catégories grammaticales. Comme on l'a observé en de multiples
occasions, il y a deux clans qui s'arc-boutent aux deux extrémités de la
chaîne. Le substantif tire d'un côté, aidé de l'adjectif, des déterminants
et des prépositions, le verbe tire dans
l'autre sens, avec ses alliés: adverbes, pronoms et subordonnants. Les
participes se situent dans l'entredeux, le participe passé plus près du
verbe et le présent plus près de l'adjectif.
Reste à superposer les deux
représentations de la figure 15 et à vérifier dans quel camp se rangent
chacun des textes. L'analyse de correspondance opère ce recouvrement
dans la figure 16. Comme on pouvait s'y attendre, Jean accapare la catégorie
verbale, à gauche du graphique, les autres évangélistes étant rejetés
à droite, dans l'environnement des classes nominales. Ce ne sera pas une
surprise pour les exégètes qui ont insisté depuis longtemps sur le
caractère concret du récit des premiers évangélistes, surtout de Marc,
contrastant avec la communication plus personnelle et plus mystique qui est le
propre de Jean. On connaît le jeu de mot de Hugo ("Car le mot c'est le
verbe et le Verbe c'est Dieu."), qui prend sa source dans le Prologue de
Jean: "Au commencement était le Verbe… et le Verbe s'est fait chair."
Oserons-nous imiter Hugo et surimposer un second calembour au sien, en donnant
au verbe un sens grammatical?
Figure 16.
Analyse factorielle des parties du discours
À lui seul le premier facteur qui rend
compte de cette opposition absorbe 73% de la variance. Le second facteur ne
représente que 13% et est presque négligeable. Il fait la distinction entre les
traductions ( Chouraqui en haut, Tob et Maredsous en bas) et la fonde, non pas
sur quelque goût particulier pour telle ou telle partie du discours, mais
sur la tendance à cultiver le singulier ou le pluriel. Dans l'étiquetage
du corpus en effet , la marque du nombre avait été notée, lorsqu'il s'agissait
d'une flexion distincte, qu'il s'agisse d'un verbe, d'un déterminant, d'un
pronom, d'un substantif ou d'un adjectif.
Mais cette opposition singulier/pluriel n'est pas tout à fait
indépendante de la première: lorsque le texte à traduire est
celui de Jean, c'est le singulier qui l'emporte, même sous la plume de
Chouraqui. Là encore s'affirme la relation individuelle que le Fils
entretient avec le Père, l'apôtre avec le Messie, et le fidèle
avec Dieu.
Au
terme de ce parcours trop rapide, la statistique n'a pas invalidé les acquis
d'une critique, dévote ou irrespectueuse,
qui s'est exercée depuis des siècles sur le texte sacré. Dans toutes les
analyses qu'on vient de passer en revue, elle invite à conclure que
l'auteur a plus d'importance que le traducteur, du moins lorsque l'auteur a la
personnalité et l'originalité de Saint Jean. S'agissant des autres évangiles,
qui ne sont pas sans s'être inspirés les uns des autres, leur
individualité s'efface parfois devant le tempérament, vigoureusement affirmé,
de l'interprète, surtout lorsque le traducteur a l'autorité et l'audace
de Chouraqui.
Il serait pourtant imprudent de trop compter
sur les méthodes quantitatives pour résoudre des énigmes encore en suspens et
décider si oui ou non l'apôtre Jean est le même homme que l'évangéliste.
Encore faudrait-il faire entrer dans le calcul d'autres textes qu'on attribue
à la même plume, l'Apocalypse
et trois Epîtres. Mais des
interférences se produiraient sans doute liées au sujet, au genre, au
destinataire, et l'expérience perdrait alors de sa pureté.
[1] "La statistique résout-elle les problèmes d'attribution?", en collaboration avec Charles Muller, Strumenti critici, III, n°3, 1988, Florence, p. 367-387.