PALIMPSZESZT
10. szám --[ címlap | impresszum | keresés | mutató | tartalom ]

GOLDEN Dániel
Szöveg((l)elés)

„A szöveg maradéktalanul átvihető egyik hordozóról a másikra, átírható más kódba és visszaírható az eredetibe.”


Az ezredvégi magyar irodalomtudományosság egyik legjelentősebb szövege a Szöveg c. szöveg, melynek a textológia, az irodalomelmélet, az irodalomtudomány-történet, a tudományfilozófia, valamint a Balassi-filológia területén felmutatott eredményei aligha értékelhetőek túl. Mindannyiunk érdeke, hogy ez az igen fontos szöveg kifogástalan állapotban maradjon fenn az utókor számára. E nemes céltól vezéreltetve végeztem el az itt következő szövegkritikai vizsgálatot.

A szöveg az eddig elvégzett forráskutatás nyomán 6 változatban áll rendelkezésünkre. Ezek a következők:

nyomtatott források:

elektronikus források:

A források közül kettő (ny2 és e2) töredékes, a másik négy teljesnek mondható, de közöttük is számos jelentős eltérés figyelhető meg. A töredékesség ny2 esetében koncepcionális (egy szöveggyűjteményről van szó) ill. tudománypolitikai (a szöveg második fele néhány, a szakmai közösség számára feltehetően kínos megjegyzést is tartalmaz) okokkal magyarázható, míg e2 esetében a könyvtár archiválási eljárásából következik.

A cím („Szöveg”) és a szerző („Horváth Iván”) megjelölése (az írásváltozatoktól eltekintve) valamennyi esetben megegyezik. Ez utóbbihoz még a szövegek keletkezésének időszakán belül is egy nagyobb szöveguniverzum tartozik (a gépgyártás elméletétől a nyelvvizsgák gyakorlatáig), ám ennek egy, az irodalomtörténet kérdéseit tárgyazó része jól szegmentálhatónak látszik, melyhez a szövegközi kapcsolatok alapján jelen Szöveg is nyugodt szívvel csatlakoztatható.

Az e2 töredékhez tartozó fejlécben (a Magyar Elektronikus Könyvtárban használatos katalóguscédula) az elektronikus változat keletkezési idejeként 1996 júniusa van megadva. Mivel a fejléc másik mezője forrásként az e1 szöveg elérési útját adja meg, annak megjelenésére is ez az időpont valószínűsíthető. Ugyanez vonatkozik a könyvtári polcon az e2 mellett elhelyezett, sőt annak megjegyzés rovatában is hivatkozott („A teljes szöveg a HTML változatban olasható.”) e3 forrásra. (Az e1 szöveg datálását az is megerősíti, hogy virtuális szövegkörnyezetéül a hivatalosan szintén 1996 júniusában megnyitott Internet EXPO szolgál.) Mivel az e4 forrás egy nagyobb hiperszöveg részét képezi, mely a Neumann-ház (Neumann János Multimédia Központ és Digitális Könyvtár) 1998 márciusától üzemelő honlapján jelent meg, ennek keletkezése ekkorra, vagy ennél későbbre tehető.

A szövegek pontos leszármazásának megállapításához sorra kell vennünk a köztük lévő eltéréseket.

A nyomtatottaktól eltérően az elektronikus források esetében el kell különítenünk a látvány és a kódolás szintjeit. Egyrészt nem szabad az éppen rendelkezésünkre álló szoftver és az adott esetben korrekt kódolás közti konfliktusokból messzemenő következtetéseket levonnunk. Másrészt elképzelhető egy szintaktikailag helytelen, következetlen rögzítés, mely az adott feltételek melletti megjelenítéskor mégis (részben vagy egészben) kielégítő eredményt ad.

Mindkét nyomtatott forrás a XX. század végi egyezményes magyar nyelvű írásrendszerben íródott. Az elektronikus források közül e2 tiszta ISO 8859-2-ben, e1, e3 és e4 az ISO 8859-2-re támaszkodó HTML-ben készült, azzal a különbséggel, hogy utóbbiban néhány karakter a Unicode-alapú Windows 1250 szerint van kódolva.

Az első probléma mindjárt az ISO 8859-2-es kódtábla terjedelméből fakad: az ISO 8859-1 alternatívájaként nem teszi lehetővé a csak ott szereplő karakterek rögzítését (Cćlia, Počmes stb.) A másolók az egyetlen lehetséges megoldást választották: ISO 8859-1 ill. Unicode szerint kódolva helyezték el az érintett karaktereket. Ezek megjelenítése azonban megoldhatatlan, pontosabban csak a speciális magyar karakterekről való lemondás árán valósítható meg.

Különleges karaktereink közül ugyanis a kis és nagy ő és ű olyan helyet foglal el, ahol a rivális kódtáblában más jeleket találunk. Mindez nem is jelent gondot mindaddig, amíg egyértelműen megállapítható: az adott szöveg(részlet) melyik rendszer szerint kódolódott. A HTML nyelv azonban sajnos meglehetős káoszt idézett elő ezen a területen: a magyar nyelvű szövegek kódolásában ugyanis általánosan elterjedtté tette a ´ típusú jelöléseket. Ez az SGML-szintaxisú leírás önmagában még mindig nem volna baj, ha az ő és ű betűkre nem az õ ill. û alakokat kellene használni. Ezeknek ugyanis (a többivel ellentétben) semmi közük a magyar karakterekhez (korrekt SGML-beli leírásuk: ő, ű), mindössze a 245-ös és 251-es kódhelyekhez (ahol az ISO 8859-2-ben valóban a mi betűink szerepelnek) tartozó ISO 8859-1-beli karaktereket nevezik meg.

Ennek megfelelően e1-ben és e4-ben az õ és û alakokkal találkozunk. Bonyolítja a helyzetet, hogy a kódolás alapjául szolgáló karakterkészletre vonatkozólag e1 fejlécében nem találunk eligazítást, e4 viszont kifejezetten azt állítja magáról, hogy „charset=windows-1250”, ami azonban csak a néhány, HTML-re le nem fordított speciális karakterre igaz. Ennél is különlegesebb eset e3-é. A másoló felfigyelt az e1-ben található tipikus hibára: Ő helyett [[Otilde]] áll, s ezt javította is – Ô-re. Sőt, tökéletes következetességgel a kis ő-ket reprezentáló valamennyi õ-t is ô-re írta át. Ennek az első látásra érthetetlen cselekedetnek a megértéséhez azt kell tudnunk, hogy a kilencvenes évek elején uralkodó magyar fejlesztésű kódtáblában, a CWI-ben az ő azon kódhelyre (147) került, ahol a kiterjesztett ASCII-ban az ô állt. A HTML betörésének kezdetén tehát az azt még kevéssé ismerő másoló minden valószínűség szerint korábbi gyakorlati tapasztalataira hagyatkozott, s így hajtotta végre a cserét. Nem vette figyelembe, hogy az ISO 8859-1-ben az ô történetesen az ő közvetlen szomszédja (kódjaik: 212 és 213 ill. 244 és 245), s a magyar ő ez utóbbi helyén található az ISO 8859-2-ben. A két rossz közül tehát még mindig az õ alak a kisebbik, mellyel megfelelő körülmények (azaz egy az ISO 8859-2 kódtáblára épülő betűkészlet használata) esetén a kívánt látvány előidézhető.

A HTML-átdolgozásnak kényszerűen áldozatul esnek az olyan speciális jelek is, mint a magyar idézőjelek vagy a gondolatjel. Így az előbbiek helyett e1-ben, e3-ban és e4-ben " "; utóbbiak helyén e1-ben és e3-ban -, e4-ben -- szerepel.

Külön csoportot alkotnak a helyesírásbeli eltérések. Az egybeírás–különírás tekintetében például szabályos harc folyik ny1–2 ill. e1–4 másolói között: többes számú – többesszámú; sok minden – sokminden; záró jelkép – zárójelkép; magyar nyelvű – magyarnyelvű stb.

Az egyetlen kivétel (mely az e2 keletkezésének kérdésében egyedüli eligazító bizonyítékul szolgál): ny1, ny2, e2, e3: magától értődő; e1, e4: magátólértődő. Ennek alapján valószínűsíthető, hogy e2 nem e1-ből készült közvetlenül, hanem előbb e3 e1-ből, majd e2 e3-ból.

A két legsúlyosabb, értelemzavaró szövegromlás minden bizonnyal a következő:

illetve:

Érdekes kérdés ny2 helyzete. A keletkezés ideje szerint származhatna e0-ból, e1-ből vagy akár e3-ból is. S ez volna a logikus: az elektronikus szedés korában a kéziratokat célszerűbb azonnal digitális formában gyűjteni (eltekintve persze a sokszor azért igencsak számottevő konvertálási problémáktól). Az ny2-ben található hibák és javítások azonban az mutatják, hogy minden valószínűség szerint nem ez, hanem ny1 újragépelése történt. Egy-egy karakternek vagy csak kurziválásának sorozatosan ismétlődő (de nem algoritmizálható) eltün(tet)ése egy elektronikus változattal való munka esetén nehezen elképzelhető. Annál inkább az ilyen apró figyelmetlenségekkel mindig járó kézi rögzítés esetén.

ny1, e1, e3, e4 ny2
álldogállt álldogált
jószága) jószága)
Anyám tyúkja, Anyám tyúkja,
képzőművészeti képzőművézeti
herméneutika.) herméneutika,)
régi, fogós régi fogós
nyelvhasználatbeli nyelvhasználati
versgyűjtemények versgyűjetmények
újabban újaban
ny1, ny2 e1, e3, e4
ideologikus ideológikus
ny1, ny2, e3 e1, e4
részt vesz résztvesz

Az ismert változatok közül tehát e1-ből keletkezett e3 és e4 (egymástól függetlenül), e2 e3-ból készült; ny2 pedig nyl-ből. A két ág tetején álló e1 és ny1 különbségei miatt azonban feltételeznünk kell egy ősmásolatot is, mely valószínűleg egy Word for Windows 2.0-ban készült dokumentum lehetett (e0).

Kutatásunk megnyugtató lezárása, a hiteles szöveg helyreállítása csak eme elektronikus kézirat fellelése után képzelhető el.
[ címlap | impresszum | keresés | mutató | tartalom ]