Bölcsészet Bábeli Könyvtárban

 

5. Szövegrögzítési eljárások

5.1 Mivel az adatbázisokat célszerű ellátni mind tudományos, mind oktatási felülettel (3.1), a szövegrögzítésben is nyújtanunk kell ugyanígy kétfélét: a tudományos igényű mellett egy könnyen olvashatót is.

5.2 A magyar irodalomtudomány főleg a következő, elvileg is jó, egymással is megférő szövegrögzítési eljárásokat használja, s ezért mindegyikük ajánlható:

5.2.1 hasonmással szinkronizált betűhű átírás (Balassa-kódex),

5.2.2 morfo-fonematikai átírás (POEM-adatbázis), mely elsősorban a szemantikai lekérdezéseket könnyíti meg,

5.2.3 betű-szám-jelölő (az MTA Nyelvtudományi Intézetének eljárása),

5.2.4 HTML fényképhasonmás nélkül, de szövegváltozatokkal (Internet József Attila-adatbázis)

5.2.5 ugyanez fényképhasonmással (Internet Balassa-kódex),

5.2.6 SGML (és a Text Encoding Initiative).

5.2.7 Jól használható továbbá minden, lehetőleg 7- (a legszigorúbb hálózati szabványoknak is megfelelő), vagy esetleg 8-bites olyan szöveg- és kiadványszerkesztő (például SGML, HTML, TEX, Ventura, AmíPro, WordPro, XyWrite, NotaBene, Word RTF), amelynek utasításai beszúródnak a szövegbe. Amit így rögzítettünk, az akár évtizedek múltán is tökéletes pontossággal átalakítható marad bármely más, hasonló szerkezetű szöveg- vagy kiadványszerkesztő követelményei szerint.

5.3 A tanulók által könnyen olvasható felület számára viszont egyelőre nincs jó megoldás. A Művelődési és Közoktatási Minisztérium által országosan elterjesztett újabb Microsoft termékek (Windows 3.1, Windows for Workgroups, Windows 95) betűkódtáblája nem felel meg a magyar szabványnak, így ezeknek tulajdonképpen kereskedelmi forgalomba sem lett volna szabad kerülniük. A IBM OS/2 szabványos, de nem élvezi az állam támogatását.

Függetlenül az apróbb hátrányoktól, természetesen mindenképp igazodnunk kell a nemzeti szabvány előírásaihoz.

5.4 A bölcsészettudományokban a nagy történeti anyagot felölelő adatbázisokhoz képest az oktatási szakanyagok fontossága másodrendű, de semmiképp nem jelentéktelen. Az ilyen szakanyagokat természetesen hiperszövegként kell elkészíteni. Az egyetlen szóbajöhető formátum a HTML. A HTML állományokban ideiglenesen elfogadható a magyar szövegekben rendkívül ritka, tildés magánhangzó a kétvessző-ékezetes betűk helyett, de csak addig, amíg a nemzetközi HTML ajánlásból hiányoznak ezek a betűk.

A szakanyagok alkotói legyenek tekintettel arra, hogy a tanulók teremtő képzeletét és együttműködő hajlandóságát akár közös szövegszerkesztéssel is (ilyen eszköz ma a Lotus Notes) fejleszthetjük.