A világháló robbanásszerű betörése megváltoztatta az ismeretszerzés szokásos módjait. A digitalizáció következtében a könyv, mint a szöveges információ megőrzésének és terjesztésének szinte kizárólagos eszköze, másodlagossá vált az elektronikusan rögzített tartalmakhoz képest, még ha nem minden területen is. A szépirodalom, a gyermekirodalom, a lektűr, az újság, a regény még sokáig megmaradhat nyomtatott formátumban, az értekező irodalomban azonban már régóta elkezdődött a paradigmaváltás, és mostanra már uralkodóvá vált. Több mint negyvenöt éve egy tudományos könyvkiadóban dolgozom, a tudásom és a szakmai tapasztalataim innen származnak. Cikkemben elsősorban erről a területről hozom a példákat az említett átalakulásra.
Ősnyomtatványtól a szakmai kiadásig
Az emberi tudás, irodalom, történelem, azaz a kulturális örökség rögzítése, a múlt valamennyi eredményének megőrzése és továbbadása írott formában és viszonylag időtálló hordozón kulcskérdés az emberiség fennmaradásának szempontjából.
A kéziratos íráskultúra helyébe lépő könyvnyomtatás (1453 körül) lehetővé tette a tömeges olvasást, a többszörözést, a terjesztést és a biztonságos megőrzést. A nyomdai, kiadási, terjesztési „ipar” professzionalizálódott, létrejöttek az ehhez kapcsolódó intézmények (könyvtár, könyvesbolt stb.). Az írott kultúra megőrzése a kellő számú, fizikailag is létező könyvek révén hosszú időre biztosította a könyvekben tárolt szövegek továbbélését. Elérkezett a könyvkiadás aranykora: a szakma minden kapcsolódó területe tökéletesre csiszolódott: kialakultak a kézirat megmunkálásának szabályai, az ehhez kapcsolódó foglalkozások, szakmai körök. A szerzői, kiadói jogvédelem és a kiadás technikai része egyre tökéletesebbé vált, a terjesztés, árusítás konszolidálódott. Megszületett az együttműködés a könyvvel érintkező területekkel (könyvtár, oktatási intézmény, könyves szervezetek).
A világháló szétbombázta a rendszert
Teljesen megváltoztatta a digitalizáció ezt a jól bejáratott utat. Az első megdöbbentő felismerés a terjesztés leegyszerűsödése volt. Egy műpéldány – a könyv helyett egy digitálisan rögzített adategyüttes – akár korlátlan számú olvasóhoz is el tud jutni. Azaz nem a tartalomhordozó birtoklása a lényeges, hanem a hozzáférés az információhoz.
A paradigmaváltást kezdetben sokan félreértették. A nyomtatásban megjelent, gondosan megszerkesztett könyv lefényképezése és esetleg egy kereső hozzákapcsolása nem jelent forradalmi változást. Annyi az eltérés a szokásos olvasástól, hogy a nyomtatott művet a képernyőn nézzük, és a könyvtől eltérő módon kezeljük (lapozás helyett görgetés, keresés, kimásolás stb.).
Korábban az olvasáshoz minden egyes esetben egy szöveghordozó dokumentumot kellett kézbe venni. Ma is kell valamilyen fizikai tárgy (számítógép, mobileszköz) a szöveg befogadásához, továbbá internetes hozzáférés. A leglényegesebb különbség, hogy az újfajta olvasási mód átalakítja magát a tartalmat is. A kezdetben neten olvasható könyvutánzatok helyébe más módszerekkel létrehozott szöveges tartalmak lépnek.
A digitális művek létrehozásához a teljes könyvkiadási folyamatot át kell alakítani. A mű már eleve digitális médiumra készül, számításba véve azokat az olvasási, felhasználói igényeket, amelyeket ki kell szolgálnia. Nem elégséges a szöveg garantált szakmai megművelése, információtechnológiai hitelesítése is szükséges. Ha bármelyik kárt szenved, használhatatlan vagy nem megfelelő minőség jön létre.
Első körben és tömegesen a szakkönyveket, referenciaműveket érintette a digitalizáció. Éppen azért, mert gyakran változó, avuló tartalomról van szó, belátható, hogy ezeket a legcélszerűbb digitális formában rögzíteni, megőrizni és terjeszteni, és a tartalom továbbfejlesztése, szerkesztése esetén a felesleges többletmunkákat megtakarítani. A legnagyobb arányban digitalizált kiadványok a lexikonok, szótárak, kézikönyvek lettek.
Hamar kiderült, hogy nem elégséges csupán digitalizálni, a szakkönyvkiadás esetében már az elkészítés során célszerű és hasznos olyan tartalmi metainformációkkal ellátni a szöveget, amelyeket az olvasó nem lát, de használ. Így jöttek és jönnek létre folyamatosan az XML (Extensible Markup Language/Kiterjeszthető jelölőnyelv) alapú vagy más, szabványos leíró nyelvvel rögzített adatbázisok, használható tartalmak. Ahhoz, hogy a szöveg az online térben megszokott módon olvasható, kereshető, jegyzetelhető, kimásolható legyen egyre több háttérmunkára van szükség. Ennek eredményeként a hagyományos könyvkiadás helyébe a sokoldalúan felhasználható tartalomszolgáltatás lép.
A szakkönyvkiadás előreszaladt
Még jobban felértékelődik a kiadói tudás a helyzet megváltozásával. Nem elégséges a szöveg szokásos szerkesztői, lektori, korrektori, tipográfiai, arculati megmunkálása, még számos információtechnológiai jártasságot igénylő munkafolyamatot is el kell végezni a publikálásra szánt szövegben. Ezekre azért van szükség, mert korábban többnyire sorról sorra olvastunk, ahogy a könyvszabvány ismert módon és követhetően megkívánta. Az új olvasás más igényeket támaszt. Egyrészt a gép segítségével számos inkonzisztencia felderíthető, kijavítható, olyanok is, amelyek korábban a normál szerkesztés és olvasás során nem tűntek fel, másrészt a szerkesztőnek többletmunkát kell ráfordítania az interneten való tartalomfogyasztás biztosítására.
Ezzel kapcsolatban számomra a legemlékezetesebb eset az volt, amikor 2012-ben kétnyelvű szótárainkat kezdtük el forgalmazni mobileszközökön. Ahhoz, hogy a szótárakat az Android, iPhone és Windows eszközökön is lehessen használni, mindegyiket fel kellett készíteni a különböző platformokra, az adott rendszerre. Azaz informatikai, fejlesztési munkát kellett elvégezni rajtuk pusztán a „használhatóság” kedvéért, úgy, hogy a tartalmon semmit nem változtattunk. Sok vásárló nem értette, miért kell megkérdeznünk, hogy milyen eszközt használ. Nem tudhatták, hogy ha a tartalom minden eszközön ugyanaz, akkor miért kulcskérdés az adott eszköz által használt szoftver. Idővel azonban a technológiai fejlődés már ezt a problémát is megoldotta. Az nyeri meg a versenyt, aki a hagyományos szerkesztői tudást és az egyre megújuló informatikai ismereteket a legmagasabb szinten ötvözi, és a kettő kölcsönhatásával hozza létre a digitális tartalmat.
Az olvasók egyre kevésbé érik be statikus tartalommal. Használni szeretnék a könyvben található információkat a saját igényeikhez szabva. Egyre több többletérték kapcsolódik a digitális tartalomhoz. A verseny ma arról szól, ki tudja a legjobban kiszolgálni a felhasználót. A legnagyobb figyelem a szakfelhasználókra irányul, azokra, akik nemcsak élvezetből olvasnak, hanem a szakmájuk műveléséhez szükséges ismereteket kutatják. A szakemberek olyan megoldásokat keresnek, amelyek segítik a munkájukat, például a gép helyettük olvas, keres, jegyzetel. Ne legyen félreérthető: a „helyettük olvas” csak annyit jelent, hogy egy szoftver képes végigpásztázni sok szöveget a releváns információért, így felszabadul az idő az érdemi olvasásra.
A könyvekben rögzített tartalom célja egyrészt az azonnali felhasználás, másrészt az emberi tudás megőrzése, megosztása és folyamatos továbbörökítése a következő nemzedékeknek. A digitális kiadás célja ugyanez: az emberi tudás digitális tárházának építése egymással összekapcsolható módon, az újabb technológiák folyamatos integrálásával. A digitalizáció a kiadás, a terjesztés, az olvasás, a „felhasználás”, a könyvtár, az adatmegőrzés és a tudásmegosztás egész ökoszisztémáját megváltoztatja.
Az MI még mélyebbre hatol
Ha az információk rögzítésében és terjesztésében a könyvnyomtatás feltalálását tekintjük az első jelentős paradigmaváltásnak, a másodiknak a digitalizáció megjelenését, akkor a mesterséges intelligencia alkalmazásával elérkeztünk a harmadik paradigmaváltásig. A könyvkiadók kóstolgatják: fülszövegek, tartalmi összefoglalók megírására használják, persze emberi ellenőrzéssel. A cél: gép segítségével kiváltani a mechanikusabb emberi munkát abban a reményben, hogy a felszabaduló időt értékesebb szellemi tevékenységre fordíthatják.
Bizonyos vagyok benne, hogy forradalmi átalakulásnak vagyunk aktív részesei, amely a szakkönyvkiadást, a tényirodalmat teljesen megváltoztatja.
A kutató, a szakember, az oktató, a tanuló valamihez olvas, nem csak minőségi időtöltésből. Ahhoz, hogy valamilyen eredményre jusson, sok könyvet, folyóiratot, elektronikus könyvtárban tárolt művet kell megnéznie, elolvasnia, megkeresnie benne a neki szükséges adatot. Azaz összeolvasni sok mindent, ebben lesznek „fölösleges” olvasmányok is, de ez nélkülözhetetlen ahhoz, hogy eljusson a neki kellő információkhoz. Ma már rendelkezésre állnak olyan szoftverek, amelyek nagy nyelvi modelleket használva (Large Language Model, LLM) kigyűjtik az olvasó számára a kért területeket, témákat, így csak azokat kell elolvasnia. Az évtizedek során létrehozott hatalmas digitális állományokból óriási, többnyire rendezetlen, némelykor rendezett világkönyvtár épül, amelyből ki lehet nyerni a szükséges szövegeket. A ChatGPT mint betanított, emberi nyelvet használó kérdés-feleletes nyelvi modell meglepetésszerűen irányította rá az átlagolvasók figyelmét a régóta használt mesterséges intelligenciára.
Előre kell menekülni
Az élvezetből, tudásvágyból és a tanulmányainkhoz való olvasás, a szépirodalom, egyes folyóiratok és újságok esetében valószínűleg sokáig fennmarad a nyomtatott formátum. Mint alternatíva mindez olvasható számítógépen, mobileszközökön, azaz az olvasó megválaszthatja az olvasó eszköz tárgyát. Ezzel szemben a tényirodalom, a szakirodalom, a tudományos folyóiratok, a referenciaművek, monográfiák, kritikai kiadások előbb vagy utóbb valamilyen leíró nyelv, szabvány segítségével (XML, TEI, DokBook XML) digitalizált állományokba kerülnek, ahol ember vagy gép fel tudja használni, továbbadható, archiválható, megőrzendő kulturális örökségként. Azáltal, hogy minden folyamatosan digitalizálódik, hatalmas tudásanyag válik hozzáférhetővé, többé nem csak könyvekbe zárva.
Helyettünk olvas, helyettünk keres?
A mesterséges intelligencia nyelvi modulja nagy és ismeretlen adathalmazban keresi a megfelelő adatokat. Mivel ez a folyamat ellenőrizhetetlen, téves információkat is tartalmaz, nem megbízható. Új kifejezés született erre: a gép hallucinál. De ha olyan adatbázisokban keres, vagy azok segítségével teszi pontosabbá a választ, amelyek megszerkesztettek, akkor a válaszok is pontosak lesznek. Ilyen például a RAG (a mesterséges intelligencia fejlettebb módszere: visszakereséssel bővített válaszgenerálás, Retrieval-Augmented Generation), amely külső tudás integrálásával növeli a mesterséges intelligencia pontosságát, és naprakész, releváns válaszokat nyújt. Hasonló folyamat zajlik le, mint a könyvkiadás fejlődésekor. Ha feldolgozott, hiteles, megbízható adatokhoz akarunk jutni, megfelelő források kellenek, ráadásul jól olvasható, feldolgozott és feldolgozható formában. A könyvekben, világhálón, adatbázisokban „tárolt” hatalmas mennyiségű és egymással összekapcsolható emberi tudásanyag kereshetővé válik. Igaz, elvész a felfedezés, a kutatás izgalma, a narratívák kritikája. Ugyanakkor tagadhatatlan, hogy az így feldolgozott irodalom újabb, eddig nem látott kutatási eredményekhez vezet.
A RAG nemcsak keresésre képes, hanem a jó információt felhasználva megalapozottabb tartalmakat képes előállítani. Ha például egy kiadó garantáltan megbízható könyvanyagát használhatja szövegek generálására, akkor az így létrejött szövegek is pontosak lesznek. Könnyen megjósolható, hogy az MI a folyamatos tanulás eredményeképpen a tartalomfejlesztésben is egyre hangsúlyosabb szerepet kap.
„Ha ki király, Sorsának a királya” – írja Ady a Hunn, új legendában. Mi csinálunk mindent, rajtunk múlik, hogyan alakul a kulturális örökség sorsa, tárolása, továbbadása, megőrzése. Ha rémnek tekintjük, meg kell fékezni; ha eszköznek, jól kell alakítani. De a változás szelleme kiszabadult a palackból.
A szerző szerkesztő, az Akadémiai Kiadó tartalomfejlesztési vezetője
Nyitókép: A modern könyvnyomtatás emlékműve az Eszmesétányon 2006-ban a Humboldt Egyetem előtt Berlinben, fotó: Ryan Hadley, CC BY-SA 2.0, Wikimedia
|