Avainsanat: digitointi
23. joulukuuta 2014, 12.00 Tuija Tapaninen

Kirjavanhus matkaa bittiavaruuteen

Joulukuinen aamu on harmaa, kun rispaantunut kirjavanhus noudetaan Tilastokirjaston varastosta. Tätä vanhus on jo odottanutkin. Että se vihdoin valittaisiin.

Pölyt puhalletaan kirjavanhuksen päältä, ja se pääsee vuosikymmenten tauon jälkeen tuulettamaan kellastuneita sivujaan. Hieman sitä harmittaa jättää identtiset kaverinsa, mutta ne ovat päässeet kyläilemään jo useaan otteeseen erilaisissa kodeissa ja toimistoissa. Tässä reissussa on varmaan jotain erityistä, tuumaa vanhus mielessään.

Digitointisuunnitelma perustuu pääosin kirjojen (huonoon) kuntoon, järjestys määräytyy sen mukaan kuinka paljon aineistoa käytetään.

Digitointisuunnitelma perustuu pääosin kirjojen (huonoon) kuntoon, järjestys määräytyy sen mukaan kuinka paljon aineistoa käytetään. (Kuvat: Tuija Tapaninen)

Mutta voi kauhistus. Tätä kirjavanhus ei todellakaan osannut odottaa. Juuri kun se oli ajatellut pääsevänsä johonkin hienoon paikkaan, niin se joutuukin giljotiinin kouriin.

Ensin siltä irrotetaan kannet, sitten selkämys leikataan irti suurella paperileikkurilla ja irtolehdet käydään läpi sivu sivulta. Puuttuvat sivut etsitään muista niteistä, revenneet sivut paikataan teipillä, lyijykynämerkinnät poistetaan, aukeaman kokoiset taulukot merkataan ylös ja liitteet tai värilliset graafit merkitään pienillä merkkausteipeillä. Lopuksi irtolehdet laitetaan kansioon odottamaan matkan jatkumista. Takaisin pimeyteen.

Tilastokirjaston paperileikkurilla purettu sidos leikataan irtolehdiksi.

Tilastokirjaston paperileikkurilla purettu sidos leikataan irtolehdiksi.

Päivä päivältä kirjavanhuksen kansio lähestyy seuraavaa vaihetta, ja viimein H-hetki koittaa. Nyt uudet kädet avaavat kansion, ja irtolehdet lätkäistään skannerin syöttöalustalle. Fiuuh-viuuh-fiuuh-viuuh sivut toisensa jälkeen kulkevat skannauslaitteen syövereiden läpi. Tarkkaavainen käsittelijä huomasi hyvän esikäsittelyn ansiosta skannata värilliset graafit paremmalla harmaasävyllä normaalin musta-valkoisen sijaan.

Kirjavanhus on pökerryksissä moisesta polkasta ja huokaa helpotuksesta päästessään taas takaisin kansion suojiin. Vanhuksella on kuitenkin omituinen, jakautunut olo. Kansion pimeyden rinnalle on tullut toinen todellisuus.

Skannaus suoritetaan A4/A3-läpisyöttöskannerilla.

Skannaus suoritetaan A4/A3-läpisyöttöskannerilla. 

Päivän hämärtyessä kirjavanhus huomaa jälleen liikkuvansa. Uudet kädet avaavat kansion, tällä kertaa vain ottaakseen esikäsittelijän merkkaaman taulukkolistan. Kirjavanhusta itseään ei enää käsitellä, nyt työtä tehdään sen rinnakkaistodellisuudelle, PDF-kirjalle.

Jo aikoja sitten latomossa, kirjapainossa ja sitomossa vinksalleen heilahtaneet sivut suoristetaan tietokoneohjelman avulla. Toisella ohjelmalla toisistaan erilleen joutuneet aukeamataulukot yhdistetään ja kohdistetaan, jotta sivu olisi mahdollisimman helppolukuinen. PDF-kirja odottaa jännittyneenä tulevaisuuttaan digitaalisessa maailmassa, kun taas kirjavanhus lepäilee tutussa kansiossaan.

Yhdistetty aukeamataulukko.

Yhdistetty aukeamataulukko.

Kansio liikahtaa jälleen. Tällä kertaa PDF-kirja aukaistaan ohjelmalla, joka yrittää parhaalla mahdollisella tavalla tehdä automaattisen tekstin tunnistuksen. Ulkomailla sitä kutsutaankin hienosti Optical character recognition eli OCR.

Ohjelma ehdottaa jokaiselle sivulle tulkintansa mukaan tekstiä, taulukkoa tai kuvaa. Tulkinnat ovat välillä tosi hupaisia, naurahtaa PDF-kirja. No, niistä pahimmat korjataan selkeämmiksi samalla kun sivusilmällä tutkaillaan Kirjavanhuksen sielunelämää – mitä kaikkea se kertookaan kotimaan kehityksestä vuosien saatossa.

Valmiille työlle tehdään vielä lopputarkastus ja sitten se tallennetaan PDF-A-kirjaksi. Nyt kirjavanhuksen matka alkaa olla lopuillaan. Vielä viimeinen hellä silmäys sen keltaisiin sivuihin, viimeinen nuuhkaus sata vuotta vanhaan paperiin ja sen viimeinen matka selluloosaksi on käsillä.

Samanaikaisesti PDF-A-kirja on tohkeissaan. Lukemattomien muiden digitoitavien aineistojen tavoin se saa uusia lukijoita virtuaalitodellisuudesta, Kansalliskirjaston www.doria.fi -palvelusta, josta kaikki Tilastokeskuksessa digitoidut tilastojulkaisut löytyvät.

 

Blogikirjoitukset eivät ole Tilastokeskuksen virallisia kannanottoja. Asiantuntijat kirjoittavat omissa nimissään ja vastaavat kukin omista kirjoituksistaan.

Kommentit (0 kommenttia)