Digisäilönnän aakkoset

Teos Digiarkistointi - säilytä muistot ja tiedostot esittelee kattavasti digitaalisia tallennusformaatteja ja laitteita sekä opastaa tietojen siirrossa vanhoilta alustoilta uusille. Kirjassa käsitellään tietokoneita, levyketyyppejä, ohjelmia ja ohjelmaversioita, aineistojen skannausta sekä kuvien, äänitiedostojen ja videoiden siirtoa. Teos sopii kaikille digiarkistoinnista kiinnostuneille harrastajille ja kotikäyttäjille. Se myös antaa inspiraatiota aihepiiriin syvemmälle pohdinnalle.

Järvinen, Petteri: Digiarkistointi. Säilytä muistot ja tiedostot.. WSOYpro, Docendo, 2009. 383 sivua. ISBN 978-951-0-35531-2.

Jokin aika sitten kollegani pyysi apuani tiedonsiirrossa. Hän oli saanut tutkimusta tehdessään käsiinsä lähdeaineiston, joka oli tallennettu kolmen ja puolen tuuman korppulevykkeelle Paradox-tietokantamuodossa. Työtoverini tietokoneessa ei ollut korppuasemaa, Paradoxista puhumattakaan.

Suuri osa tavallisuudesta poikkeavasta tietokonetyöstä vie aikaa ja nostaa ainakin minulla verenpainelukemat korkeuksiin. Tässäkin tapauksessa odotin kiristyvää otsasuonien pullistelua ja epäonnistuneita siirtoyrityksiä. Tällä kertaa – poikkeuksellisesti – kaikki sujui hyvin ja nopeasti. Ikääntyneessä pöytäkoneessani oli vielä korppuasema, lähdetiedoston sisältänyt korppu oli lukukelpoinen ja Microsoftin Access-tietokantaohjelma luki kiltisti myös Paradox-tiedostoformaattia. Accessista tiedot sai muutettua pdf-muotoon sekä siirrettyä Windowsin leikepöydän kautta Excel-taulukkolaskentaohjelmaan, jossa ne olivat vaivattomasti lajiteltavissa kollegani tutkimuksen tarpeiden mukaisesti.

Edellinen on hyvä esimerkki operaatiosta, jota Petteri Järvinen kutsuu digiarkeologiaksi. Digiarkistointi-teoksensa alkuosassa Järvinen maalailee kuvia tulevaisuuden uudesta ammattikunnasta. Digiarkeologeja tullaan hänen mukaansa tarvitsemaan vaikeissa digitaalisten tietojen pelastamiseen ja muuntamiseen liittyvissä tapauksissa. Näitä tilanteita tulee yhä enemmän, kun laitteet ja ohjelmistot vanhenevat käsiin digimurroksen pyörteissä. Järvisen viime vuonna ilmestynyt kirja (!) itsessään on tarkoitettu kotitarpeisiin kannustamaan ja auttamaan sähköisten tietojen tuoreuttamisessa ja siirtämisessä formaatissa toiseen.

 

Mediamuodosta toiseen

Järvinen käy teoksessaan läpi valtavan määrän nykyisiä ja menneiden vuosikymmenten audiovisuaalisen alan ja tietotekniikan laitteistoja, liitäntöjä, ohjelmistoja, tiedostoformaatteja ja mediamuotoja. Hän antaa vinkkejä, millä keinoin vaikkapa vanhat kotivideot, c-kasetit, levyketallenteet ja datatiedostot olisivat siirrettävissä tämänhetkisiin suosikkiformaatteihin – odottamaan aikaa, jolloin ne on jälleen tuoreutettava johonkin tulevaan muotoon. Järvinen toteaa, että olemme siirtymässä säilyttämisestä siirryttämiseen, sillä emme voi luottaa, että pelkkä säilyttäminen takaa tulevaisuudessa tietojen tarkastelukelpoisuuden.

Noin 400-sivuisessa kirjassa on 14 lukua, joissa aiheeseen johdattelevan yleisosuuden jälkeen Järvinen käy yksitellen läpi vanhat media ja laitteet, muun muassa levykkeet, nauhat, liitännät ja tietokoneet sekä merkistökoodaukset (esim. skandinaavisiin merkkeihin liittyvät ongelmat). Sen jälkeen hän luo katsauksen vanhoihin käyttöjärjestelmiin ja sovellusohjelmiin sekä niiden tuottamiin tiedostotyyppeihin (ketkä muistavat vaikkapa K-mies-tietokantaohjelman tai Teko-tekstinkäsittelyohjelman?). Järvinen antaa vinkkejä vanhojen sovellusympäristöjen käyttöön emulaattorien ja virtualisoinnin avulla, mutta esimerkit ovat kaiken kaikkiaan sen verran tiiviitä, että aiheesta mahdollisesti innostuva lukija joutuu etsimään omasta erikoistapauksestaan lisätietoja myös muusta painetusta kirjallisuudesta tai netistä.

Oman lukunsa Järvinen on kirjoittanut aineistojen säilytyksestä. Hän antaa ohjeita diojen, piirrosten, lehtien, kuittien ja muiden paperien skannauksesta kaitafilmien käsittelyyn ja www-sivujen arkistointiin. Järvinen tuo painokkaasti esiin metadatan laatimisen tärkeyden: digitoitu aineisto on myös järjestettävä ja sitä varten on kerättävä tekijään, tekoajankohtaan ja paikkaan liittyviä kontekstitietoja, vaikka niiden kirjoittaminen digitointivaiheessa tuntuisikin ikävältä puuhalta. Tässä(kin) Järvinen peräänkuuluttaa maalaisjärjen käyttöä, jotta metatiedon luomiseen käytetty vaiva ei ylittäisi siitä saatavaa hyötyä. Järvinen kehottaa niin ikään pohtimaan kysymyksiä tiedostojen perimisestä: Oletko sinä miettinyt, mitä tapahtuu kuolemasi jälkeen sähköposteillesi, Facebook-tileillesi tai nettisivuillesi? Pääsevätkö perillisesi tietoihin käsiksi vai pitääkö varmistaa, etteivät he niihin pääse?

Vaikka itse koen olevani suhteellisen hyvin perillä erilaisiin mediamuotoihin ja tiedostoformaatteihin liittyvistä kysymyksistä, Järvisen kirjan lukeminen tuotti useita ahaa-elämyksiä tiedon siirtämisen kysymyksistä. Opin paljon muun muassa äänen, kuvan ja videon tiedostoformaattien yksityiskohdista. Järvinen esimerkiksi selittää hyvin, miten audiovisuaalisten tiedostojen kirjoittamisessa ja lukemisessa tiedon koodaus ja mahdollinen pakkaus on yksi osa-alue ja itse säiliöformaatti toinen. Esimerkiksi tif-päätteisissä kuvatiedostoissa ja avi-videotiedostoissa voi olla useita tapoja, joilla kuvatieto on tiedostoon pakattu.  Opin runsaasti myös tietokoneille ja kännyköille tallennetuista kalenterimerkinnöistä sekä sähköpostista. Ilokseni huomasin, että käyttämäni Thundebird-ohjelma on arkistoinnin kannalta helpompi kuin jotkut muut sähköpostiohjelmat.

Kirjan loppuosassa Järvinen käy omissa luvuissaan läpi äänen tallennusmediat ja äänitiedostot, videotiedostot ja digiboksit, kiintolevyt ja flash-muistit sekä niiden oikean arkistointiin, cd-, dvd- ja blu-ray-levyt, levyjen polttamisen ja säilyttämisen sekä VHS-videokasettien sekä erilaisten kotivideoiden digitoimisen.

Järvinen on tehnyt myös omia datan säilymiseen liittyviä kokeilujaan säilyttäen muun muassa romppuja auringossa parvekkeellaan ja auton takaluukussa pitkiä aikoja. Hän on myös rääkännyt muistitikkuja kokeilemalla, kuinka monta tallennuskertaa ne kestävät ennen hajoamistaan. Järvisen tulokset ovat moniselitteisiä: yhtäältä vahvistuu olettamus siitä, että halvat laitteet ja tallennusmediat kestävät vain sen minimin, joka niiden kestosta on luvattu. Toisaalta laitteiden ja tallenteiden kestävyys saattaa olla yllättävänkin hyvä. Joka tapauksessa kuntoa on aktiivisesti seurattava ja tärkeät tiedot tuoreutettava ja varmuuskopioitava ennen kuin on liian myöhäistä.

 

Tiivistä ja kattavaa tietoa

Kaiken kaikkiaan kirja on monipuolinen ja kattava esitys digiarkistoinnin kysymyksistä. Petteri Järvisellä on osaavana tietokirjoittajana ja pitkään alalla toimineena henkilönä valtavasti näkemystä ja henkilökohtaista kokemusta, johon perustuva ammattitaito huokuu teoksen sivuilta. Kirjassa ei ainoastaan kartoiteta ja kuvata ilmiön eri puolia vaan annetaan myös käytännön vinkkejä tietojen järjestämiseen, valintaan, siirtämiseen ja säilyttämiseen. Yksityiskohtaisempaa lisätietoa löytää tarvittaessa netistä. Kirja sopiikin erinomaisesti digiarkistoinnista tai sen yksittäisistä osa-alueista kiinnostuneille kotikäyttäjille ja harrastajille.

Ainoa asia, johon olisin kaivannut lisävalaistusta, olisi ollut erilaisiin siirto-operaatioihin ja asennuksiin tarvittava aika. Kirjassa korostuu turhan usein digitekniikan (näennäinen) vaivattomuus. Ainakin omakohtaiset kokemukseni ovat opettaneet sen, että minkään ohjelman asentaminen tai käyttäminen on harvoin oikeasti niin helppoa, että asiat tapahtuisivat automaattisesti vain yhtä nappia painamalla. Tämän huomaa toki Järvinenkin silloin tällöin. VHS-kasettien digitointia käsittelevässä osuudessa hän toteaa, että mikään digitointitapa ei ole yksinkertainen eikä vaivaton. Hän huomaa itsekin aliarvioineensa sen ajan, joka omien vanhojen VHS-kasettien läpikäyntiin ja digitoimiseen kului. Joululoma ei moiseen riittänyt, vaan siihen meni useita viikkoja. Usein varmuuskopiointi tai tietojen tuoreuttaminen kaatuu juuri tähän. Joko koko touhua ei jaksa aloittaa ajan ja vaivalloisuuden takia – tai vaikka käyttäjä olisi innokkaasti lähtenyt vaikka lomallaan urakkaa hoitamaan omine hienoinen luokittelujärjestelmineen – hän uupuu matkan varrella ja päätyy käyttämään lomansa johonkin oikeasti rentouttavaan asiaan ilman jatkuvaa tappelua uusien ja vanhojen elektroniikkalaitteiden kanssa.

 

Digiarkistoinnin tuolla puolen – digiarkeologi ja muut uudet ammattikuvat

Järvisen kirja ja etenkin sen aiheeseen johdatteleva alkuosa saavat mielikuvituksen liikkeelle. Tietenkin kirja herättää huonoa omatuntoa omasta varmuuskopiointi- ja tiedonsiirtolaiskuudesta, joka voi johtaa itselle tärkeiden tietojen ja aineistojen katoamiseen tai tuhoutumiseen ennemmin tai myöhemmin. Järvisen maalailut digitaalisesta keskiajasta sekä digi-arkeologien ammattikunnasta innostavat myös muuhun pohdintaan: millaisia erilaisia digiarkistointiin liittyviä ammattikuntia tulevaisuudessa voisi olla?

Järvisestä poiketen määrittäisin digiarkeologin tutkijaksi, joka ”kaivautuisi” historiaan erilaisia digitaalisia mediateknologioita ja tiedostoja tutkimalla. Järvisen kirjasta inspiroitunut digiarkeologi voisi kiinnittää huomiota muun muassa niihin perusteisiin, joilla erilaiset laitetyypit, laiteliitännät ja tiedostoformaatit ovat eläneet toistensa rinnalla tai syrjäyttäneet toisia. Kirjan kautta mielenkiintoisena teema-alueena näyttäytyy muun muassa tietotekniikkaan liittyvä standardointityö: miten erilaisista standardeista on sovittu ja millaisia julkisia ja taloudellisia intressejä standardointiin on kytkeytynyt?

Työn, jota Järvinen kutsuu digiarkeologiksi, nimeäisin itse digikonservoinniksi tai pikemminkin restauroinniksi. Digirestauroijan tehtävänä olisi nimenomaan vanhojen laitteiden, ohjelmistojen ja sähköisten aineistojen henkiin herättäminen ja tuoreuttaminen. Digirestauroija työskentelisi suurissa organisaatioissa – tai sitten vapaana yrittäjänä, joka tekee pelastustöitä eri tilaajien toimeksiannosta. Restauroijat voisivat myös muodostaa yhteenliittymän, yhdistyksen tai säätiön, joka tietyissä tapauksissa auttaisi ilmaiseksi pelastustöissä. Tällaista säätiötä voisivat rahoittaa tietotekniikka-alan yritykset ja julkishallinnon toimijat.

Järvinen toteaa, että digiarkelogi tarvitsee joskus myös hakkerin taitoja. Hänen on kyettävä purkamaan salauksia ja kopiosuojauksia, jotta tarvittu tieto saadaan esille. Järvisen mietteistä voisikin ekstrapoloida tulevaisuuden datahakkerien ammattikunnan, joka lain hämärillä rajamailla tekisi salaustenpurkukeikkoja suoraan tilaajille tai vaikkapa digirestaurointisäätiön toimeksiannosta alihankintana. Datahakkerit olisivat sekä uusien että vanhojen suojausten ja salausten purun erikoisasiantuntijoita.

Digiarkeologin, restauroijan ja datahakkerin lisäksi maalailen vielä muutamia muita tulevaisuuden ammattikuvia. Edellisten yläpuolella organisaatiossa työskentelisi digihistoriajohtaja, jonka tehtävänä olisi vastata organisaation historiatiedon kokonaisuudesta: aineiston arkistoinnista, siirrättämisesta formaatista toiseen sekä myös säilytettävän aineiston valinnasta ja muun aineiston tuhoamisesta. Kaikkien näihin alakategorioihin suurissa organisaatioissa voisi palkata erikoistuneet ammattilaiset. Näiden lisäksi joku palkkaisi myös inhimillisiä säilyttäjiä ja ”ihmisvarmuuskopioita”, joiden vastuulla olisi huolehtia kaikkein olennaisimpien aineistojen säilymisestä ääritilanteissa, joissa kaikki digitaalinen tieto tuhoutuu. Säilyttäjät kehittäisivät vaihtoehtoisia tiedon luku- ja tallennusmenetelmiä, hyödyntäisivät vanhoja tekniikoita, tarvittaessa jopa pergamentteja ja savitauluja sekä ylläpitäisivät suullisen tiedon ja perinteen tekniikoita.

 

Nietzsche ja digiarkistointi

Petteri Järvinen (s. 24-26) nostaa kiinnostavasti esiin myös digiarkistointiin liittyvät neljä aikatasoa. Hän kirjoittaa arkistoimisen päivittäisestä tarpeesta, henkilökohtaisesta tarpeesta, sukupolvien tarpeesta sekä yhteiskunnan tarpeesta. Päivittäistarve kattaa noin 1-3 vuoden säilytyksen, henkilökohtainen tarve liittyy asioiden säilyvyyteen noin 50-100 vuoden aikaperspektiivillä. Sukupolvien tarve vaihtelee, mutta menee tuosta hieman pidemmälle. Yhteiskunnallisen ja kollektiivisen muistin tarpeella ei Järvisen mukaan ole ylä- eikä alarajaa. Hän toteaa seuraavasti: ”Kaikkein vanhimmatkin aineistot kiinnostavat tutkijoita. Yhteiskunnan säilytystarve on tuhansia vuosia, periaatteessa ikuisesti. Mittakaava riittää tekemään nöyräksi kenet tahansa. Meillä ei ole vielä mitään käsitystä siitä, miten digitaalinen aineisto saataisiin liitettyä yhteiskunnan muistiin. Kokemukset muutaman kymmenen vuoden ajalta ovat tässä mittakaavassa pelkkä silmänräpäys, eivätkä ne ole lainkaan rohkaisevia.”

Friedrich Nietzsche kirjoittaa teoksessaan Historian hyödystä ja haitasta elämälle (1874/1999) historian kolmesta lajista, monumentaalisesta, aktikvaarisesta ja kriittisestä. Monumentaalihistoria poimii menneisyydestä seurattavia esikuvia ja nostaa ne jäljittelyn ja ihailun yleistävälle jalustalle. Aktikvaarihistoria hellii menneisyydestä jäljelle jäänyttä ja sitoo ihmiset siihen. Kriittinen historia on Nietzschen mukaan valmis tutkimaan, hajottamaan ja tarvittaessa tuomitsemaan menneisyyden ilmiöitä.

Kaikki kolme lajia liittyvät myös digiarkistointiin ja sen aikatasoihin. Monumentaalinen digiarkistointi tarkoittaisi eri aikatasoilla tiukkaa rajausta yksittäisten merkittäviksi nostettujen asioiden säilyttämiseen ja kunnioittamiseen. Järvisen kirjassa tämä näkyy muun muassa siinä, miten hän huomauttaa, että suuri osa digikuvista otetaan tietyistä vuotuisista tai elämänkulkuun liittyvistä juhlista tai matkoilla niistä historiallisista tai luonnonmonumenteista, joita ”kuuluukin kuvata” ja joista todennäköisesti löytyy tuhansia toisten ottamia parempia kuvia. Järvinen peräänkuuluttaa arkielämän tavanomaisten toimien tallentamista tai oman katseen seuraamista. Kuvaaja kiinnittää huomiota niihin yksityiskohtiin, ihmisiin ja tilanteisiin, joihin hänen huomionsa vaistomaisesti ja monesti vain lyhytaikaisesti kohdistuu.

Antikvaarinen digiarkistointi puolestaan voisi tarkoittaa kaiken arkistoimista, jokaisen digikuvan, videon, ohjelman ja laitteet säilyttämistä. Vaikka tasa-arvoinen säilöminen olisikin lähtökohtana hyvä, koska se mahdollistaa uudet tulevaisuuden tulkinnat, käytännössä tämä on liian työlästä tekijälleen ja latistaa aineiston myös jälkipolvien näkökulmasta. Järvinen itse toteaa, miten hänelle ovat arvokkaita kaikki ne muutamat lapsuuden valokuvat, joita on olemassa. Jos omasta lapsuudesta on useita tuhansia kuvia, niiden kaikkien arvo on vaarassa latistua. Yksikään massan kuva ei enää kiinnosta. Rajaaja ja valikoija lisää siis säilytettävän aineiston arvoa.  Nietzsche varoittaa menneisyyteen käpertyvää antikvaarista näkökulmaa elämän kivettämisestä sekä siitä, että kokonaisvaltaisuudesta huolimatta useimpia asioita ei havaita lainkaan tai että siitä, että havaittavia asioita ei suhteuteta mihinkään, jolloin kaikelle annetaan tasapaksu liian suuri merkitys.

Kriittinen digiarkistoija, mahdollisesti digiarkeologi arvioisi siten jatkuvasti toimintaansa. Hän punnitsisi kriittisesti niitä lähtökohtia, joiden perusteella hän tekee yksilöllisestä ja yhteisöllisestä näkökulmista valintoja tallennuksista, säilyttämisistä ja säilytetyn aineiston käyttämisestä. Hän ei tuntisi ja arvioisi ainoastaan tekniikoita vaan niihin liittyviä yksilöllisiä, sosiaalisia ja kulttuurisia käytänteitä.

Kriittistä tai ei, taidan nyt lähteä tämän arvostelun valmistumisen jälkeen digitoimaan Järvisen ohjeiden tukemana vanhoja c-kasettejani. Ne sisältävät muun muassa muutaman vuoden vanhana pianolla soittamani oman sävellysryöpytykseni ”Lehmänpolskan”. Pianoa en tosin muistaakseni tuossa tallenteessa soittanut vasaralla, niin kuin jossain toisessa tilanteessa vanhempien silmien välttäessä. ”Lehmänpolskan” digitallenteella voin toivottavasti pian elähdyttää ystäviäni ja sukulaisiani. Varokaa vaan!

Kommentoi

Vain omalla nimellä kirjoitetut kommentit julkaistaan. Sähköpostiosoitettasi ei julkaista. Pakolliset kentät on merkitty *