Europeanan sanomalehtiprojekti käynnistyi kesän aikana
Lähetetty: 30.07.12 15:13
Ryhmä eurooppalaisia kumppaniorganisaatioita on yhdistänyt voimansa
“Europeana Newspapers” –projektiin ja haluaa tarjota seuraavien kolmen
vuoden aikana yli 18 miljoonaa sanomalehtisivua Europeana-palveluun.
Europeanan kautta voi yhdestä palvelusta löytää miljoonia digitoituja
kirjoja, maalauksia, elokuvia, museoesineitä sekä arkistoaineistoa
ympäri Eurooppaa.
Europeana-sanomalehtiprojekti on rahoitettu Euroopan komission
Kilpailukyvyn ja innovoinnin puiteohjelmasta 2007–2013 (CIP). Se tähtää
sanomalehtien viemiseen Europeanaan Eurooppalaisen kirjaston kautta ja
sanomalehtien sisällön tekniseen jälkikäsittelyyn digitoidun aineiston
käytettävyyden parantamiseksi.
Projektiin osallistuvat kirjastot jakavat digitoituja sanomalehtiä ja
kokotekstiaineistoa Europeanan kautta. Projekti saattaa
sanomalehtisisällön käyttöön erityisen käyttöliittymän kautta.
Käyttöliittymä liitetään Europeana-portaaliin ja mahdollistaa
yksittäisten sanojen tai lauseiden hakemisen sanomalehtiteksteistä.
Standardimaisten kirjastoluetteloiden hakumahdollisuudet rajoittuvat
yleensä vain päivämäärä- tai nimekehakuihin.
Projekti osoittaa haasteet, jotka linkittyvät digitoituihin
sanomalehtiin ja niiden jatkojalostamiseen, kuten niiden optiseen
merkkien tunnistukseen (OCR), artikkeleiksi segmentoimiseen tai niiden
optiseen asetteluun (OLR), nimientiteettien (NER) ja sivutyyppien
tunnistamiseen. OCR tarkoittaa käsin, koneella tai tulostetusta
tekstistä skannattujen kuvien muuntamista sähköiseksi koneluettavaksi
tekstiksi. OLR on sähköisten artikkelien merkitsemistä skannatusta
sanomalehden sivusta, mikä sisältää enemmän kuin yhden artikkelin. NER
pyrkii paikantamaan ja luokittelemaan tekstistä määriteltyjä
standardimaisia yksittäisiä osia kuten henkilöiden nimet, organisaatiot
ja sijainnit.
Projektissa arvioidaan myös digitoidun aineiston jalostusteknologioiden
laatua ja paikallisten metatietojen siirtoa Europeanan
tietomallistandardiin tiiviissä yhteistyössä julkisen sekä yksityisen
sektorin sidosryhmien kanssa.
Europeana-sanomalehtiprojektia johtaa Berliinin valtionkirjasto (Berlin
State Library).
Projektikumppanit:
Berliinin valtionkirjasto
Hollannin kansalliskirjasto
Viron kansalliskirjasto
Itävallan kansalliskirjasto
Helsingin yliopisto, Kansalliskirjasto
Hampurin yliopiston kirjasto
Ranskan kansalliskirjasto
Puolan kansalliskirjasto
CCS Content Conversion Specialists GmbH
LIBER-järjestö
Latvian kansalliskirjasto
Turkin kansalliskirjasto
Belgradin yliopisto
Innsbruckin yliopisto
Dr. Friedrich Tessmann -kirjasto
Iso-Britannian kansalliskirjasto
Salfordin yliopisto
Eurooppalainen kirjasto (TEL)
Europeana pähkinänkuoressa
Europeana on eurooppalaisten museoiden, kirjastojen, arkistojen ja
audiovisuaalisten kokoelmien ja miljoonien digitoitujen julkaisujen
monikielinen online-kokoelma. Tällä hetkellä Europeana tarjoaa
integroidun pääsyn 23 miljoonaan kirjaan, elokuvaan, maalauksiin,
museoesineisiin ja arkistoasiakirjoihin noin 2200 sisällöntuottajalta
eri puolilta Eurooppaa.
http://www.europeana.eu
Sanomalehdet-projektin edistystä voi seurata osoitteessa:
http://www.europeana-newspapers.eu.
Lisätietoja saatavilla Hans-Jörg Liederiltä tai Thorsten Siegmannilta
info@europeana-newspapers.eu, Suomessa Tiina Höltältä Kansalliskirjaston
digitointi- ja konservointikeskuksesta: tiina.holtta@helsinki.fi, puh.
050-4150566
“Europeana Newspapers” –projektiin ja haluaa tarjota seuraavien kolmen
vuoden aikana yli 18 miljoonaa sanomalehtisivua Europeana-palveluun.
Europeanan kautta voi yhdestä palvelusta löytää miljoonia digitoituja
kirjoja, maalauksia, elokuvia, museoesineitä sekä arkistoaineistoa
ympäri Eurooppaa.
Europeana-sanomalehtiprojekti on rahoitettu Euroopan komission
Kilpailukyvyn ja innovoinnin puiteohjelmasta 2007–2013 (CIP). Se tähtää
sanomalehtien viemiseen Europeanaan Eurooppalaisen kirjaston kautta ja
sanomalehtien sisällön tekniseen jälkikäsittelyyn digitoidun aineiston
käytettävyyden parantamiseksi.
Projektiin osallistuvat kirjastot jakavat digitoituja sanomalehtiä ja
kokotekstiaineistoa Europeanan kautta. Projekti saattaa
sanomalehtisisällön käyttöön erityisen käyttöliittymän kautta.
Käyttöliittymä liitetään Europeana-portaaliin ja mahdollistaa
yksittäisten sanojen tai lauseiden hakemisen sanomalehtiteksteistä.
Standardimaisten kirjastoluetteloiden hakumahdollisuudet rajoittuvat
yleensä vain päivämäärä- tai nimekehakuihin.
Projekti osoittaa haasteet, jotka linkittyvät digitoituihin
sanomalehtiin ja niiden jatkojalostamiseen, kuten niiden optiseen
merkkien tunnistukseen (OCR), artikkeleiksi segmentoimiseen tai niiden
optiseen asetteluun (OLR), nimientiteettien (NER) ja sivutyyppien
tunnistamiseen. OCR tarkoittaa käsin, koneella tai tulostetusta
tekstistä skannattujen kuvien muuntamista sähköiseksi koneluettavaksi
tekstiksi. OLR on sähköisten artikkelien merkitsemistä skannatusta
sanomalehden sivusta, mikä sisältää enemmän kuin yhden artikkelin. NER
pyrkii paikantamaan ja luokittelemaan tekstistä määriteltyjä
standardimaisia yksittäisiä osia kuten henkilöiden nimet, organisaatiot
ja sijainnit.
Projektissa arvioidaan myös digitoidun aineiston jalostusteknologioiden
laatua ja paikallisten metatietojen siirtoa Europeanan
tietomallistandardiin tiiviissä yhteistyössä julkisen sekä yksityisen
sektorin sidosryhmien kanssa.
Europeana-sanomalehtiprojektia johtaa Berliinin valtionkirjasto (Berlin
State Library).
Projektikumppanit:
Berliinin valtionkirjasto
Hollannin kansalliskirjasto
Viron kansalliskirjasto
Itävallan kansalliskirjasto
Helsingin yliopisto, Kansalliskirjasto
Hampurin yliopiston kirjasto
Ranskan kansalliskirjasto
Puolan kansalliskirjasto
CCS Content Conversion Specialists GmbH
LIBER-järjestö
Latvian kansalliskirjasto
Turkin kansalliskirjasto
Belgradin yliopisto
Innsbruckin yliopisto
Dr. Friedrich Tessmann -kirjasto
Iso-Britannian kansalliskirjasto
Salfordin yliopisto
Eurooppalainen kirjasto (TEL)
Europeana pähkinänkuoressa
Europeana on eurooppalaisten museoiden, kirjastojen, arkistojen ja
audiovisuaalisten kokoelmien ja miljoonien digitoitujen julkaisujen
monikielinen online-kokoelma. Tällä hetkellä Europeana tarjoaa
integroidun pääsyn 23 miljoonaan kirjaan, elokuvaan, maalauksiin,
museoesineisiin ja arkistoasiakirjoihin noin 2200 sisällöntuottajalta
eri puolilta Eurooppaa.
http://www.europeana.eu
Sanomalehdet-projektin edistystä voi seurata osoitteessa:
http://www.europeana-newspapers.eu.
Lisätietoja saatavilla Hans-Jörg Liederiltä tai Thorsten Siegmannilta
info@europeana-newspapers.eu, Suomessa Tiina Höltältä Kansalliskirjaston
digitointi- ja konservointikeskuksesta: tiina.holtta@helsinki.fi, puh.
050-4150566