Projekt

Ogólne

Profil

Skany i OCR'y

Zadanie

Celem jest uzyskanie elektronicznej postaci dzieła nadającej się do:

  1. Publikacji w formie elektronicznej i drukowanej
  2. Twórczego opracowania w innej formie

Biblioteka Narodowa

  1. Materiał źródłowy jest skanowany w Zakładzie Reprografii i Digitalizacji Zbiorów Biblioteki Narodowej.
  2. Dla potrzeb OCR stosowane będą pliki w formacie jpg.
  3. Obrazy JPG są OCR'owane na pliki tekstowe
  4. Pliki tekstowe poddawane są wstępnej korekcie i wstępnemu otagowaniu (zakres prac do szczegółowego dopracowania).
  5. Teksty lektur wraz ze skanami są importowane na platformę redakcyjną.

Platforma redakcyjna

  1. Na plarformie następuje etap edycji. Nauczyciele i edytorzy tagują przypisy (edytorskie) i motywy
  2. Etap składu. Tekst jest semantycznie tagowany.
  3. Teksty lektur wraz z tagami eskportowane są jako XML do serwisu webowego
  4. Etap łamania. Tekst jest przygotowywany w odpowiednich formatach do umieszczenia na stronie