Projekt

Ogólne

Profil

Informacje wstępne » Historia » Wersja 12

« Poprzednie - Wersja 12/15 (diff) - Następne » - Obecna wersja
Aleksandra Sekuła, 2012-03-02 13:51


Informacje wstępne

Biblioteka Internetowa Wolne Lektury przygotowuje własne wydania tekstów znajdujących się w domenie publicznej. Główny korpus publikacji stanowią lektury szkolne znajdujące się na liście MEN, sukcesywnie poszerzany o teksty mogące służyć nauczycielom jako dodatkowy materiał literacki w pracy dydaktycznej.

Wydania źródłowe dostarczane są m.in. przez Bibliotekę Narodową, po sprawdzeniu ich pod względem wymogów prawa autorskiego. Są to z reguły wydania dawne, które zdążyły już przejść do domeny publicznej.

Przygotowanie nowego wydania polega na opracowaniu tekstu w celu jego:
  1. uwspółcześnienia (z reguły ingerujemy w pisownię tekstów powstałych po okresie romantyzmu, w których nie zostały uwzględnione zalecenia reformy z 1937 r. oraz najnowsze zasady dotyczące pisowni łącznej i rozdzielnej imiesłowów)
  2. poprawienia (porównując tekst z innymi wydaniami staramy się wyeliminować błędy źródła)
  3. uzupełnienia o elementy pomocne w dalszej pracy nad tekstem (przypisy i motywy literackie)

Z uwagi na to, że numeracja stron jest niefunkcjonalna w przypadku tekstów publikowanych w internecie, dla formatów tekstu przeznaczonych do czytania on-line wprowadzana jest paginacja na wzór edycji tekstów starożytnych: numerowane są akapity w prozie, wersy w tekstach poetyckich i kwestie w tekstach dramatycznych. Ułatwia to orientację i poruszanie się po tekście.

Cele

Celem twórców biblioteki jest uzyskanie elektronicznej postaci dzieła nadającej się do:

  1. Publikacji w formie elektronicznej i drukowanej
  2. Twórczego opracowywania w innej formie

Etapy opracowania tekstu wydania źródłowego

Skanowanie

  1. Materiał źródłowy jest skanowany w Zakładzie Reprografii i Digitalizacji Zbiorów Biblioteki Narodowej, Biblioteki Śląskiej, Biblioteki Elbląskiej lub w pracowni digitalizacyjnej Wolnych Lektur.
  2. Dla potrzeb OCR stosowane są z reguły pliki w formacie jpg.
  3. Obrazy jpg są przekształcane przez OCR na pliki tekstowe
  4. Pliki tekstowe poddawane są wstępnej korekcie i wstępnemu otagowaniu (głównie przypisy źródła)
  5. Teksty lektur wraz ze skanami są importowane na platformę redakcyjną

Platforma redakcyjna

  1. Skład. Tekst jest semantycznie tagowany
  2. Teksty lektur wraz z tagami eksportowane są jako XML do serwisu webowego
  3. Redakcji merytorycznej: korekta (uzgodnienie ze źródłem), uwspółcześnienia, dodanie przypisów edytorskich i motywów
  4. Etap łamania. Tekst jest przygotowywany w odpowiednich formatach do umieszczenia na stronie Wolnych Lektur