Projekt

Ogólne

Profil

Czym jest skład?

Skład to (w dużym uproszczeniu) formatowanie tekstu.

Chcemy, aby tekst na stronie Wolnych Lektur wyglądał dokładnie tak, jak wydania książkowe udostępniane nam przez Bibliotekę Narodową, ponieważ to właśnie na to wydanie się powołujemy.

Ważne by tekst składał się w bloki o odpowiedniej szerokości, podzielone na akapity lub strofy.
Tekst musi mieć także dobraną właściwą odmianę i stopień czcionki (fontu), akapity muszą posiadać odpowiednie wcięcia, nagłówki muszą być oddzielone od tekstu światłem o konkretnej wielkości, a pewne frazy muszą być wyróżnione (np. kursywą) itd.

Proste edytory tekstu przyzwyczaiły nas do tego, że w miarę nadawania w nich tekstowi takich własności, na ekranie komputera przybiera on od razu pożądany przez nas wygląd.
Można jednak pomyśleć o tych własnościach tekstu jako o zbiorze informacji o pewnej strukturze formalnej - i tak właśnie traktujemy skład w przypadku tekstów Wolnych Lektur.

Opis strukturalny języka WL XML

Do opisu tej struktury służy nasz własny język składu stworzony w oparciu o język XML.
Za pomocą znaczników języka XML, nazywanymi tagami składu, nadajemy tekstowi pożądaną formę i umożliwiamy wyświetlenie się go na stronie internetowej.

Skład jest pierwszym etapem pracy nad tekstem (wersja 0.1) na platformie redakcyjnej.
Utwór odpowiednio oznaczony i wyświetlający się na stronie internetowej może być poddany redakcji merytorycznej (dalsze wersje utworu).

WL XML jest językiem stworzonym na potrzeby biblioteki internetowej Wolne Lektury. WL XML bazuje na języku XML. Jego podstawowym założeniem jest zachowanie informacji strukturalno-semantycznych dotyczących utworu, reprezentowanych w tradycyjnym wydaniu papierowym głównie przez formę jego składu i łamania. Elementy te podczas cyfryzacji ulegają zatarciu.

Nasz język pozwala opatrzyć tekst opisem jego własności strukturalnych mających wpływ na skład i łamanie, które dopiero w następnym kroku zostaną automatycznie przekształcone na właściwe formatowanie twarde (rzeczywiste szerokości łamów, stopień czcionki, wytłuszczenia, kursywa itd.).

Podczas składu interesuje nas więc nie to, jak tekst ma docelowo wyglądać, ale jakiego typu elementami struktury są jego poszczególne elementy: z jakiego typu wyróżnieniem, blokiem tekstu, nagłówkiem, akapitem bądź strofą mamy do czynienia.
Poszczególne elementy tekstu są oznaczane tagami zgodnie ze swoją funkcją w tekście. Nacisk jest tu położony na znaczenie i sens elementów a nie na formę, w jakiej się wyświetlą. Jest to zatem tagowanie semantyczne.

Dopiero taki opis umożliwia przypisanie każdemu z tych typów odpowiedniego stylu składu, który może być łatwo modyfikowany: zmieniając ustawienia stylu, zmieniamy zarazem docelowy wygląd wszystkich elementów tekstu strukturalnie z nim powiązanych. Teksty oznaczane (tagowane) są zgodnie ze swoimi klasami: powieść, opowiadanie, liryka, dramat.
W obrębie każdej klasy występują inne elementy. Zadaniem redaktora technicznego jest nadać tekstowi odpowiednia formę, zgodną z zasadami tagowania semantycznego.

Język WL XML jest zaawansowanym rozwiązaniem umożliwiającym automatyczne generowanie składu oraz narzędziem wymiany informacji, dającym się łatwo przekształcić w odpowiednio sformatowane pliki o różnej specyfice i odmiennym przeznaczeniu (np. tekst na stronie internetowej, plik do edycji w formacie ODT, plik do druku w formacie PDF).

Użycie języka polega na otagowaniu tekstu utworu znacznikami języka WL XML. Jego uzupełnieniem jest zbiór metadanych (informacji bibliograficznej) reprezentowany w międzynarodowym standardzie Dublin Core.

Źródło: Dariusz Gałecki, Biblioteka internetowa Wolne Lektury po pierwszym etapie rozbudowy, Warszawa 2008