Projekt

Ogólne

Profil

Jak robimy korektę » Historia » Wersja 4

Wersja 3 (Marta Niedziałkowska, 2011-10-18 10:34) → Wersja 4/7 (Aleksandra Sekuła, 2012-04-08 22:32)

h1. Jak robimy korektę?

Niektóre błędy OCR są *typowe* i częste, należy do nich np. odczytywanie wielkiej litery „O” jako zero: 0, czy małej litery „l” jako jedynki: 1. Również niedokładności druku bywają rozmaicie interpretowane przez OCR - w miejscu zanieczyszczenia strony mechanizm może wstawić kropkę lub przecinek, a przecinek za słowem kończącym się na „e” może spowodować odczytanie tej litery jako „ę”.

Błędy takie oczywiście zmieniają znaczenie tekstu.

W celu ich wychwycenia i poprawienia należy *bardzo uważnie i ze zrozumieniem przeczytać tekst*, porównując go jednocześnie ze *skanami źródła*, co umożliwia dzięki swoim dwóm panelom "platforma redakcyjna":http://redmine.nowoczesnapolska.org.pl/projects/wl-publikacje/wiki/Praca_na_platformie (na jednym panelu można przeglądać tekst, na drugim synchronicznie skany utworu).

Przy okazji tak dokładnej lektury można wychwycić domniemane *błędy źródła* - miejsca, w których tekst również w skanach jest nielogiczny, zawiera nieprawidłowości zapisu itp. Należy przypadki te *sprawdzić z innym wydaniem utworu* (zalecane są tu wzorcowe wydania BN) i jeżeli domniemany błąd okaże się rzeczywistym błędem źródła - poprawić, a następnie przy zapisywaniu *opisać dokonaną zmianę*.

Przykłady typowych częstych błędów OCR-u:
tern -> tem (zaimek)
aię -> się
cli -> ch
cłi -> ch
cb -> ch