Projekt

Ogólne

Profil

Jak robimy korektę » Historia » Wersja 4

« Poprzednie - Wersja 4/7 (diff) - Następne » - Obecna wersja
Aleksandra Sekuła, 2012-04-08 22:32


Jak robimy korektę?

Niektóre błędy OCR są typowe i częste, należy do nich np. odczytywanie wielkiej litery „O” jako zero: 0, czy małej litery „l” jako jedynki: 1. Również niedokładności druku bywają rozmaicie interpretowane przez OCR - w miejscu zanieczyszczenia strony mechanizm może wstawić kropkę lub przecinek, a przecinek za słowem kończącym się na „e” może spowodować odczytanie tej litery jako „ę”.

Błędy takie oczywiście zmieniają znaczenie tekstu.

W celu ich wychwycenia i poprawienia należy bardzo uważnie i ze zrozumieniem przeczytać tekst, porównując go jednocześnie ze skanami źródła, co umożliwia dzięki swoim dwóm panelom platforma redakcyjna (na jednym panelu można przeglądać tekst, na drugim synchronicznie skany utworu).

Przy okazji tak dokładnej lektury można wychwycić domniemane błędy źródła - miejsca, w których tekst również w skanach jest nielogiczny, zawiera nieprawidłowości zapisu itp. Należy przypadki te sprawdzić z innym wydaniem utworu (zalecane są tu wzorcowe wydania BN) i jeżeli domniemany błąd okaże się rzeczywistym błędem źródła - poprawić, a następnie przy zapisywaniu opisać dokonaną zmianę.

Przykłady typowych częstych błędów OCR-u:
tern -> tem (zaimek)
aię -> się
cli -> ch
cłi -> ch
cb -> ch