Projekt

Ogólne

Profil

Jak robimy korektę » Historia » Wersja 5

Paulina Choromańska, 2015-06-23 09:57

1 2 Marta Niedziałkowska
h1. Jak robimy korektę?
2 1 Marta Niedziałkowska
3 1 Marta Niedziałkowska
4 1 Marta Niedziałkowska
Niektóre błędy OCR są *typowe* i częste, należy do nich np. odczytywanie wielkiej litery „O” jako zero: 0, czy małej litery „l” jako jedynki: 1. Również niedokładności druku bywają rozmaicie interpretowane przez OCR - w miejscu zanieczyszczenia strony mechanizm może wstawić kropkę lub przecinek, a przecinek za słowem kończącym się na „e” może spowodować odczytanie tej litery jako „ę”. 
5 1 Marta Niedziałkowska
6 1 Marta Niedziałkowska
Błędy takie oczywiście zmieniają znaczenie tekstu. 
7 1 Marta Niedziałkowska
8 3 Marta Niedziałkowska
W celu ich wychwycenia i poprawienia należy *bardzo uważnie i ze zrozumieniem przeczytać tekst*, porównując go jednocześnie ze *skanami źródła*, co umożliwia dzięki swoim dwóm panelom "platforma redakcyjna":http://redmine.nowoczesnapolska.org.pl/projects/wl-publikacje/wiki/Praca_na_platformie (na jednym panelu można przeglądać tekst, na drugim synchronicznie skany utworu).
9 1 Marta Niedziałkowska
10 5 Paulina Choromańska
Przy okazji tak dokładnej lektury można wychwycić domniemane *błędy źródła* - miejsca, w których tekst również w skanach jest nielogiczny, zawiera nieprawidłowości zapisu itp. Należy przypadki te *sprawdzić z innym wydaniem utworu* (zalecane są tu wzorcowe wydania BN) i jeżeli domniemany błąd okaże się rzeczywistym błędem źródła - poprawić, a następnie przy zapisywaniu *opisać dokonaną zmianę*. Informację o dokonanych błędach źródła należy opisać w "nocie redaktorskiej":http://redmine.nowoczesnapolska.org.pl/projects/wl-publikacje/wiki/Nota_redaktorska.
11 4 Aleksandra Sekuła
12 4 Aleksandra Sekuła
Przykłady typowych częstych błędów OCR-u: 
13 4 Aleksandra Sekuła
tern -> tem (zaimek)
14 4 Aleksandra Sekuła
aię -> się
15 4 Aleksandra Sekuła
cli -> ch
16 4 Aleksandra Sekuła
cłi -> ch
17 4 Aleksandra Sekuła
cb -> ch