02 september 2012

De transcriptie


Het gaat hier om de tweede betekenis van het woord, het overschrijven van een bestaande tekst in een meer leesbare vorm. Een oude akte ziet er misschien heel mooi uit, door het oude handschrift is de inhoud niet goed te lezen. En dat is jammer. Er is niet "het beste" recept voor het maken van een transcriptie. Je kunt er bijvoorbeeld voor kiezen om helemaal handmatig te werk te gaan. Fotokopie aan de ene kant, schrijfblok voor je neus en pennen maar.
Resultaat: een handgeschreven tekst.
Of je maakt niet eens een fotokopie, maar werkt in het archief rechtstreeks vanaf het scherm van de fichelezer. Voordeel: het kost je helemaal niets, grote nadeel: je bent heel veel tijd kwijt die misschien beter voor verder onderzoek kan worden gebruikt.

Thuis werken gaat nog altijd het beste, geen afleiding en alle tijd om een mooie transcriptie te maken. Dat kan op basis van een foto die zelf gemaakt is, of een plaatje dat van internet is gehaald. De meest simpele opzet staat op de volgende foto:


De foto is ingeladen in Paint (wordt standaard meegeleverd met Windows) en de tekst wordt getypt in Kladblok (ook standaard aanwezig op de pc). Dit werkt wel, maar de hele opzet is niet zo flexibel. Opschalen dan maar, door in plaats van Paint een meer geavanceerd tekenpakket (Paint Shop Pro) te gebruiken. Je hebt dan meer controle over het uiterlijk van de tekst.


Ook nu wordt weer een klein venstertje van Kladblok onderin beeld gezet, voor het intypen van teksten. Nadeel: Kladblok vormt nu de bottle-neck van het proces. De teksten kunnen niet makkelijk worden aangepast, met lettergroottes, onderstrepen of een andere kleur. Wie dat wil, zal gebruik moetyen maken van een betere tekstverwerker, en dan krijg je de combinatie PSP en Word.


Om dit goed te laten functioneren, moeten de twee vensters goed op elkaar worden afgestemd. Het is geen goed idee om het tekenpakket het hele scherm te laten beslaan en Word daar bovenop te zetten. Het lijkt wel makkelijk, maar zodra je iets aan de scan wilt veranderen, krijgt PSP het hele scherm en is Word weggedrukt. Na het aanpassen van de weergave van de scan moet Word dus weer worden opgezocht in de Taakbalk. Toegegevn, het kan allemaal best, maar het is lastig.
Een alternatief is het gebruik van een speciaal programma, zoals Transcript. Daarmee kunnen foto's of zelfs een lange PDF met beeldmateriaal worden ingelezen. De bovenste helft is voor de afbeelding, de onderfste helft van het scherm is voor de tekst. Met een simpele muisbeweging kan de verdeling tussen beeld en tekst worden aangepast. Gewoon de middenbalk verslepen en klaar.


Dit zijn zo'n beetje de mogelijkheden voor eigen gebruik. Een niet genoemde mogelijkheid is het gebruik van een spreadsheet in plaats van een tekstverwerker. Dat kan voor eigen gebruik maar ook als je meedoet aan een crowdsourcing-project. De organisatie verstrekt zo'n rekenblad, dat al gedeeltelijk is ingevuld. Voorbeelden zijn het project over de volkstelling van 1744 in Friesland (via archief Tresoar).


Van Tresoar kregen we een nogal 'breed' spreadsheet, wat wil zeggen dat er veel kolommen waren voorgedefinieerd. Dat is gedaan om met alles rekening te houden, zoals voornaam en patroniem maar ook voornaam en familienaam. Ook waren er drie kolommen voor het aangeslagen bedrag (guldens - stuivers - penningen) en aparte kolommen om aan te geven of iemand insolvent of gealimenteerd was. Het spreadsheet wordt gebruikt in combinatie met de scans van de website van Tresoar.
Een ander 'voorgekookt' spreadsheet krijg je bij deelname aan het project Militaire Stamboeken van Genver.


De beelden zijn in dit geval afkomstig van de website Familysearch, en die moeten afbeelding voor afbeelding worden geladen. Ook hier is het weer zaak, om de afmetingen van de twee deelvensters (browser en spreadsheet) goed op elkaar af te stemmen.
Er zijn ook projecten waarbij zowel de beelden als de invulschermen worden aangeboden. Een mooi voorbeeld is het project Amsterdamse Bevolkingsregisters van VeleHanden. Deelnemers loggen in op een website en krijgen dan het volgende voor hun neus:


Het gaat om bladen met soms wel 40 namen van bewoners. Die namen moeten ingevoerd worden in een spreadsheet-achtig formulier. De website biedt wel de mogelijkheid om per ingevulde regel de scan een stukje op te schuiven, maar de praktijk leert, dat je dat beter met de hand kunt doen. Net zoals bij de andere methoden die ik hier heb beschreven, trouwens.
Welke methode je ook kiest, het is wel verstandig om regelmatig het resultaat op te slaan. Alleen bij VelHanden hoeft dat niet.

Persoonlijke ervaringen
Hoe denk ik er zelf over? De handmatige aanpak (puur schrijven) was mijn eerste poging. Ik weet nog wel dat ik twee uur bezig ben geweest om een testament vanaf de fichelezer over te schrijven. Niet echt handig.
Daarna heb ik geƫxperimenteerd met combinaties van tekenprogramma's en tekstverwerkers tot ik Transcript ontdekte. Ideel voor thuisgebruik maar ook handig om op USB-stick mee te nemen naar een andere lokatie.
Pas sinds de komst van de diverse crowdsourcingprojecten ben ik deels afgestapt van Transcript. Het werken met een spreadsheet is wel handig, alleen moet je erg bedacht zijn op de onhebbelijke neiging van Excel om je invoer aan te vullen. Heb je een aantal keer de naam "Frederik" ingevuld, dat wil Excel dat er ook van maken als de naam "Fredrik" langskomt.
Ook is het lastig, dat niet elke partij dezelfde volgorde aanhoudt. Bijvoorbeeld:
voornaam - tussenvoegsel - familienaam en
voornaam - familienaam - tussenvoegsel
De eerste heb je bij VeleHanden, de tweede bij Genver. Je kunt dan de mist in gaan als je niet oplet.

1 opmerking:

Jacques V. zei

@Richard,
De volgorde van invoer is naar mijn mening volledig afhankelijk van de volgorde, die op de desbetreffende images staat.
Mijn principe is om deze volgorde altijd aan te houden; dit om invoerfouten te voorkomen. Je ogen gaan er zo van zigzaggen als de volgorde bron en doel van elkaar afwijken.
Twee totaal verschillende bronnen kun je daarom niet met elkaar vergelijken.
Bij de Stamboeken is dit overigens achternaam, voornaam en indien nodig voorvoegsel. Dit voorvoegsel mag ook direct achter de achternaam geplaatst worden. Ik geef de mensen nog een keus.