19 januari 2013

Vervuiling bij wiewaswie

Van de week werden we weer eens getracteerd op een jubeltweet over wiewaswie. Het aantal persoonsvermeldingen was namelijk gestegen boven de 70 miljoen, zo kwetterde men. Zonder ook maar even te kijken wat voor soort vermeldingen het zijn. Nee, het moest per se met hoge snelheid de twittersphere worden ingeblazen.
Wie wat verder kijkt, die ziet dat er vreemde gegevens in voorkomen. Bijvoorbeeld een geboorteakte uit 2009. In de eerste plaats zou die akte natuurlijk nooit zichtbaar mogen zijn, ten tweede blijkt het ook nog eens helemaal niet te kloppen.
Zo meent wiewaswie het te moeten presenteren:


Pure waanzin, dit. Het blijkt dat wiewaswie gewoon rondpompt wat ze krijgen aangeleverd, zonder ook maar enige check. Want kijken we naar de bron van de informatie (niet eens een primaire bron maar een transcriptie) dan zien we dit:


Het staat er dus inderdaad, 2009. Wat aantoont dat wiewaswie gewoon maar alles binnensleept wat er beschikbaar is. Testen op geloofwaardigheid van de gegevens? Vergeet het maar. Als ze niet oppassen dan krijgen we de situatie waar in een bak met helder water een kwak inkt wordt gegooid.


En dat krijg je dus nooit meer helder. Dit gebeurt niet alleen met gegevens van het Gelders Archief, ook data van het Brabants Historisch Informatie Centrum (BHIC) komt verminkt over. Zoals de overlijdensacte van Johannes van Gaal, van 2 februari 8155. Je houdt het toch echt niet voor mogelijk?
Nu is het nog een b├Ęta-versie van de site, maar over 12 dagen gaat de kassa open en dan moet er betaald worden voor die reut. In dat geval is het geen foutje meer, maar een economisch delict!

5 opmerkingen:

Ineke Smit zei

:-)
plus alle fouten van Lias die gewoon meegaan.

Richard Keijzer zei

Dag Ineke,
Dat komt er ook nog bij. En die fouten zijn niet meteen duidelijk. Ik kreeg wel een reactie over die overlijdensakte: "Wordt die niet een beetje te vroeg openbaar gemaakt?"

Christian zei

WieWasWie pompt inderdaad simpelweg data rond die ze door deelnemende archiefdiensten krijgt aangeleverd. Zonder check natuurlijk, want die check behoort plaats te vinden bij de instellingen zelf.

Bij de data van het BHIC is enige tijd sprake geweest van enkele missers in de code die de synchronisatie tussen onze database en die van WieWasWie verzorgt, waardoor data onjuist en/of onvolledig overkwamen. Dat probleem zou inmiddels verholpen moeten zijn en een nieuwe synchronisatie is gestart. Duimen maar...

Iets anders: je hebt zowaar een spelfout in onze instellingsnaam laten staan. En dan te bedenken dat die spelfout nu via rss is rondgepompt naar mijn Netvibes, zonder check... ;-)

Serieus: WieWasWie heeft inmiddels een valse start en dubbele herstart gemaakt. Maar gelukkig gaat het wel steeds beter... (Ja, echt!)

Richard Keijzer zei

Oei,
Ik bleek nog meer foutjes te hebben laten staan, zonder check. Dank voor het aangeven, ze zijn gecorrigeerd.

Christian zei

En als de foutjes in WieWasWie net zo snel verbeterd worden als de foutjes in jouw blogbericht, dan zijn we waar we wezen willen. :-)