Back to top

Googelen door archieven? Een droom voor elke onderzoeker en een wens van archiefbeheerders. Het project volautomatische archiefontsluiting onderzoekt in hoeverre nieuwe digitale technieken ingezet kunnen worden om archieven digitaal en op documentniveau doorzoekbaar te maken. Het brengt de sector een stap dichter bij de wens archieven inhoudelijk, op documentniveau vanachter de computer te bevragen.  

Afgerond

Doorbraak: Googelen door archieven dichterbij dan verwacht

07-11-2016

Het project Volautomatische Archiefontsluiting is afgerond. Een eindrapport is geschreven, waarin de methodologie, de resultaten en aanbevelingen worden beschreven. Ook de deelrapporten van het project, naar OCR- en NER-technieken bijvoorbeeld, zijn gepubliceerd. 

PDF icon FINAL REPORT project Full Automatic Archival Access.pdf

Final report project Full Automatic Archival Access (FAAA)

De mogelijkheid om te Googelen door archiefdocumenten is dichterbij dan verwacht. Dat blijkt uit het eindrapport van het project Volautomatische Archiefontsluiting.

PDF icon Archievenblad_2016.9_november_17-19.pdf

Archievenblad november '16 Googelen door archieven [Deel 1]

PDF icon Archievenblad nr. 10 (dec 2016) p. 14-17.pdf

Archievenblad december '16 Googelen door archieven [deel 2]

Studiedag 'Googelen door archieven'

13-10-2016

Op 13 oktober 2016 zijn tijdens de studiedag 'Googelen door archieven' de resultaten van het project gepresenteerd.

Beschikbaarheid van digitale bronnen is niet genoeg, toegankelijkheid is gewenst. Tijdens de studiedag ‘Googelen door archieven’ opent op 13 oktober 2016 deelt de sector kennis over projecten die een oplossing kunnen bieden. 

13-10-2016

Studiedag Googelen door archieven

De studiedag 'Googelen door archieven' biedt een overzicht van nieuwe projecten die erop gericht zijn door het gebruik van slimme software archiefcollecties tot op documentniveau beter doorzoekbaar te maken. 

Uitvoering

Aan de slag met OCR en NER

02-05-2016

Het Centraal Archief Bijzonder Rechtspleging (CABR) bestaat uit kilometers aan papier. Voor dit pilotproject is een selectie gemaakt van honderd hybride en volledig getypte documenten op verschillende soorten papier. De documenten zijn vervolgens gescand op basis van metamorfoze-eisen. De scans worden ge-OCR’d en Named Entity Recognition-tools gebruikt op een testset van ge-OCR-de tekst om namen van personen, locaties, etc. te identificeren.

Googelen door archieven in het buitenland

In februari 2016 schreef Edwin Klijn een gastblog over de kick-off conferentie van READ 'Googlen in archieven: science fiction of de toekomst?', die in january 2016 plaatsvond bij de Hessian State Archives in Marbug (Duitsland). 

Start

OCR gebruiken bij automatische ontsluiting van hybride documenten

12-04-2015

In het project Volautomatische Archiefontsluiting wordt onderzocht in hoeverre nieuwe digitale technieken (OCR en NER) ingezet kunnen worden om archieven digitaal en op documentniveau doorzoekbaar te maken.

Voorbeeld van een hybride document
Voorbeeld van een hybride document