Særbevilling sikrer Netarkivet over 1600 Facebook-profiler

18. oktober 2019

I webarkiveringskredse er det alment kendt at det er en stor udfordring at indsamle indhold fra Facebook, og sådan er det også for Netarkivet.

Vores nuværende løsning til at indsamle webindhold, Heritrix, kan ikke høste Facebook tilfredsstillende. Vi eksperimenterer med at bruge manuelle eller semiautomatiske værktøjer som Webrecorder til at høste dynamisk indhold som Facebook. Resultaterne er lovende om end processen er tidskrævende. Til større indsamlinger og indsatser er der behov for mere automatiserede løsninger.

I kraft af en særbevilling har vi fået mulighed for at indsamle en stor mængde Facebook-indhold via Internet Archives produkt Archive-It. Vores fokus har været på politik, ikke mindst relateret til Folketings- og Europarlamentsvalg 2019.

Vi har blandt andet høstet over 1600 profiler før, under og efter Folketingsvalget. Profilerne har været en udvalgt blanding af alle Folketingskandidater, meningsdannere, partier, interesseorganisationer, debattører i dansk politik, journalister, radio- og tv-værter, forfattere, erhvervsledere, historikere, forskere og sågar satiresider. I valgperioden har vi også udvalgt og høstet ca. 100 af de mest interessante og relevante profiler dagligt, for at få et nuanceret billede af deres aktivitet på Facebook.

Vi høster også enkeltstående relevante facebookprofiler som har været foreslået af forskere, f.eks. https://www.facebook.com/groups/kulturarven/ og arbejder videre med hvordan vi sikrer de mest relevante danske Facebook-profiler for eftertiden.

For yderligere baggrund se:

https://webrecorder.io/
https://github.com/webrecorder/webrecorder-desktop#webrecorder-desktop-app
https://github.com/webrecorder/browsertrix
https://archive-it.org/
https://twitter.com/archiveitorg?lang=da.
https://archive.org/