Nyhedsarkiv

Særbevilling sikrer Netarkivet over 1600 Facebook-profiler

18. oktober 2019

I webarkiveringskredse er det alment kendt at det er en stor udfordring at indsamle indhold fra Facebook, og sådan er det også for Netarkivet.

Vores nuværende løsning til at indsamle webindhold, Heritrix, kan ikke høste Facebook tilfredsstillende. Vi eksperimenterer med at bruge manuelle eller semiautomatiske værktøjer som Webrecorder til at høste dynamisk indhold som Facebook. Resultaterne er lovende om end processen er tidskrævende. Til større indsamlinger og indsatser er der behov for mere automatiserede løsninger.

I kraft af en særbevilling har vi fået mulighed for at indsamle en stor mængde Facebook-indhold via Internet Archives produkt Archive-It. Vores fokus har været på politik, ikke mindst relateret til Folketings- og Europarlamentsvalg 2019.

Vi har blandt andet høstet over 1600 profiler før, under og efter Folketingsvalget. Profilerne har været en udvalgt blanding af alle Folketingskandidater, meningsdannere, partier, interesseorganisationer, debattører i dansk politik, journalister, radio- og tv-værter, forfattere, erhvervsledere, historikere, forskere og sågar satiresider. I valgperioden har vi også udvalgt og høstet ca. 100 af de mest interessante og relevante profiler dagligt, for at få et nuanceret billede af deres aktivitet på Facebook.

Vi høster også enkeltstående relevante facebookprofiler som har været foreslået af forskere, f.eks. https://www.facebook.com/groups/kulturarven/ og arbejder videre med hvordan vi sikrer de mest relevante danske Facebook-profiler for eftertiden.

For yderligere baggrund se:

https://webrecorder.io/
https://github.com/webrecorder/webrecorder-desktop#webrecorder-desktop-app
https://github.com/webrecorder/browsertrix
https://archive-it.org/
https://twitter.com/archiveitorg?lang=da.
https://archive.org/

At referere til indhold fra Netarkivet

13. december 2018

Hvordan refererer man til et link man har fundet i Netarkivet? Det har der været en del diskussioner om, hvordan man gør det bedst. Men nu er løsningen fundet: PWID. PWID står for Persistent Web Identifier, en unik og vedvarende ID for et dokument i Netarkivet eller i et andet Webarkiv, ligesom ISBN-nummeret er en unik ID for en bog.

PWID står for Persistent Web IDentifier og er udviklet i samspil mellem humanistiske forskere og dataloger med kendskab til webarkiver. En PWID består af følgende informationer:

  • Identifikation af webarkivet med ressource
  • Arkiveringstidspunkt for ressourcen
  • Præcision (er det blot en html-fil (part) eller skal den fortolkes som en webside (page) eller er det et website (website))
  • Arkiveret URL

Formålet med PWID’en er at lave en generel, teknologiuafhængig, persistent, menneskelig læsbar reference som kan bruges til at fremfinde ressourcen, såvel manuelt som automatisk.
Der arbejdes i øjeblikket på at få PWID standardiseret som URN. I denne form ville referencen til en arkiveret version af netarkivet.dk (fra d. 2014-01-07 09:01:06 GMT) blive:

Du kan downloade og køre en e-poster om PWID som en powerpoint slideshow her

Ovenstående er fra afsnittet i brugermanualen [link] om, hvordan du refererer til et dokument fra Netarkivet i (se side 18)

 

KV og RV 2017

23. november 2017

 

Kommunalvalget og Regionsvalget er netop overstået. Netarkivet har igen sat en særlig indsamling, en begivenhedshøstning om valget i gang.

Nyhederne i forbindelse med valget og den forudgåede valgkamp dækkes af vores løbende selektive høstninger. I  begivnhedshøstningen har vi sat fokus på kandidaternes optræden på nettet, hvilket mere og mere koncentrerer sig på de sociale medier. Af tekniske årsager bruger vi en ekstern udbyder, Archive IT, til at høste offentlige Facebookprofiler og -sider, mens vi med vores egen høstningsværktøj, Heritrix, indsamler Twitterprofiler, Linkedinprofiler og Instagramprofiler. Desuden indsamler vi relevante YouTube-videoer.

Begivenhedshøstningen om valget er også pilotprojekt for et nyt kuraterings- og dokumentationsværktøj – BCWeb – som er udviklet af vores franske samarbejdspartnere på ”Bibliothéque National de France”.  Vi håber på at kunne bruge værktøjet til at samarbejde med eksterne eksperter ved fremtidige begivenheds- eller temaindsamlinger

Den aktuelle begivenhedshøstningen er endnu ikke afsluttet. Vi forsøger at få reaktioner på valgresutaterne med i samlingen.

20 års webarkivering i Frankrig.

18. november 2016

20aarfranskwebarkivering

I 2016 er det 20 år siden, at den franske Nationalbibliotek (BNF) og det franske Institut for audiovisuelle Medier (INA) begyndte med at arkivere websider. Samtidig er det 10 år siden den franske pligtafleveringslov også dækker materiale fra Internettet.

Til franskkyndige forskere inden for webarkivering og andre interesserede vil vi nævne, at jubilæet bliver markeret med en konference.

Netarkivet siger tillykke med jubilæet.

Netarkivet og BNF arbejder sammen omkring webarkivering. Vi benytter det samme værktøj NetarchiveSuite til at kuratere vores webhøstninger. Ud over Netarkivet og BNF er det Østrigske Nationalbibliotek (ONB), det spanske Nationalbibliotek (BNE) og siden 2016 også det norske Nationalbibliotek med i samarbejdet. Værktøjet NetarchiveSuite videreudvikles i fællesskab og kuratorerne udveksler erfaringer hen over landegrænserne.

Webarkiverings-workshop

1. august 2016

webarkiveringskursus

Arbejder du med webmateriale i din forskning? Har du behov for at arkivere web materiale for at fastholde dit forskningsobjekt? Eller vil du anvende materiale, som har været tilgængeligt på web, men nu kun findes i et webarkiv? Så er en webarkiverings-workshop måske lige det rigtige for dig.

Den 11. august arrangerer NETLAB sådan en workshop. Der er ledige pladser. Er du interesseret, kan du læse mere om workshoppen og hvordan du tilmelder dig her.

Hvem bruger Netarkivet

27. oktober 2015

HvemBrugerHvor kommer Netarkivets brugere fra? Vi har kigget i vores brugerliste og lavet en lille optælling.

Langt de fleste med ekstern adgang til Netarkivet , forskere med dokumenteret forskningsformål kan få adgang, er tilknyttet de danske universiteter. Her ses en klar overvægt af brugere fra Aarhus Universitet (cirka halvdelen af alle brugere). Af andre institutioner kan nævnes Det Kongelige Bibliotek, Udlændingeservice og Dansk Sprognævn. Også to udenlandske forskere har eller har haft adgang til arkivet. Næsten halvdelen af brugerne er tilknyttet institutter for medievidenskab og/eller internetforskning, men der er også en del med baggrund i kommunikation og statskundskab. De resterende kommer fra en bredere vifte af humanistiske studier som religionsvidenskab, dramaturgi og historie.
Det samme billede ses, når det gælder brugere med læsesalsadgang. For at få adgang på læsesalen på enten Det Kongelige Bibliotek eller Statsbiblioteket, skal man være specialestuderende.

Læs mere om adgang her.

Begivenhedshøstning om flygtningekrisen

11. september 2015

flygtninge

Flygtningestrømmen til Europa – og i de seneste dage også til Danmark – er dokumenteret i Netarkivet. Vi høster nyhedsmediernes hurtigt opdaterede indhold op til flere gange dagligt, således dækker vi nyhedsstoffet om flygtningene. Men flygtningekrisen skaber øget aktivitet på nettet andre steder end på nyhedssites – navnlig på de sociale medier.
Derfor har vi nu startet en begivenhedshøstning, der sætter bl.a. fokus på at indsamle indlæg, kommentarer med videre fra Facebook, Twitter, YouTube og andre sociale medier. Derudover kommer hjælpeorganisationers temasider og nyhedsindlæg om flygtningedebatten med i begivenhedshøstningen. I mindre omfang indsamler vi udenlandske mediers kommentarer til Danmarks holdninger og håndtering af flygtningestrømmen.

10 år med webarkivering I Danmark

26. juni 2015

Netarkivet har fejret 10 års fødselsdag

Netarkivet_10_år_gruppefoto_a_web

Den 1. juli 2005 trådte en ny pligtafleveringslov i kraft: Materiale, “offentliggjort i elektroniske kommunikationsnet”, dvs. hele den danske del af internettet, var nu også omfattet af pligtafleveringen. Netarkivet blev oprettet i et samarbejde mellem Det Kongelige Bibliotek og Statsbiblioteket.

I starten var der fokus på samlingsopbygning og udvikling af værktøjer, som kuratorerne kunne bruge til at administrere indsamlingen med. Netarkivet har tre indsamlingsstrategier: Tværsnitshøstninger, Selektive høstninger og Begivenhedshøstninger. De tre strategier supplerer hinanden for at dække den danske del af internettet så bredt som muligt.

I 2007 kom de første brugere og kurator-værktøjet NetarchiveSuite blev lanceret som Open Source værktøj. I 2008 begyndte det franske og det østrigske nationalbibliotek at bruge NetarchiveSuite og siden videreudvikledes værktøjet I fællesskab med disse to.

Siden 2012 har forskere og ph.d.-studerende mulighed for at få adgang til Netarkivet via en Wayback Machine, som er udviklet efter Internet Archives Wayback Machine.

Netarkivet fejrede 10 års fødselsdagen i forbindelse med konferencen ”Web Archives as Scholarly Ressources” med en reception med indslag fra Netarkivets 10-årige historie. Fødselsdagsgaven til Netarkivets brugere og medarbejdere var fritekstsøgning i arkivet. Indtil nu har det kun været muligt at søge i arkivet, hvis man havde bestemte url’er at søge efter.

Ditte Laursen, Kurator i Netarkivet, fortæller om Netarkivets fødselsdag i P1, den 25. juni 2015. (Ca. 1:40 inde i programmet – ca. 11:30)

Foto: Henrik Storgaard Sørensen

Netarkivet dokumenterer valgkampen

27. maj 2015

Netarkivet FV2015

Så er Folketingsvalget 2015 udskrevet og Netarkivets kuratorer har trykket på knappen for at indsamle den del af valgkampen, der foregår på Internettet. Ligesom valgkampen var begyndt for længe siden, har Netarkivet været i gang med forberedelserne til årets Folketingsvalg. Der er især fokus på de sociale medier, hovedsagelig Twitter og Facebook. Netarkivet vil indsamle Twitter- og Facebook-profiler fra kandidater, partier, kommentatorer, nyhedsmedier osv., men selvfølgelig også klassiske netsteder, der relaterer sig til folketingsvalget. Således indsamler Netarkivet i skrivende stund 1387 Twitter-profiler, 730 Facebook-profiler, 50 Linkedin-profiler, 36 Instagram-profiler. Der er indtil nu indsamlet 25 YouTube film, derudover indsamles der fra 1863 hjemmesider fra partier og kandidater samt fra nyhedsmedierne.

Netarkivet gennemfører ca. 3 såkaldte begivenhedshøstninger per år. Begivenheder, der udløser øget aktivitet på eksisterende netsteder, i dag er det især de sociale medier, eller skaber nye netsteder, giver anledning til sådan en høstning. Der findes planlagte begivenhedshøstninger, som fx et folketingsvalg, og pludselig opståede begivenheder, som fx ulykker, naturkatastrofer, terrorangreb, mv. Indsamlingen sker med webcrawleren Heritrix.

Netarkivet er klar til folketingsvalg 2015

5. februar 2015

fv2015

Et folketingsvalg er en af de planlagte begivenhedshøstninger Netarkivet foretager. Valgkampen til folketingsvalget, der senest skal foregår den 15. september 2015, er så småt kommet i gang. Netarkivet vil være med fra starten. Derfor er vi begyndt at høste sider med folketingsvalgrelateret indhold. Derudover samler vi links til blandt andet folketingskanditaters og opstillingsberettigede partiers hjemmesider og deres tilstedeværen på de sociale medier.

Netarkivet bruger erfaringer fra tidligere Folketingsvalgs- og andre begivenhedshøstninger. Vores sidste store begivenhedshøstning omkring European Song Contest i København i maj 2014 er blevet grundigt evalueret. Forskere har deltaget i selve begivenhedshøstningen og har også været med til evalueringen. Resultaterne af denne grundige evaluering indgår også i forberedelsen af den aktuelle høstning af folketingsvalget 2015.

Vi vil sætte særligt fokus på de sociale medier. Vi har identificeret links til bl.a. kandidaternes  Facebook- og Twitterprofiler og kan allerede nu konstatere, at valgkampen har flyttet sig fra Facebook over på Twitter. Vi har links til godt 700 Facebookprofiler og dobbelt så mange Twitterprofiler.

Vores høstningsteknologi er baseret på links, der indsamles af en webcrawler (høster).