Om Netarkivet

Netarkivet indeholder den danske del af internettet, det vil sige materiale udgivet på internettet på dansk eller henvendt til danskere. Dette er en del af den danske kulturarv, som Netarkivet ifølge pligtafleveringsloven skal bevare for eftertiden.

Vi bruger såkaldte høstere eller webcrawlere til at indsamle hele den danske del af internettet. Med andre ord, hvis din hjemmeside ender med .dk, behøver du ikke anmelde den, for at den kommer i Netarkivet. Hvis din hjemmeside ender på .com, .eu, .edu eller noget helt andet, må du gerne tjekke, om Netarkivet kender og indsamler den.

Vi indsamler kun offentligt tilgængeligt materiale fra internettet. Privat indhold (med begrænset adgang via login) som for eksempel interne familie-websites eller firmaers intranet er ikke offentligt og falder derfor ikke ind under vores indsamlingsforpligtelse.

Vi anvender fire forskellige høstningsstrategier:

  1. Tværsnitshøstning af alle danske domæner 4 gange årligt.
  2. Selektiv høstning af alle danske nyhedsmedier (fx dagligt), politiske partier, organisationer og foreninger,ministerier og styrelser, udvalgte profiler fra sociale medier(fx dagligt).
  3. Begivenhedshøstning af 2-3 begivenheder årligt (fx folketingsvalg).
  4. Specialhøstninger (fx forskerønske)

Hvis du har lyst til at hjælpe Netarkivet, så se her:

Se mere om de enkelte høstningsstrategier til højre.

Hensigten med de tre strategier er, at de kombineret med hinanden giver den bedst mulige dækning af, hvad der sker på internettet. Med begivenheds- og selektive høstninger nedtages det, som tværsnitshøstningerne ikke når at nedtage, fordi der går cirka tre måneder imellem, at tværsnitshøsterne kommer forbi et domæne. Strategierne kan illustreres på følgende måde:

netarkivstrategier2016_590

Netarkivets arkiv indeholder både data og metadata, og begge dele stilles til rådighed for forskningsprojekter på Kulturarvsclusteret.