Om Netarkivet

Netarkivet indeholder den danske del af internettet, det vil sige materiale udgivet på internettet på dansk eller henvendt til danskere. Dette er en del af den danske kulturarv, som Netarkivet ifølge pligtafleveringsloven skal bevare for eftertiden.

Vi bruger såkaldte høstere eller webcrawlere til at indsamle hele den danske del af internettet. Med andre ord, hvis din hjemmeside ender med .dk, behøver du ikke anmelde den, for at den kommer i Netarkivet. Hvis din hjemmeside ender på .com, .eu, .edu eller noget helt andet, må du gerne tjekke, om Netarkivet kender og indsamler den.

Vi indsamler kun offentligt tilgængeligt materiale fra internettet. Privat indhold (med begrænset adgang via login) som for eksempel interne familie-websites eller firmaers intranet er ikke offentligt og falder derfor ikke ind under vores indsamlingsforpligtelse.

Vi anvender fire forskellige høstningsstrategier:

  1. Tværsnitshøstning af alle danske domæner 4 gange årligt.
  2. Selektiv høstning af alle danske nyhedsmedier (fx dagligt), politiske partier, organisationer og foreninger,ministerier og styrelser, udvalgte profiler fra sociale medier(fx dagligt).
  3. Begivenhedshøstning af 2-3 begivenheder årligt (fx folketingsvalg).
  4. Specialhøstninger (fx forskerønske)

Hvis du har lyst til at hjælpe Netarkivet, så se her:

Se mere om de enkelte høstningsstrategier til højre.

Hensigten med de tre strategier er, at de kombineret med hinanden giver den bedst mulige dækning af, hvad der sker på internettet. Med begivenheds- og selektive høstninger nedtages det, som tværsnitshøstningerne ikke når at nedtage, fordi der går cirka tre måneder imellem, at tværsnitshøsterne kommer forbi et domæne. Strategierne kan illustreres på følgende måde:

netarkivstrategier2016_590

Netarkivets arkiv indeholder både data og metadata, og begge dele stilles til rådighed for forskningsprojekter på Kulturarvsclusteret.

Tekniske begrænsninger

Vores høstningssoftware Heritrix  og vores visningsværktøj, der bygger på Internet Archive Wayback 1.8-Snapshot har tekniske begrænsninger, derfor fungerer følgende features ikke i det arkiverede materiale.

  • Indbyggede søgefunktioner, der findes på de originale websider, kan ikke anvendes
  • Navigationsfunktioner, som drop-down menuer, tjekbokse, vis næste…fungerer ikke i alle tilfælde.
  • Visse former for indhold, som er indlejret fra andre websider end den arkiverede, fx interaktive kort eller feeds fra sociale medier kan ikke høstes.
  • Andet interaktivt indhold, fx skjulte brugerkommentarer, der kræver et brugerklik for visning kan ofte ikke høstes.
  • Flash animationer, spil, og lign. kan ofte ikke høstes.
  • Streaming af levende billeder (video) og lyd kan ikke høstes.
  • Kompleks Javascript kan ikke høstes korrekt.
  • Sites, der anvender https-protokollen kan ikke vises.