Nyhedsarkiv

4. tværsnitshøstning 2012 afsluttet

11. januar 2013

Den 4. tværsnitshøstning for 2012 er nu afsluttet. Dermed har vi opfyldt vores mål, nemlig at gennemføre 4 tværsnitshøstninger om året. Vi har høstet indhold fra 992.822 domæner.  Der er høstet ca. 30 TB og uploadet ca. 20 TB på godt to måneder.

Netarkivet indeholder i alt 318 TB.

Alle høstede data er tilgængelige i Netarkivets wayback machine.

Netarkivet har i øjeblikket 15 eksterne brugere. Netarkivet kan kun benyttes i forbindelse med forskning eller videnskabelige formål.

Wayback er tilgængelig igen

11. december 2012

Dog er søgninger via Wayback efter data fra år 2005 ikke fuldt tilgængelig.I forbindelse med strømsvigtet i går i København har vi tabt 7 TB data på disksystemer på Det Kongelige Bibliotek. Vi forventer at få nyt udstyr i morgen og herefter vil genetablering af data blive startet.

Genetablering forventes at tage ca 1 uge.

Wayback-machine ude af drift

På grund af strømudfaldet i København i går, den 10. december, er Netarkivets wayback-machine pt. ude af drift. Vi vender tilbage, så snart problemet er løst.

17. tværsnitshøstning afsluttet

29. juni 2012

Den anden tværsnitshøstning i 2012 er netop afsluttet  på under 2 måneder.

En tværsnitshøstning giver et øjebliksbillede af den danske del af internettet på det tidspunkt, hvor vores webcrawlere kommer forbi.

Vi kørte tværsnitshøstningen i to step. Første step startede 6. maj med en grænse på 10 MB per domæne, dvs. vores høstere (webcrawlere) stopper høstningen af et givent domæne, når der er hentet 10 MB, og fortsætter med at høste et nyt domæne. Første step varede en uge.

Da vi ikke fik alt indhold med fra meget store websteder, som for eksempel Danmarks Radios og TV2’s hjemmesider, satte vi andet step i gang – nu med en grænse på 8 GB per domæne. Andet step blev sat i gang efter en uges pause (21. maj) og varede 37 dage.

Samlet har denne tværsnitshøstning varet 53 dage og vi har høstet 28 TB og 670 millioner dokumenter (filer).

I Netarkivets første år varede en tværsnitshøstning næsten et halvt år, vi kunne altså kun gennemføre 2 tværsnitshøstninger per år. Med den nuværende  høstningshastighed kan vi opfylde vore mål om at gennemføre 4 årlige tværsnitshøstninger.

Fælles international webhøstning nu offentlig tilgængelig

8. februar 2012

En af Netarkivets indsamlingsstrategier er såkaldte begivenhedshøstninger, hvor vi intensiverer indsamlingen af netsteder omkring en planlagt eller en pludselig opstående begivenhed.

Af og til deltager Netarkivet sammen med webarkiver fra hele verden i en international begivenhedshøstning. Resultatet af en sådan fælles indsamling er nu offentlig tilgængelig: Vinter OL 2010.

Webarkiver verden over er organiseret i IIPC (International Internet Preservation Consortium). Her udveksler vi løbende erfaringer og forsøger i fællesskab at finde løsninger på tekniske og lovgivningsmæssige udfordringer.

Det er IIPC der koordinerer internationale begivenhedshøstninger som Vinter OL 2010, mens University of North Texas stiller værktøjet  til rådighed. Selve høstningen foretages  af Internet Archive.  At Vinter OL 2010 samlingen nu er offentlig tilgængelig, kan vi takke California Digital Library for.

Netarkivet hylder Vaclav Havel

28. januar 2012

Kort før jul døde den tjekkiske eks-præsident Vaclav Havel, og det tjekkiske nationalbibliotek opfordrede internetarkiver verden over til at deltage i en indsamling af netsteder til minde om præsidenten. Netarkivet deltog i indsamlingen sammen med 25 andre nationale internetarkiver og identificerede knap 200 danske url’er, der mindedes Vaclav Havel. Det var først og fremmest nyhedssites, men også blogs og det officielle og politiske Danmarks netsteder plus en række andre netsteder.
Netarkivet deltager i internationale samarbejder om at høste internetmateriale, hvis materialet har betydning for Danmarks udvikling og historie, eller hvis materialet bidrager til fælles metodisk og teknisk sparring. Desuden bidrager Netarkivet til internationale samarbejder, hvis mål er fælles adgang og samsøgning på tværs af landegrænser. Verdensindsamlingen af url’er omkring Vaclav Havels død kan ses her (eksternt link).

Netarkivet arkiverer Second life

22. februar 2011

Vikingecentret i Second LifeNetarkivet har bestilt og fået leveret 2 timers videoer fra Second Life. Disse er udført af Tommy Nilsson (alias Dr. Asp.) fra Wonderful Denmark. Tommy har stor erfaring i Second Life miljøet og har i samråd med Netarkivet sammensat i alt 44 videoer, der fylder 10,5 GB og giver 2 timers afspilning.

Second Life er en meget dynamisk verden, hvor den enkelte deltager har konstrueret sig en avatar. En avatar er her en kunstig person, der bruges i det interaktive rollespil på internettet. Med avataren bevæger deltageren sig rundt i den virtuelle verden – en verden som de også selv er med til at forme. På videoerne vises bredt fra Second Life for at give eftertiden et indblik i denne specielle verden, som det pt. ikke er muligt at indsamle ved den høstningsteknik, som Netarkivet benytter sig af.

Se udvalgte videoer (pt. 13 styk), der er lagt på YouTube.com frahttp://doctorasp.wordpress.com/2010/12/14/second-life-videoer-pa-youtube/ Og se detaljer om indsamlingen på http://doctorasp.wordpress.com/2010/11/28/pligtaflevering-af-virtuelle-verdener/

Videoerne er gemt i det almindelige Mpeg2 format og kan således afspilles på enhver PC.  Avatar navnene er anonymiserede. Det er endnu ikke muligt at låne videoerne fra Det Kongelige Bibliotek eller Statsbiblioteket på grund af adgangsreglerne for Netarkivet.

Første ph.d. om Netarkivet

18. januar 2010

Netarkivet fik sin første ph.d., da Vidar Falkenberg i december forsvarede sin afhandling “Netavisernes historie – avismediets evolution i mediematricens revolution” ved Institut for Informations- og medievidenskab, AU.
Afhandlingen er den første historiske undersøgelse af de danske netaviser, og det er samtidig det første større, afsluttede projekt, der benytter det arkiverede internetmateriale i Netarkivet. Afhandlingen redegør for netavisens historiske udvikling i Danmark fra 1993 til i dag, og den bidrager blandt andet med metodiske overvejelser i forhold til at benytte arkiverede netsteder som empirisk materiale.
Netmediets position i mediesystemet perspektiveres også, herunder specielt nettets rolle i kampen om fordelingen af den offentlige mediestøtte. Læs mere om afhandlingen.

Ny redaktionsgruppe for 2010 og 2011

10. november 2009

Kulturministeriet har nedsat ny redaktionsgruppe for 2010 og 2011. Medlemmerne som skal virke som rådgivende organ for netarkivet er følgende:
Lektor Niels Brügger, Medievidenskab, Aarhus Universitet
Henrik Borberg, Forlaget Multivers
Peter Djurup, FDIM
Webmanager Tina Skærbæk, IT Universitetet i København

Erfaringer med høstning af det danske net 2005 – 2008

4. december 2008

“Erfaringer med høstning af det danske net 2005 – 2008″ af Grethe Jacobsen: Læs artiklen på DFrevy.dk