Statistik

 

Netarkivet i tal

Datamængde (per 23.01.2020)

Langtidsbevaret –  samlet

  • 637 TB i 1024 tal  ( + 105 TB i forhold til sidste år)
  • Antal objekter:  36.568.348.122, dvs. en årlig tilvækst på  3.953.588.799  i stedet for sidste års 2.680.808.725

Beregningsmetoden er i overensstemmelse med ISO Webstatistikken (4.2.3) dvs. baseret på antal høstede URL’er, dvs. http returkoderne  2.., 3..,4.. og 5.. i samtlige crawl.logs. Det omfatter således også høstede dubletter, men medtager IKKE et mindre antal arkiverede objekter UDEN crawl.logs (f.eks. høstninger vi har outsourcet til ARCHIVE-IT, gamle data fra 2000 -2004, som vi har modtaget fra Internet Archive og test-indsamlinger)

Stigningen på ca 1.3 mia  skyldes at vi i 2019 igen har fået gennemført 4 TV høstninger med 2 steps

Vi har dog fortsat ca 1.2 mia  returkoder -5003 “Bytelimit reached” i hvert kvartals tværsnithøstning,  step 2. Det betyder, at høsteren kunne ikke gå til bunds og få alt indhold med.

 

Ikke langtidsbevaret – samlet

  • 4,3 TB i 1024 tal, omfattende smsbooks, arto (4,1 TB), materiale indsamlet via Archive-It, second life
  • Antal objekter:  ca 3400 filer

 

Websider indsamlet af Netarkivet

År

Web – antal websites i alt

  Web – antal websites større end 10Mb

2006 576750 51000
2007 667703 95892
2008 916063 106130
2009 921988 127843
2010 898137 13173
2011 956.824 140.633
2012 992.822 149.141
2013 1.069.331 163.308
2014 1.081.850 154.305
2015 1.096.109 149.199
2016 1.097.585 180.046

Mimetype-diagrammer

Statistikken viser hvad der er gemt i  Netarkivet. Dubletter af mimetyper forskellig fra html er ikke gemt siden 2006.

Mimetype lagkagediagram, tværsnitshøstning nr. 19 (2013)

TV19web

Mimetype lagkagediagram, tværsnitshøstning nr. 17 (2013)

TV17web

Mimetype lagkagediagram, tværsnitshøstning nr. 13 (2012)

TV13web

Mimetype lagkagediagram, tværsnitshøstning nr. 10 (2011)

TV10web