Netarkivet i tal
Datamængde (per 23.01.2020)
Langtidsbevaret – samlet
- 637 TB i 1024 tal ( + 105 TB i forhold til sidste år)
- Antal objekter: 36.568.348.122, dvs. en årlig tilvækst på 3.953.588.799 i stedet for sidste års 2.680.808.725
Beregningsmetoden er i overensstemmelse med ISO Webstatistikken (4.2.3) dvs. baseret på antal høstede URL’er, dvs. http returkoderne 2.., 3..,4.. og 5.. i samtlige crawl.logs. Det omfatter således også høstede dubletter, men medtager IKKE et mindre antal arkiverede objekter UDEN crawl.logs (f.eks. høstninger vi har outsourcet til ARCHIVE-IT, gamle data fra 2000 -2004, som vi har modtaget fra Internet Archive og test-indsamlinger)
Stigningen på ca 1.3 mia skyldes at vi i 2019 igen har fået gennemført 4 TV høstninger med 2 steps
Vi har dog fortsat ca 1.2 mia returkoder -5003 “Bytelimit reached” i hvert kvartals tværsnithøstning, step 2. Det betyder, at høsteren kunne ikke gå til bunds og få alt indhold med.
Ikke langtidsbevaret – samlet
- 4,3 TB i 1024 tal, omfattende smsbooks, arto (4,1 TB), materiale indsamlet via Archive-It, second life
- Antal objekter: ca 3400 filer
Websider indsamlet af Netarkivet
År |
Web – antal websites i alt |
Web – antal websites større end 10Mb |
2006 | 576750 | 51000 |
2007 | 667703 | 95892 |
2008 | 916063 | 106130 |
2009 | 921988 | 127843 |
2010 | 898137 | 13173 |
2011 | 956.824 | 140.633 |
2012 | 992.822 | 149.141 |
2013 | 1.069.331 | 163.308 |
2014 | 1.081.850 | 154.305 |
2015 | 1.096.109 | 149.199 |
2016 | 1.097.585 | 180.046 |
Mimetype-diagrammer
Statistikken viser hvad der er gemt i Netarkivet. Dubletter af mimetyper forskellig fra html er ikke gemt siden 2006.
- Oversigt over mængden af høstede data – se tabellen Oversigt over tværsnitshøstninger
- Netarkivets første 5 år: Netarkivet-mimetype-statistik-2005-2010,
Mimetype lagkagediagram, tværsnitshøstning nr. 19 (2013)
Mimetype lagkagediagram, tværsnitshøstning nr. 17 (2013)
Mimetype lagkagediagram, tværsnitshøstning nr. 13 (2012)
Mimetype lagkagediagram, tværsnitshøstning nr. 10 (2011)