Tabel – selektive høstninger

Netsted Type Fra (åååå-mm-dd) Til (åååå-mm-dd) Bemærkninger
aarhusvest.dk 2 2008-01-18 2011-11-16 kumulerer alt indhold
alive.dk 1 2011-02-15 2011-07-14 kumulerer alt indhold
altfordamerne.dk 1 2010-03-25 2012-03-05
altinget.dk 1 2005-07-01 Fra 2005-10-27 med ip-validering
amine.dk 3 2008-04-03 2011-05-31 Høstning stoppet – alt fanges af tværsnit
andersfogh.dk 3 2007-11-30 2009-06-29
aoa.dk 1 2010-02-15
aok.dk 1 2010-06-09
arbejderen.dk 1 2006-08-29
arla.dk 2 2008-01-08 2010-11-02
artnode.org 3 2007-08-14 2008-04-03
arto.com 3 2008-12-16 Fra 2008-12-16 med login
arto.dk 3 2007-12-14 2009-01-05 Fra 2007-12-17 med login. Fra 2009-01-05 som arto.com
asb.dk 2 2012-02-17 2012-02-17 engangshøstning
au.dk 2 2012-02-17 2012-02-17 engangshøstning
autograf.org 3 2007-08-14 2008-11-14
avisen.dk 1 2006-10-11
b.dk 1 2011-02-21 Tidligere berlingske.dk
berlingske.dk 1 2005-07-01 2011-02-21 Videoer (2008-10-27) og billedserier – flashvisning, [2010-03-25) kan pt. ikke høstes. Fra 2011-01-27 til 2011-01-22 høstet med b.dk kimlister (alias)
bibstream.dk 3 Relevant, men kunne ikke høstes pga. video, er nedlagt (2008-11-03)
blogtoppen.dk 3 2010-03-09 2010-12-28 Var kun relevant i en begrænset periode
blueberries.dk 3 2010-09-10 2010-12-28 “hjælpeside for fælleslisten.dk
bold.dk 1 2011-04-05
borgerligtcentrum.dk 2 2009-01-07 2010-02-15 Videoer kan pt. ikke høstes (2009-02-16)
bornholmstidende.dk 1 2006-12-18
borsen.dk 1 2006-08-22 Videoer kan pt. ikke høstes (2008-11-27)
bt.dk 1 2005-07-01 Videoer kan pt. ikke høstes (2008-11-28)
business.dk 1 2007-01-16 Fra 2008-01-08 med login
carblock.dk 3 2007-09-14 2008-04-03
chilinet.dk 3 2005-07-01 2010-12-28 Meget lavt aktivitetsniveau. Fanges fremover af tværsnit
christianiafolkeaktie.dk 3 2011-09-27 2011-12-12 Specialhøstning ifm. uro omkring Christianias fremtid
cnn.dk 1 2005-07-01 2007-11-30
comon.dk 1 2007-11-20 2011-10-27 kumulativ, fanges af tværsnitshøstning
da.dk 2 2007-08-14 2009-10-15 Url’erne på undersider indeholder specialtegn (? = ), efter al sandsynlighed er det kun et visningsproblem. (Testhøstning 2012-01-04)
dagbladetonline.dk 1 2006-12-18 2010-07-23 fortsætter som sn.dk
danmarksindsamling.dk 2 2012-01-11 2012-02-08 specialhøstning
danskespil.dk 2 2008-01-08 2008-05-30 Kan ikke høstes pga. flash
danskfolkeparti.dk 2 2005-07-01
dansk-politik.dk 1 2009-05-22 2011-09-01 I perioden: 2009-05-22 til 2010-03-08 kun delvist høstet og med fejl. Høstning stoppet: Sitet er ophørt (opdateres ikke efter 13-05-2011)
dansk-politik.tv 2 2007-12-18 2008-02-14 Netstedet nedlagt
dato.dk 1 2006-08-17 2007-11-26 Herefter redirect til urban.dk
Den2radio.dk 1 2011-12-01 Kun lydfiler (podcast, mp3) – lydstreaming – kan ikke høstes
denkorteavis.dk 1 2011-12-28
di.dk 2 2008-04-03
dinby.dk 2 2008-09-30 2012-03-21 Dækkes af tværsnithøstning
ditcentrum.nordjyske.dk 1 2006-08-17 2011-07-12 Er blevet til kummulativ brugersite, der kan fanges af tværsnit
dk.msn.com 1 2011-10-25
dkbn.dk 3 2008-12-14 2009-09-27 Nedtaget pga. høstningsproblem med dynamiske url’er.
dk4.dk 1 2005-07-01 2009-01-29
dmi.dk 1 2011-07-21
dmu.dk 2 2012-02-17 2012-02-17 engangshøstning
dpu.dk 2 2012-02-17 2012-02-17 engangshøstning
dr.dk 1 2005-07-01
drv.dk 2 2005-07-01 2007-12-09 Herefter radikale.dk
dvoted.net 3 2007-12-11 2011-06-10 Ophørt med udgangen af januar 2011
eb.dk 1 2005-07-01 2007-01-30 Herefter som ekstrabladet.dk
ekstrabladet.dk 1 2005-07-01
ekstrabladet.tv 1 Relevant, men kan ikke høstes pga. problemer med videoindhold (2008-11-03)
enhedslisten.dk 2 2005-07-01
e-pages.dk 2008-03-14 Høstes som hjælpesite til e-aviser, men fungerer i de fleste tilfælde ikke
epn.dk 1 2007-01-30 Problemer med høstning pga. den anvendte teknologi
erhvervsbladet.dk 1 2005-07-01
euroinvestor.dk 1 2005-07-01 2010-09-02
facebook.com 2 2010-01-26 danske profiler/grupper der knytter sig til de selektive sites
fairforandring.dk 2 relevant, men kan ikke høstes pga. den anvendte teknologi
fairlosning.dk 2 relevant, men kan ikke høstes pga. den anvendte teknologi
fdim.dk 3 2011-01-28 Kun toplisten (kører bevidst som kat.3 /tilhængelig høstningsdefinition)
filmstriben.dk 2 opfølger af bibstream.dk, relevant, men indholdet (streamet video) kan pt. ikke høstes
finansnyheder.dk 1 2006-10-12
finanswatch.dk 1 2010-12-20
flygtning.dk 2 2007-08-21 2010-05-18
folketinget.dk/ft.dk 1 2005-07-01
forum.dk 3 2008-06-14 2008-10-03 Høstes med login. Fra 2008-10-03 som sondagsavisen.dk
fpn.dk 1 2008-05-20
fyens.dk 1 2005-07-01 Fra 2007-11-08 med login. Videoer virker stort set ikke (2009-01-20)
fælleslisten.dk, faelleslisten-vest.dk 2 2010-06-27 2010-12-28 Nyt parti, der ønsker at komme i folketinget ved næste valg.Dec. 2010: Meget lav aktivitet – fanges af tværsnit
helle-tv.dk 2 Relevant, men kan ikke høstes pga. vidoer
hellethorning.dk 2 2012-01-11 2012-02-06 Relevant, men kan ikke høstes pga. flash og vidoer
hvemstemmerhvad.dk 2 2012-02-07
idag.dk 1 2006-08-29
indblik.nu 1 2009-01-13 2010-06-23 Ikke opdateret siden januar 2010
infopaq.dk 1 2005-07-01 2007-12-17
information.dk 1 2005-10-11 Fra 2007-11-08 med login, Fra 2008-11-04 intet login-indhold, Fra 2009-10-06 igen login-indhold
ing.dk 1 2006-08-29 Fra 2008-01-09 med login
injour.dk 1 2011-02-02
islam.dk 2 2007-12-01 2009-02-09
j.dk 2 2008-09-14 2010-06-28 netstedet er nedlagt
jiyan.dk 1 2010-05-17
jp.dk 1 2005-07-01 2012-06-12 videopklip fra http://jp.dk/jptv/ kan pt. ikke høstes (20081215) – Relanceret og høstes fra 2012-06-12 som jyllands-posten.dk
jubii.dk 3 2005-07-01 2008-06-27
jv.dk 1 2005-07-01
jyllands-posten.dk 1 2012-06-12 Tidligere jp.dk. Fotosiden http://foto.jp.dk/ har endnu ikke skiftet url skal søges undr det gl. domæne (13.6.12)
kanal4.dk 1 2007-12-11 2008-09-23
kanal5.dk 1 2007-12-112012-02-03 2008-09-23- -Specialhøstning af “Big Brother”
kbhlydavis.dk 1 2011-06-17
kd.dk 2 2005-07-012010-07-05 2011-11-15 2010-02-09: Høstning opgivet pga. tekniske problemer med url.2010-07-05: Igen repræsenteret i Folketinget. Prøver om problemerne er væk.
kino.dk 3 2009-01-27 2010-02-15 Høstning opgivet pga. videoproblemer
kl.dk 2 2007-11-27
konservative.dk 2 2005-07-01 2011-08-31: Faneblade mm mgl. ENTEN pga. # i URL’en ELLER pga. javascript/kah
kopenhagen.dk 3 2007-11-21 2010-02-05
kristeligt-dagblad.dk 1 2005-07-01
kunsport.dk 1 2008-10-27 2009-02-05 Domæne ophørt
kærekbh.dk 3 2011-01-28 2011-09-28
larsloekke.dk 3 2009-04-28 2011-10-18 Videoer kan pt. ikke høstes (2009-04-28)
lbl.dk 2 2007-12-18 2010-11-16 Herefter som lgbt.dk
lgbt.dk 2 2010-11-23 Tidligere lbl.dk
liberalalliance.dk 2 2008-09-16 Tidligere nyalliance.dk
licitationen.dk 1 2007-11-20 Fra 2007-12-05 med login
ligetil.nu 1 2009-01-22 2010-12-12 Fortsætter som http://www.dr.dk/nyheder/ligetil
lo.dk 2 2007-08-21
lokalia.dk 2 2010-05-17 2011-05-28 Kan ikke høstes korrekt pga. problemer med kort-meshups. Oprindelig koncept med brugerleveret indhold opgivet, sitet er solgt
lokalavisen.dk 1 2010-05-17
mediawatch.dk 1 2007-12-18 Fra 2008-10-25 med login, Fra 2008-06-13 intet login-indhold
metroxpress.dk 1 2005-07-01
mindet.dk 2 2011-03-02 + engangshøstning 2010-12-03/forskerønske
minoritetspartiet.dk 2 2005-07-01 2007-12-09
mitkbh.dk 3 2010-06-27
mobsites 1 2010-04-08 Nyhedsmediernes mobsites høstes samlet pga. teknisk lighed
modkraft.dk 3 2007-11-27
monotrimonodi.dk 2 2011-12-21 2011-12-21 engangshøstning
musiknyt.dk 3 2009-01-30
mymusic.dk 3 2007-11-27 2009-06-27 Fra 2007-12-05 med login. 2009-06-27 redirect til bandbase.dk uden login.
news.dk 1 2008-03-14
newspaq.dk 1 2007-04-18 2008-11-12
nordjyske.dk 1 2005-07-01
nordvestnyt.dk 1 2012-01-26
nutv.dk 3 Relevant, men kan ikke høstes pga. video (2008-11-03)
nyalliance.dk 2 2007-09-25 2008-09-09 Herefter som liberalalliance.dk
nyhedsavisen.nu 1 2006-08-17 2007-11-26 Herefter som avisen.dk
omtalebarometer.dk 2 2011-10-28
oplysningskontoret.dk 3 2008-10-28 2010-10-28 2009-03-25 relevant vidoe-materiale høstes ikke
overskrift.dk 1 2007-05-15
pallesgavebod.dk 1 2010-09-14
parentesslut.dk 1 2010-03-08 2011-11-02 Websitet opdateres ikke længere
partietfokus.dk 2 2010-03-30 2011-11-04
partofthegame.tv 3 2008-11-27: Relevant, men kan ikke høste den anvendte teknologi (video)
peterdyreborg.wordpress.com 3 2007-11-21 2008-10-27
planet.sfit.dk 2 2008-01-29
polennu.dk 1 2012-01-30
politiken.dk 1 2005-07-01 Fra 2008-01-09 med login
politiken.tv 1 2008-09-11 relevant video-materiale, men kan ikke høstes
politisk.tv 1 2008-12-23 2010-03-11 Ikke opdateret siden juni 2009, kummulativ
radikale.dk 2 2005-07-01
radio24syv.dk 1 2011-11-25
radio100fm.dk 2005-07-01 2008-06-26
radionyhederne.dk 1 2008-01-24 2009-05-22 Sitet er lukket pr. 1.3.2009
rbb-online.dk 1 2009-05-07 2012-01-27 erstatter rb-borsen.dk. Indgået i Ritzau Finans
rb-borsen.dk 1 2005-10-11 2009-05-07 erstattet af rbb-online.dk. Leverer under navnet Ritzau Finans indhold til kunder via andet end adgangsbegrænset webside (webservice mv.) siden marts 2011
realistpartiet.eu 2 2011-05-17 2011-09-14
redcross.dk 2 2007-12-18
redox.dk 1 2011-08-12 2011-08-14 Høstet selektivt for at sikre dokument om det højrepolitiske netværk “ORG” (
religion.dk 2 2009-07-03
ritzau.net 1 2008-09-30 Høstes med login, 2009-08-31: login-problem
ritzauinfo.dk 1 2008-09-30
sbsnet.dk 1 2007-12-11 2008-11-12
scm.dk 2 2008-01-21
seismograf.org 3 2007-12-14 2008-12-15 Netstedet nedlagt
seoghoer.dk 1 2008-09-15
sf.dk 2 2005-07-01
sn.dk 1 2010-07-26 Fortsættelse af dagbladetonline.dk
socialdemokraterne.dk 2 2005-07-01
socialdemokraterne-tv.dk 2 2009-03-20: Relevant, men kan ikke høste den anvendte teknologi (video)
socialdemokratiet.dk 2 2005-07-01 2007-12-11 Herefter som socialdemokraterne.dk
sondagsavisen.dk 1 2005-10-11 Fra 2008-01-07 inkl. den daglige avis i pdf
spilogmedier.dk 3 2010-09-02 2011-11-18
spn.dk 1 2009-04-07 Flash kan pt ikke høstes 2009-04-27
sporten.dk 1 2008-11-13
statstidende.dk 1 2005-11-02
stiften.dk 1 2006-08-21
sweetdeal.dk 3 2011-02-17 2011-09-28 Alvorlige høstnings- og visningsproblemer.
thirdear.dk 1 2011-08-12 2012-02-23 Ophørt
torshammer.dk 1 2005-07-01 2007-11-30
trier.gyldendal.dk 3 2010-01-13 2011-02-07 testhøstninger + engangshøstning (video ok!)
tvkilde.com 3 Relevant, men kan ikke høstes pga. problemer med videoindhold (2008-11-03)
tv2.dk 1 2005-07-01
tv3.dk 1 2005-07-01 2010-07-05
twitter.com 2 2010-01-26 danske profiler/grupper der knytter sig til de selektive sites
ulk.dk 3 2009-02-14 2009-05-27 Videoer kan pt. ikke høstes (2009-04-08)
ungnyt.dk 1 2010-01-28
urban.dk 1 2007-04-18 2010-10-25 er fusioneret med urbanblog.dk
urbanblog.dk 1 2009-12-03 2010-10-28 høstes for at få e-avisen fra urban (2009-12-02
venstre.dk 2 2005-07-01
viborg-folkeblad.dk 1 2010-12-20
vix.dk 3 2010-03-25 2012-04-16
webmuseum.dk 3 2010-03-27 Fortsættelse af webmuseum.re-cph.com . Alle filer høstes med succes, men der pt. nogle visningsproblemer i wayback og i viewerproxy
webmuseum.re-cph.com 3 2009-03-14 2010-02-27 Fortsættes som webmuseum.dk
weekendavisen.dk 1 2005-07-01 Fra 2008-01-09 med login
woman.dk 1 2010-04-07 2011-02-15
xstream.dk 2009-02-13 Høstes for at få nogle sider med videoer fra berlingske.dk m.fl.
youtube.com 3 Relevant, men kan ikke høstes pga. problemer med videoindhold (2008-11-03)
Zmags.com 2008-03-31 2009-09-10
180grader.dk 1 2007-05-25 2010-10-28 fanges af tværsnit
24.dk 1 2006-08-17
24timer.dk 1 2006-08-17 2009-09-19 alias af 24.dk, se denne
24timerxtra.dk 1 2007-10-30 2009-03-19 Nedtaget, da der omdirigeres til fyens.dk
3f.dk 2 2007-08-21
Tabellen er opdateret den 14.06.2012