Selektive høstninger

Som supplement til tværsnitshøstningerne indsamler vi året rundt 80-100 udvalgte netsteder, som opdateres hyppigt (fx nyhedsmedier). Disse netsteder nedtages med højere frekvens, op til 6 gange dagligt og giver et kontinuerligt billede af et lille antal særligt betydningsfulde og dynamiske netsteder.

Netstederne afspejler dels  medieoffentligheden i form af nyhedsmedierne, dels typiske og meget besøgte netsteder fra myndigheder, den kommercielle sektor og civilsamfundet. Endelig – og her kan du måske kan hjælpe – skal vi også indsamle et mindre udvalg af netsteder, som er specielle og unikke. Der vil typisk være tale om netsteder (også wikis og blogs) fra små miljøer med politisk debat, æstetisk og eksperimenterende webkunst og lignende.

Du kan hjælpe os ved at sende forslag til danske netsteder fra små miljøer med politisk debat, æstetisk og eksperimenterende webkunst etc. ved at sende en mail til os: info@netarkivet.dk

Dokumentation for selektive høstninger

De selektive sites indsamles inden for 3 kategorier:

Kategori 1 (type 1): Netsteder, der fungerer som nyhedsmedie for den danske offentlighed. Hertil hører især de landsdækkende avisers og tv-stationers netsteder, de større regionale avisers netsteder, Folketingets netsted samt et mindre udvalg af nyhedsmedier.

Kategori 2 (type 2): Netsteder, der dækker et repræsentativt udsnit af typiske netsteder, dvs. meget besøgte netsteder (fx dmi.dk), og/eller netsteder der repræsenterer typiske anvendelser, (fx virksomheders netsteder, byportaler og kommunale portaler, netsteder, der anvendes som lokalt medie).Redaktionen har defineret tre typer af sektorer inden for denne kategori, som skal være repræsenteret:
a) civilsamfundet,
b) myndighederne,
c) den kommercielle sektor

Kategori 3 (type 3: )Netsteder, der er særligt karakteristiske, eksperimentelle eller unikke (fx åbne debatmiljøer, netfællesskaber, personlige sider, netkunststeder) i forhold til indhold og udtryksformer.

Netsted Type Fra Til Bemærkninger
aarhusvest.dk 2 2008-01-18 2011-11-16 kumulerer alt indhold
alive.dk 1 2011-02-15 2011-07-14 kumulerer alt indhold
altfordamerne.dk 1 2010-03-25 2012-03-05
altinget.dk 1 2005-07-01 Fra 2005-10-27 med ip-validering
amine.dk 3 2008-04-03 2011-05-31 Høstning stoppet – alt fanges af tværsnit
andersfogh.dk 3 2007-11-30 2009-06-29
aoa.dk 1 2010-02-15
aoh.dk 1 2013-07-19 Herning Folkeblads nyhedssite
aok.dk 1 2010-06-09
arbejderen.dk 1 2006-08-29
arla.dk 2 2008-01-08 2010-11-02
artnode.org 3 2007-08-14 2008-04-03
arto.com 3 2008-12-16 Fra 2008-12-16 med login
arto.dk 3 2007-12-14 2009-01-05 Fra 2007-12-17 med login. Fra 2009-01-05 som arto.com
autograf.org 3 2007-08-14 2008-11-14
avisen.dk 1 2006-10-11
b.dk 1 2011-02-21 Tidligere berlingske.dk
berlingske.dk 1 2005-07-01 2011-02-21 Videoer (2008-10-27) og billedserier – flashvisning, [2010-03-25) kan pt. ikke høstes. Fra 2011-01-27 til 2011-01-22 høstet med b.dk kimlister (alias)
blogtoppen.dk 3 2010-03-09 2010-12-28 Var kun relevant i en begrænset periode
blueberries.dk 3 2010-09-10 2010-12-28 “hjælpeside for fælleslisten.dk
bobedre.dk 1 2012-03-05 2013-09-30
bold.dk 1 2011-04-05
borgerligtcentrum.dk 2 2009-01-07 2010-02-15 Videoer kan pt. ikke høstes (2009-02-16)
bornholmstidende.dk 1 2006-12-18 2013-01-24 Fortsættes som tidende.dk
borsen.dk 1 2006-08-22 Videoer kan pt. ikke høstes (2008-11-27)
bt.dk 1 2005-07-01 Videoer kan pt. ikke høstes (2008-11-28)
business.dk 1 2007-01-16 Fra 2008-01-08 med login
carblock.dk 3 2007-09-14 2008-04-03
chilinet.dk 3 2005-07-01 2010-12-28 Meget lavt aktivitetsniveau. Fanges fremover af tværsnit
cnn.dk 1 2005-07-01 2007-11-30
comon.dk 1 2007-11-20 2011-10-27 kumulativ, fanges af tværsnitshøstning
da.dk 2 2007-08-14 2009-10-15 Url’erne på undersider indeholder specialtegn (? = ),
efter al sandsynlighed er det kun et visningsproblem. (Testhøstning 2012-01-04)
dagbladetonline.dk 1 2006-12-18 2010-07-23 fortsætter som sn.dk
dagens.dk 1 2012-10-01
danskekommuner.dk 2 2012-10-12
danskespil.dk 2 2008-01-08 2008-05-30 Kan ikke høstes pga. flash
danskfolkeparti.dk 2 2005-07-01
dansk-politik.dk 1 2009-05-22 2011-09-01 I perioden: 2009-05-22 til 2010-03-08 kun delvist høstet og med fejl.
Høstning stoppet: Sitet er ophørt (opdateres ikke efter 13-05-2011)
dansk-politik.tv 2 2007-12-18 2008-02-14 Netstedet nedlagt
dato.dk 1 2006-08-17 2007-11-26 Herefter redirect til urban.dk
Den2radio.dk 1 2011-12-01 Kun lydfiler (podcast, mp3) – lydstreaming – kan ikke høstes
denkorteavis.dk 1 2011-12-28
di.dk 2 2008-04-03
dinby.dk 2 2008-09-30 2012-03-21 Dækkes af tværsnithøstning
ditcentrum.nordjyske.dk 1 2006-08-17 2011-07-12 Er blevet til kummulativ brugersite, der kan fanges af tværsnit
dk.msn.com 1 2011-10-25
dkbn.dk 3 2008-12-14 2009-09-27 Nedtaget pga. høstningsproblem med dynamiske url’er.
dk4.dk 1 2005-07-01 2009-01-29
dmi.dk 1 2011-07-21
dr.dk 1 2005-07-01
drv.dk 2 2005-07-01 2007-12-09 Herefter radikale.dk
dvoted.net 3 2007-12-11 2011-06-10 Ophørt med udgangen af januar 2011
eb.dk 1 2005-07-01 2007-01-30 Herefter som ekstrabladet.dk
ekstrabladet.dk 1 2005-07-01
ekstrabladet.tv 1 Relevant, men kan ikke høstes pga. problemer med videoindhold (2008-11-03)
enhedslisten.dk 2 2005-07-01
e-pages.dk - 2008-03-14 2013-09-20 Forsøgtes høstet som hjælpesite til e-aviser,
men det har aldrig fungeret med at høste denne teknologi.
epn.dk 1 2007-01-30
erhvervsbladet.dk 1 2005-07-01 2012-06-22 nu identisk med business.dk
euroinvestor.dk 1 2005-07-012012-10-18 2010-09-02.
facebook.com 2 2010-01-26 danske profiler/grupper der knytter sig til de selektive sites
fagbladet3f.dk 2 2014-02-11
fairforandring.dk 2 relevant, men kan ikke høstes pga. den anvendte teknologi
fairlosning.dk 2 relevant, men kan ikke høstes pga. den anvendte teknologi
fdim.dk 3 2011-01-28 Kun toplisten (kører bevidst som kat.3 /tilhængelig høstningsdefinition)
filmstriben.dk 2 2010-04-21 opfølger af bibstream.dk, relevant, men indholdet (streamet video) kan pt. ikke høstes
finansnyheder.dk 1 2006-10-12 2012-10-18
finanswatch.dk 1 2010-12-20
flygtning.dk 2 2007-08-21 2010-05-18
folketinget.dk/ft.dk 1 2005-07-01 2012-10-12 Alt indhold fanges af tværsnitshøstninger
forum.dk 3 2008-06-14 2008-10-03 Høstes med login. Fra 2008-10-03 som sondagsavisen.dk
fpn.dk 1 2008-05-20 2012-07-31 nedlagt
fyens.dk 1 2005-07-01 Fra 2007-11-08 med login. Videoer virker stort set ikke (2009-01-20)
fælleslisten.dk,
faelleslisten-vest.dk
2 2010-06-27 2010-12-28 Nyt parti, der ønsker at komme i folketinget ved næste valg.Dec. 2010: Meget lav aktivitet – fanges af tværsnit
helle-tv.dk 2 2010-04-29 2012-10-02 Relevant, men stort set ikke høstet noget (indeholder kun videoer)
hellethorning.dk 2 2012-01-11 2012-02-06 Relevant, men kan ikke høstes pga. flash og videoer
herald.dk 1 2013-10-09
hvemstemmerhvad.dk 2 2012-02-07
idag.dk 1 2006-08-29
indblik.nu 1 2009-01-13 2010-06-23 Ikke opdateret siden januar 2010
infopaq.dk 1 2005-07-01 2007-12-17
information.dk 1 2005-10-11 Fra 2007-11-08 med login, Fra 2008-11-04 intet login-indhold, Fra 2009-10-06 igen login-indhold
ing.dk 1 2006-08-29 Fra 2008-01-09 med login
injour.dk 1 2011-02-02 2012-07-17
islam.dk 2 2007-12-01 2009-02-09
j.dk 2 2008-09-14 2010-06-28 netstedet er nedlagt
jiyan.dk 1 2010-05-17 2012-10-13 Indhold fanges af tværsnit
jp.dk 1 2005-07-01 2012-06-12 videopklip fra http://jp.dk/jptv/ kan pt. ikke høstes (20081215) -
Relanceret og høstes fra 2012-06-12 som jyllands-posten.dk
jubii.dk 3 2005-07-01 2008-06-27
jubii.dk (NY) 1 2014-03-17
jv.dk 1 2005-07-01
jyllands-posten.dk 1 2012-06-12 Tidligere jp.dk. Fotosiden http://foto.jp.dk/ har endnu ikke skiftet url skal
søges undr det gl. domæne (13.6.12)
kanal4.dk 1 2007-12-11 2008-09-23
kanal5.dk 1 2007-12-11 2008-09-23 -
kbhlydavis.dk 1 2011-06-17
kd.dk 2 2005-07-012010-07-05 2011-11-15 2010-02-09: Høstning opgivet pga. tekniske problemer med url.2010-07-05:
Igen repræsenteret i Folketinget. Prøver om problemerne er væk.
kidsnews.dk 1 2014-06-28 - Unik side, det meste af indholdet kan høstes med Heritrix.
Indsamles derfor ikke pt. Evt. høstning med LAP???
kjavis.dk 1 2011-02-15 2014-04-02 Total betalingsmur. Tilbud om at åbne med IP adgang mod betaling
(OK iflg. EFJ), men vi skønner at sitet ikke – selektivt – er særlig interessant
kino.dk 3 2009-01-27 2010-02-15 Høstning opgivet pga. videoproblemer
kl.dk 2 2007-11-27
konservative.dk 2 2005-07-01 2011-08-31: Faneblade mm mgl. ENTEN pga. # i URL’en ELLER pga. javascript/kah
kopenhagen.dk 3 2007-11-21 2010-02-05
kristeligt-dagblad.dk 1 2005-07-01
kunsport.dk 1 2008-10-27 2009-02-05 Domæne ophørt
kærekbh.dk 3 2011-01-28 2011-09-28
larsloekke.dk 3 2009-04-28 2011-10-18 Videoer kan pt. ikke høstes (2009-04-28)
lbl.dk 2 2007-12-18 2010-11-16 Herefter som lgbt.dk
lgbt.dk 2 2010-11-23 2012-08-14 Tidligere lbl.dk
liberalalliance.dk 2 2008-09-16 Tidligere nyalliance.dk
licitationen.dk 1 2007-11-20 Fra 2007-12-05 med login
ligetil.nu 1 2009-01-22 2010-12-12 Fortsætter som http://www.dr.dk/nyheder/ligetil
lo.dk 2 2007-08-21
lokalia.dk 2 2010-05-17 2011-05-28 Kan ikke høstes korrekt pga. problemer med kort-meshups.
Oprindelig koncept med brugerleveret indhold opgivet, sitet er solgt
lokalavisen.dk 1 2010-05-17
lorry.dk 1 2013-06-25 tidligere tv2lorry.dk
maxe.dk 3 2012-10-02 2013-05-21
mediawatch.dk 1 2007-12-18 Fra 2008-10-25 med login, Fra 2008-06-13 intet login-indhold
metroxpress.dk 1 2005-07-01 2013-04-03 Domænet ophørt – fortsættes som mx.dk
minby.dk 1 2014-04-01
mindet.dk 2 2011-03-02 + engangshøstning 2010-12-03/forskerønske
minoritetspartiet.dk 2 2005-07-01 2007-12-09
mitkbh.dk 3 2010-06-27 2012-11-27
mja.dk 1 2013-10-15
mm.dk 1 2011-12-20 2014-03-18 Udbygget arkiv. Alt burde fanges af tv-høstning. Store problemer med login og visning
mobsites 1 2010-04-08 Nyhedsmediernes mobsites høstes samlet pga. teknisk lighed.
Fra 2013 dokumenteres høstningerne under de respektive domæner
(indtil 2012 samlet i workflow’et). Fra 2013 dokumenteres mobilhøstning
under hver enkelt domæne
modkraft.dk 1 2007-11-27 Ændret høstningsdefinition fra kategori 3 til 1 (2012-11-29)
musiknyt.dk 3 2009-01-30 2013-01-07
mx.dk. 1 2013-04-03 Fortsættelse af metroxpress.dk
mymusic.dk 3 2007-11-27 2009-06-27 Fra 2007-12-05 med login. 2009-06-27 redirect til bandbase.dk uden login.
nationaldemokraten.dk 1 2013-08-01
news.dk 1 2008-03-14
newsbreak.dk 1 2012-07-17
newspaq.dk 1 2007-04-18 2008-11-12
nordjyske.dk 1 2005-07-01
nordschleswiger.dk 1 2013-11-29
nordvestnyt.dk 1 2012-01-26
nutv.dk 3 Relevant, men kan ikke høstes pga. video (2008-11-03)
nyalliance.dk 2 2007-09-25 2008-09-09 Herefter som liberalalliance.dk
nyhedsavisen.nu 1 2006-08-17 2007-11-26 Herefter som avisen.dk
omtalebarometer.dk 2 2011-10-28
oopside.com 1 2012-11-30 2013-10-08 Relevant feed-indhold kan ikke høstes
oplysningskontoret.dk 3 2008-10-28 2010-10-28 2009-03-25 relevant video-materiale høstes ikke
overskrift.dk 1 2007-05-15
pallesgavebod.dk 1 2010-09-14
parentesslut.dk 1 2010-03-08 2011-11-02 Websitet opdateres ikke længere
partietfokus.dk 2 2010-03-30 2011-11-04
partofthegame.tv 3 2013-01-04 2013-01-05 2008: kan ikke høstes pg. af den anvendte teknologi,2012:
skiftet til YouTube-platform, specialhøstning af videoerne
peterdyreborg.wordpress.com 3 2007-11-21 2008-10-27
piopio.dk 1 2012-12-04
planet.sfit.dk 2 2008-01-29 2012-12-04 Tømt for det meste indhold. Alt fanges af tværsnit
polennu.dk 1 2012-01-30
politiken.dk 1 2005-07-01 Fra 2008-01-09 med login
politiken.tv 1 2008-09-11 relevant video-materiale, men kan ikke høstes
politisk.tv 1 2008-12-23 2010-03-11 Ikke opdateret siden juni 2009, kummulativ
radikale.dk 2 2005-07-01
radio24syv.dk 1 2011-11-25
radio100fm.dk 2005-07-01 2008-06-26
radioassistant.com/dk 1 2013-08-13
radionyhederne.dk 1 2008-01-24 2009-05-22 Sitet er lukket pr. 1.3.2009
rbb-online.dk 1 2009-05-07 2012-01-27 erstatter rb-borsen.dk. Indgået i Ritzau Finans
rb-borsen.dk 1 2005-10-11 2009-05-07 erstattet af rbb-online.dk. Leverer under navnet Ritzau Finans indhold
til kunder via andet end adgangsbegrænset webside (webservice mv.) siden marts 2011
realistpartiet.eu 2 2011-05-17 2011-09-14
redcross.dk /
rodekors.dk
2 2007-12-18 2013-10-15 Alt fanges af tværsnit-høstninger
redox.dk 1 2011-08-12 2011-08-14 Høstet selektivt for at sikre dokument om det højrepolitiske netværk “ORG” (
religion.dk 2 2009-07-03
ritzau.dk 1 2013-07-18 afløser ritzau.net
ritzau.net 1 2008-09-30 2013-07-18 Høstes med login, 2009-08-31: login-problem, afløses af ritzau.dk (Mit Ritzau)
ritzauinfo.dk 1 2008-09-30
sbsnet.dk 1 2007-12-11 2008-11-12
scm.dk 2 2008-01-21
sermitsiaq.ag 1 2012-07-09
seismograf.org 3 2007-12-14 2008-12-15 Netstedet nedlagt
seoghoer.dk 1 2008-09-15
sf.dk 2 2005-07-01
sn.dk 1 2010-07-26 Fortsættelse af dagbladetonline.dk
socialdemokraterne.dk 2 2005-07-01
socialdemokraterne-tv.dk 2 2009-03-20: Relevant, men kan ikke høste den anvendte teknologi (video)
socialdemokratiet.dk 2 2005-07-01 2007-12-11 Herefter som socialdemokraterne.dk
sondagsavisen.dk 1 2005-10-11 Fra 2008-01-07 inkl. den daglige avis i pdf
soundvenue.com 1 2014-06-04
spilogmedier.dk 3 2010-09-02 2011-11-18
spn.dk 1 2009-04-07 2012-07-31 nedlagt
sporten.dk 1 2008-11-13
statstidende.dk 1 2005-11-02
stiften.dk 1 2006-08-21 2013-07-22 Alvorlige høstningsproblemer fra primo nov. 2012 pga. betalingsmur.
Kun forsidehøstning med meget begrænset indhold. Høstning giver ingen mening.
sweetdeal.dk 3 2011-02-17 2011-09-28 Alvorlige høstnings- og visningsproblemer.
sysbjerre.dk 3 2012-07-31 2014-04-14 forskerønske. Stoppet efter aftale med Henrik Sivertsen (meget lav aktivitet)
tagdel.dk 3 2013-03-11
thirdear.dk 1 2011-08-12 2012-02-23 Ophørt
tidende.dk 1 2013-01-24 Tidligere bornholmstidende.dk
torshammer.dk 1 2005-07-01 2007-11-30
trier.gyldendal.dk 3 2010-01-13 2011-02-07 testhøstninger + engangshøstning (video ok!)
tvkilde.com 3 Relevant, men kan ikke høstes pga. problemer med videoindhold (2008-11-03)
tv2.dk 1 2005-07-01
tv2lorry.dk 1 2012-02-03 2013-06-25 indsamles for at skabe parallelitet med radio/tv-samlingen,
fortsætter som lorry.dk
tv2oj.dk 1 2012-02-03 indsamles for at skabe parallelitet med radio/tv-samlingen
tvsyd.dk 1 2012-02-03 indsamles for at skabe parallelitet med radio/tv-samlingen
tv3.dk 1 2005-07-01 2010-07-05
twitter.com 2 2010-01-26 danske profiler/grupper der knytter sig til de selektive sites
udfordringen.dk 2 2013-01-08 2014-03-18 Godt arkiv, fanges af tværsnit
ulk.dk 3 2009-02-14 2009-05-27 Videoer kan pt. ikke høstes (2009-04-08)
ungnyt.dk 1 2010-01-28 2012-12-04 Lav aktivitet. Indhold fanges af tværsnit.
urban.dk 1 2007-04-18 2010-10-25 er fusioneret med urbanblog.dk
urbanblog.dk 1 2009-12-03 2010-10-28 høstes for at få e-avisen fra urban (2009-12-02
urbankbh.dk 2 2012-12-12 2013-08-23 Nedlagt – redirect til aok.dk
vafo.dk 1 2013-05-24
venstre.dk 2 2005-07-01
viborg-folkeblad.dk 1 2010-12-20 2012-11-14 Ramt af total betalingsmur, kan ikke få IP-validering
vix.dk 3 2010-03-25 2012-04-16
webmuseum.dk 3 2010-03-27 2014-03-27 Stoppet pga. meget lav aktivitet. Fanges af tværsnit
webmuseum.re-cph.com 3 2009-03-14 2010-02-27 Fortsættes som webmuseum.dk
weekendavisen.dk 1 2005-07-01 Fra 2008-01-09 med login
woman.dk 1 2010-04-07 2011-02-15
xstream.dk - 2009-02-13 2013-09-20 Streamingserver for diverse selektive sites, kan ikke høstes
youtube.com 3 Relevant, men kan ikke høstes pga. problemer med videoindhold (2008-11-03),
Specialhøstninger af udvalgte videoer fra 2012-07-10 og frem
Zmags.com - 2008-03-31 2009-09-10
180grader.dk 1 2007-05-25 2010-10-28 fanges af tværsnit
24.dk 1 2006-08-17 2012-12-13
24timer.dk 1 2006-08-17 2009-09-19 alias af 24.dk, se denne
24timerxtra.dk 1 2007-10-30 2009-03-19 Nedtaget, da der omdirigeres til fyens.dk
3f.dk 2 2007-08-21 2014-02-04 Erstattet af selektiv høsning af fagbladet3f.dk

Tabellen er opdateret den 08.08.2014