Selektive høstninger

Starttidspunkt for opsamling og evt. stop for opsamling ved nedlæggelse af websted.

Se også oversigten over tværsnitshøstninger, begivenhedshøstninger og oversigten over Heritrix Versioner

Netsted Type Fra dato Til dato Bemærkninger

aarhusvest.dk

2

2008-01-18

 

 

altfordamerne.dk

1

2010-03-25

 

 

altinget.dk

1

2005-07-01

 

Fra 2005-10-27 med ip-validering

amine.dk

3

2008-04-03

 

 

andersfogh.dk

3

2007-11-30

2009-06-29

 

aoa.dk

1

2010-02-15

 

 

arbejderen.dk

1

2006-08-29

 

 

arla.dk

2

2008-01-08

2010-11-02

 

artnode.org

3

2007-08-14

2008-04-03

 

arto.com

3

2008-12-16

 

Fra 2008-12-16 med login

arto.dk

3

2007-12-14

2009-01-05

Fra 2007-12-17 med login. Fra 2009-01-05 som arto.com

autograf.org

3

2007-08-14

2008-11-14

 

avisen.dk

1

2006-10-11

 

 

berlingske.dk

1

2005-07-01

 

Videoer (2008-10-27) og billedserier - flashvisning, [2010-03-25) kan pt. ikke høstes

bibstream.dk

3

 

 

Relevant, men kunne ikke høstes pga. video (2008-11-03)

blogtoppen.dk

2010-03-09

 

 

blueberries.dk

3

2010-09-10

 

"hjælpeside for fælleslisten.dk

borgerligtcentrum.dk

2

2009-01-07

2010-02-15

Videoer kan pt. ikke høstes (2009-02-16)

bornholmstidende.dk

1

2006-12-18

 

 

borsen.dk

1

2006-08-22

 

Videoer kan pt. ikke høstes (2008-11-27)

bt.dk

1

2005-07-01

 

Videoer kan pt. ikke høstes (2008-11-28)

business.dk

1

2007-01-16

 

Fra 2008-01-08 med login

carblock.dk

3

2007-09-14

2008-04-03

 

chilinet.dk

3

2005-07-01

 

 

cnn.dk

1

2005-07-01

2007-11-30

 

comon.dk

1

2007-11-20

 

 

da.dk

2

2007-08-14

2009-10-15

Kun forsiden kan høstes, da høsteren ikke kan tage url'erne til undersiderne (indeholder "?")

dagbladetonline.dk

1

2006-12-18

2010-07-23

fortsætter som sn.dk

danskespil.dk

2

2008-01-08

2008-05-30

Kan ikke høstes pga. flash

danskfolkeparti.dk

2

2005-07-01

 

 

dansk-politik.dk

1

2009-05-22

 

I perioden: 2009-05-22 til 2010-03-08 kun delvist høstet og med fejl

dansk-politik.tv

2

2007-12-18

2008-02-14

Netstedet nedlagt

dato.dk

1

2006-08-17

2007-11-26

Herefter redirect til urban.dk

Den2radio.dk

2

 

 

Siden er relevant, men det relevante - lydstreaming - kan ikke høstes

di.dk

2

2008-04-03

 

 

dinby.dk

2

2008-09-30

 

Kan ikke høste de eksterne nyheder, begivenheder og mashups (indlejrede interaktive kort mv.)

ditcentrum.nordjyske.dk

1

2006-08-17

2009-10-22

Er blevet til kummulativ brugersite, der kan fanges af tværsnit

dkbn.dk

3

2008-12-14

2009-09-27

Nedtaget pga. høstningsproblem med dynamiske url'er.

dk4.dk

1

2005-07-01

2009-01-29

 

dr.dk

1

2005-07-01

 

 

drv.dk

2

2005-07-01

2007-12-09

 

dvoted.net

3

2007-12-11

 

 

eb.dk

1

2005-07-01

2007-01-30

Herefter som ekstrabladet.dk

ekstrabladet.dk

1

2005-07-01

 

 

ekstrabladet.tv

1

 

 

Relevant, men kan ikke høstes pga. problemer med videoindhold (2008-11-03)

enhedslisten.dk

2

2005-07-01

 

 

e-pages.dk

-

2008-03-14

 

Høstes som hjælpesite til e-aviser, men fungerer i de fleste tilfælde ikke

epn.dk

1

2007-01-30

 

Problemer med høstning pga. den anvendte teknologi

erhvervsbladet.dk

1

2005-07-01

 

 

euroinvestor.dk

1

2005-07-01

2010-09-02

 

facebook.com

2

2010-01-26

 

danske profiler/grupper der knytter sig til de selektive sites

fairforandring.dk

2

 

 

relevant, men kan ikke høstes pga. den anvendte teknologi

fairlosning.dk

2

 

 

relevant, men kan ikke høstes pga. den anvendte teknologi

fdim.dk

2

2011-11-15

 

Kun toplisten

filmstriben.dk

2

 

 

opfølger af bibstream.dk, relevant, men indholdet (streamet video) kan pt. ikke høstes

finansnyheder.dk

1

2006-10-12

 

 

flygtning.dk

2

2007-08-21

2010-05-18

 

folketinget.dk

1

2005-07-01

 

 

forum.dk

3

2008-06-14

2008-10-03

Høstes med login. Fra 2008-10-03 som sondagsavisen.dk

fpn.dk

1

2008-05-20

 

 

fyens.dk

1

2005-07-01

 

Fra 2007-11-08 med login. Videoer virker stort set ikke (2009-01-20)

fælleslisten.dk, faelleslisten-vest.dk

2

2010-06-27

 

Nyt parti, der ønsker at komme i folketinget ved næste valg

helle-tv.dk

2

 

 

Relevant, men kan ikke høstes pga. vidoer (2009-03-20)

idag.dk

1

2006-08-29

 

 

indblik.nu

1

2009-01-13

2010-06-23

Ikke opdateret siden januar 2010

infopaq.dk

1

2005-07-01

2007-12-17

 

information.dk

1

2005-10-11

 

Fra 2007-11-08 med login, Fra 2008-11-04 intet login-indhold, Fra 2009-10-06 igen login-indhold

ing.dk

1

2006-08-29

 

Fra 2008-01-09 med login

islam.dk

2

2007-12-01

2009-02-09

 

j.dk

2

2008-09-14

2010-06-28

netstedet er nedlagt

jiyan.dk

1

2010-05-17

 

 

jp.dk

1

2005-07-01

 

videopklip fra http://jp.dk/jptv/ kan pt. ikke høstes (20081215)

jubii.dk

3

2005-07-01

2008-06-27

 

jv.dk

1

2005-07-01

 

 

kanal4.dk

1

2007-12-11

2008-09-23

 

kanal5.dk

1

2007-12-11

2008-09-23

 

kd.dk

2

2005-07-01

2010-07-05

 

2010-02-09: Høstning opgivet pga. tekniske problemer med url.

2010-07-05: Igen repræsenteret i Folketinget. Prøver om problemerne er væk.

kino.dk

3

2009-01-27

2010-02-15

Høstning opgivet pga. videoproblemer

kl.dk

2

2007-11-27

 

 

konservative.dk

2

2005-07-01

 

 

kopenhagen.dk

3

2007-11-21

2010-02-05

 

kristeligt-dagblad.dk

1

2005-07-01

 

 

kunsport.dk

1

2008-10-27

2009-02-05

Domæne ophørt

larsloekke.dk

2

2009-04-28

 

Videoer kan pt. ikke høstes (2009-04-28)

lbl.dk

2

2007-12-18

 

 

liberalalliance.dk

2

2008-09-16

 

Tidligere nyalliance.dk

licitationen.dk

1

2007-11-20

 

Fra 2007-12-05 med login

ligetil.nu

1

2009-01-22

 

 

lo.dk

2

2007-08-21

 

 

lokalia.dk

2

2010-05-17

 

Kan ikke høstes korrekt pga. problemer med mashups (indlejrede interaktive kort mv.)

lokalavisen.dk

1

2010-05-17

 

 

minoritetspartiet.dk

2

2005-07-01

2007-12-09

 

mediawatch.dk

1

2007-12-18

 

Fra 2008-10-25 med login, Fra 2008-06-13 intet login-indhold

metroxpress.dk

1

2005-07-01

 

 

mitkbh.dk

3

2010-06-27

 

 

mobsites

1

2010-04-08

 

Nyhedsmediernes mobsites høstes samlet pga. teknisk lighed

modkraft.dk

3

2007-11-27

 

 

musiknyt.dk

3

2009-01-30

 

 

mymusic.dk

3

2007-11-27

2009-06-27

Fra 2007-12-05 med login. 2009-06-27 redirect til bandbase.dk uden login.

news.dk

1

2008-03-14

 

 

newspaq.dk

1

2007-04-18

2008-11-12

 

nordjyske.dk

1

2005-07-01

 

 

nutv.dk

3

 

 

Relevant, men kan ikke høstes pga. video (2008-11-03)

nyalliance.dk

2

2007-09-25

2008-09-09

Herefter som liberalalliance.dk

nyhedsavisen.nu

1

2006-08-17

2007-11-26

Herefter som avisen.dk

oplysningskontoret.dk

3

2008-10-28

 

2009-03-25 relevant vidoe-materiale høstes ikke

overskrift.dk

1

2007-05-15

 

 

pallesgavebod.dk

1

2010-09-14

 

 

parentesslut.dk

1

2010-03-08

 

 

partietfokus.dk

2

2010-03-30

 

 

partofthegame.tv

3

 

 

2008-11-27: Relevant, men kan ikke høste den anvendte teknologi (video)

peterdyreborg.wordpress.com

3

2007-11-21

2008-10-27

 

planet.sfit.dk

2

2008-01-29

 

 

politiken.dk

1

2005-07-01

 

Fra 2008-01-09 med login

politiken.tv

1

 

 

2008-09-11 relevant video-materiale, men kan ikke høstes

politisk.tv

1

2008-12-23

2010-03-11

Ikke opdateret siden juni 2009, kummulativ

radikale.dk

2

2005-07-01

 

 

radio100fm.dk

 

2005-07-01

2008-06-26

 

radionyhederne.dk

1

2008-01-24

2009-05-22

Sitet er lukket pr. 1.3.2009

rbb-online.dk

1

2009-05-07

 

erstatter rb-borsen.dk

rb-borsen.dk

1

2005-10-11

2009-05-07

erstattet af rbb-online.dk

redcross.dk

2

2007-12-18

 

 

religion.dk

2

2009-07-03

 

 

ritzau.net

1

2008-09-30

 

Høstes med login, 2009-08-31: login-problem

ritzauinfo.dk

1

2008-09-30

 

 

sbsnet.dk

1

2007-12-11

2008-11-12

 

scm.dk

2

2008-01-21

 

 

seismograf.org

3

2007-12-14

2008-12-15

Netstedet nedlagt

seoghoer.dk

1

2008-09-15

 

 

sf.dk

2

2005-07-01

 

 

sn.dk

1

2010-07-26

 

Fortsættelse af dagbladetonline.dk

socialdemokraterne.dk

2

2005-07-01

 

 

socialdemokraterne-tv.dk

2

 

 

2009-03-20: Relevant, men kan ikke høste den anvendte teknologi (video)

socialdemokratiet.dk

2

2005-07-01

2007-12-11

Herefter som socialdemokraterne.dk

sondagsavisen.dk

1

2005-10-11

 

Fra 2008-01-07 inkl. den daglige avis i pdf

spilogmedier

3

2010-09-02

 

 

socialdemokraterne.dk

2

2005-07-01

 

 

socialdemokraterne.dk

2

2005-07-01

 

 

spn.dk

1

2009-04-07

 

Flash kan pt ikke høstes 2009-04-27

sporten.dk

1

2008-11-13

 

 

statstidende.dk

1

2005-11-02

 

 

stiften.dk

1

2006-08-21

 

 

torshammer.dk

1

2005-07-01

2007-11-30

 

tvkilde.com

3

 

 

Relevant, men kan ikke høstes pga. problemer med videoindhold (2008-11-03)

tv2.dk

1

2005-07-01

 

 

tv3.dk

1

2005-07-01

2010-07-05

 

twitter.com

2

2010-01-26

 

danske profiler/grupper der knytter sig til de selektive sites

ulk.dk

3

2009-02-14

2009-05-27

Videoer kan pt. ikke høstes (2009-04-08)

ungnyt.dk

1

2010-01-28

 

 

urban.dk

1

2007-04-18

2010-10-25

er fusioneret med urbanblog.dk

urbanblog.dk

1

2009-12-03

2010-10-28

høstes for at få e-avisen fra urban (2009-12-02

venstre.dk

2

2005-07-01

 

 

viborgfolkeblad.dk

1

2010-11-11

 

 

vix.dk

3

2010-03-25

 

 

webmuseum.dk

3

2010-03-27

 

Fortsættelse af webmuseum.re-cph.com

webmuseum.re-cph.com

3

2009-03-14

2010-02-27

Fortsættes som webmuseum.dk

weekendavisen.dk

1

2005-07-01

 

Fra 2008-01-09 med login

woman.dk

1

2010-04-07

 

 

xstream.dk

-

2009-02-13

 

Høstes for at få nogle sider med videoer fra berlingske.dk m.fl.

youtube.com

3

 

 

Relevant, men kan ikke høstes pga. problemer med videoindhold (2008-11-03)

Zmags.com

-

2008-03-31

2009-09-10

 

180grader.dk

1

2007-05-25

2010-10-28

 

24.dk

1

2006-08-17

 

 

24timer.dk

1

2006-08-17

2009-09-19

alias af 24.dk, se denne

24timerxtra.dk

1

2007-10-30

2009-03-19

Nedtaget, da der omdirigeres til fyens.dk

3f.dk

2

2007-08-21

 

  • senest opdateret 11. november 2010

Note : Type
Betegnelsen "type 1, 2 eller 3 " relaterer sig til indsamlingsstrategien.
De selektive sites indsamles inden for 3 kategorier:
Kategori 1: (type 1)
Netsteder, der fungerer som nyhedsmedie for den danske offentlighed. Hertil hører især de landsdækkende avisers og tv-stationers netsteder, de større regionale avisers netsteder, Folketingets netsted samt et mindre udvalg af nyhedsmedier.
Kategori 2: (type 2)
Netsteder, der dækker et repræsentativt udsnit af typiske netsteder, dvs. meget besøgte netsteder (fx portaler af typen netdoktor), og/eller netsteder der repræsenterer typiske anvendelser, (fx virksomheders netsteder, byportaler og kommunale portaler, netsteder, der anvendes som lokalt medie).
Redaktionen har defineret tre typer af sektorer inden for denne kategori, som skal være repræsenteret:
a) civilsamfundet,
b) myndighederne,
c) den kommercielle sektor
Kategori 3: (type 3)
Netsteder, der er særligt karakteristiske, eksperimentelle eller unikke (fx åbne debatmiljøer, netfællesskaber, personlige sider, netkunststeder) i forhold til indhold og udtryksformer