Četrnaesto harvestiranje nacionalne domene

18. 12. 2024.

Srce u suradnji s Nacionalnom i sveučilišnom knjižnicom u Zagrebu provodi četrnaesto harvestiranje sadržaja svih web sjedišta na vršnoj .hr domeni.

Srce u suradnji s Nacionalnom i sveučilišnom knjižnicom u Zagrebu u sklopu zbirke Hrvatski arhiv weba od 2004. selektivno prikuplja obvezni primjerak online publikacija prema Zakonu o knjižnicama i knjižničnoj djelatnosti (čl. 37-41). Kako bi se upotpunio opseg arhiviranih online publikacija, četrnaesti put će biti provedeno pobiranje (harvestiranje) sadržaja objavljenog na nacionalnoj domeni .hr u skladu s Pravilnikom o obveznom primjerku (NN 66/2020).

Harvestiranje cijele domene podrazumijeva prikupljanje svih javno dostupnih sadržaja u zadanome vremenu na aktivnim domenama .hr, .com.hr i .from.hr. Za harvestiranje će se koristiti popis od 134.506 aktivnih domena koji je Nacionalnoj i sveučilišnoj knjižnici dostavila CARNET-ova DNS služba. Očekuje se da će ove godine robot koji provodi harvestiranje prikupiti više od 24.3 TB koliko je preuzeto s weba tijekom harvestiranja 2023. godine. Svi prikupljeni sadržaji bit će javno dostupni u sklopu stranica Hrvatskoga arhiva weba, a putem kojih su dostupna i sva prethodna harvestiranja.

Robot koji provodi harvestiranje dolazi sa servera u Srcu s IP adrese 61.53.3.11 i predstavlja se kao Mozilla/5.0 (compatible; heritrix/3.6.x; + https://haw.nsk.hr/cesta-pitanja/) i pridržava se pravila koje vlasnici webova definiraju pomoću robots.txt datoteka.

Ako primijetite da harvestiranje utječe na vaše internetske stranice, molimo da se javite na @email i @email.