- Tot mai multe site-uri media blochează accesul Internet Archive
- Wayback Machine a arhivat peste un trilion de pagini web
- Jurnaliști și ONG-uri cer protejarea accesului la istoria digitală
- Conflictul este alimentat de temeri legate de inteligență artificială
- Restricțiile pot afecta investigațiile jurnalistice și procesele legale
De aproape trei decenii, Wayback Machine funcționează ca o capsulă a timpului pentru internet. Platforma, operată de organizația non-profit Internet Archive, salvează versiuni ale paginilor web exact așa cum arătau la un moment dat.
Rezultatul: peste un trilion de pagini arhivate, accesibile publicului. Pentru jurnaliști, cercetători sau avocați, este echivalentul unei biblioteci uriașe — doar că în loc de cărți, păstrează istoria digitală.
Ironia situației este că inclusiv marile publicații folosesc acest instrument. De exemplu, un reportaj USA Today despre politicile de detenție ale ICE a folosit date colectate prin Wayback Machine — chiar dacă compania care deține publicația blochează arhivarea propriului conținut.
De ce marile publicații spun „stop” arhivării conținutului
În ultimele luni, tot mai multe organizații media au început să limiteze sau să blocheze accesul crawlerelor Internet Archive.
Potrivit unei analize citate de Wired (aprilie 2026), cel puțin 23 de site-uri majore de știri au restricționat accesul robotului ia_archiverbot.
Printre acestea se numără The New York Times și rețeaua USA Today.
Explicațiile sunt nuanțate:
- unele companii spun că blochează toate bot-urile de scraping
- altele invocă protecția conținutului și a drepturilor de autor
În cazul The New York Times, poziția este mai directă: există temeri că materialele arhivate ar putea fi folosite de companii tech pentru a antrena modele de inteligență artificială care ajung să concureze chiar cu publicațiile.
Cine pierde dacă arhivele dispar: jurnaliștii reacționează
Reacția nu a întârziat — și vine chiar din interiorul industriei media.
Organizații precum Electronic Frontier Foundation și Fight for the Future au mobilizat peste 100 de jurnaliști care au semnat o scrisoare de susținere pentru Internet Archive.
Argumentul lor este simplu și greu de ignorat: fără arhive digitale, jurnalismul își pierde memoria.
Mulți reporteri spun că folosesc Wayback Machine zilnic — pentru verificarea declarațiilor, urmărirea modificărilor din articole sau reconstruirea unor evenimente din trecut. În lipsa acestui instrument, o parte din munca de investigație devine mult mai dificilă.
Cum a ajuns inteligența artificială în centrul conflictului
La prima vedere, disputa pare una despre acces la date. În realitate, este despre inteligență artificială și cine controlează materia primă pentru ea: conținutul online.
Companiile tech au nevoie de volume uriașe de text pentru a antrena modele AI. Iar Wayback Machine, cu arhiva sa vastă, este o sursă extrem de valoroasă.
În același timp, publisherii se tem că munca lor este folosită fără acord și fără compensații. Contextul este tensionat: în SUA există deja peste 100 de procese legate de folosirea conținutului pentru training AI.
Internet Archive nu este acuzat direct că face acest lucru, dar se află la intersecția acestui conflict.
Ce se întâmplă dacă „memoria internetului” începe să dispară
Consecințele nu sunt doar teoretice.
Wayback Machine a fost folosit în trecut pentru a expune modificări în articole de presă sau declarații oficiale. De exemplu, schimbările făcute de The New York Times într-un articol despre Bernie Sanders, în 2016, au fost identificate tocmai prin această arhivă.
Fără acces la astfel de instrumente:
- transparența scade
- verificarea informațiilor devine mai dificilă
- probele digitale folosite în instanță pot dispărea
Mark Graham, directorul Wayback Machine, a declarat pentru Wired că organizația este în dialog cu publisherii, dar avertizează că „închiderea progresivă a web-ului public afectează capacitatea societății de a înțelege ce se întâmplă în lume”.
Pe scurt, nu este doar o problemă tehnică. Este o luptă pentru controlul trecutului digital — și, implicit, al modului în care înțelegem prezentul.

