Google

Internet disparaît sous nos yeux : pourquoi 38% des pages n'existent-elles plus ?

De nombreuses pages ont été supprimées ou abandonnées, à tel point qu'un quart des sites actifs entre 2013 et 2023 n'existent plus ou ne sont plus accessibles : on parle d'« érosion numérique »

Des temps difficiles pour Internet. Selon une analyse du Pew Research Center, en effet, un quart des sites actifs entre 2013 et 2023 n'existent plus ou n'est plus accessible. La suppression de ces pages est attribuée à divers facteurs, notamment la suppression délibérée du contenu, la relocalisation du site Web qui rompt les liens, et abandon de sites Web. Un véritable phénomène érosion numérique.

Des recherches ont révélé qu'environ 23 % des pages d'actualités contient au moins un lien romputandis que 21 % des pages des sites Web du gouvernement et 54 % des pages Wikipédia contiennent des références à le contenu n'existe plus. Cela indique que l’érosion du Web n’épargne même pas les plateformes de recherche d’informations les plus populaires et les plus utilisées.

Le phénomène est particulièrement évident sur les contenus plus anciens : environ 38 % des pages Web qui existaient en 2013 ne sont plus disponibles aujourd'hui. Même les pages créées plus récemment ne sont pas à l’abri ; 8% des pages existantes en 2023 ont déjà disparu. Lorsqu'une page devient inaccessible, les utilisateurs sont accueillis par le message d'erreur familier « 404 Not Found », indiquant que le contenu n'existe plus sur le serveur hôte.

Un phénomène qui touche aussi les réseaux sociaux

Le déclin numérique ne se limite pas aux sites Web, mais cela affecte également les médias sociaux. Environ un cinquième des tweets disparaît quelques mois après sa publication. Notamment, plus de 40 % des tweets en turc ou en arabe ne sont plus visibles sur le site dans les trois mois suivant leur publication. Les tweets provenant de comptes avec des paramètres de profil par défaut sont plus susceptibles de disparaître.

Pour cette analyse, le Pew Research Center a collecté un échantillon de pages du référentiel Web Common Crawl pour chaque année de 2013 à 2023. Elle a ensuite vérifié la disponibilité de ces pages et l’intégrité des liens. Il a également examiné la fréquence à laquelle les publications sur les réseaux sociaux sont supprimées ou supprimées.

Il a été conclu que l'érosion du Web représente un problème sérieux pour la préservation des connaissances en ligne. La disparition continue du contenu Web pourrait compromettre notre capacité à accéder aux informations historiques et actuelles, réduisant ainsi la richesse de nos archives numériques collectives.

Source : Centre de recherche Pew

A lire également