据5月19日的最新报道,尽管互联网被誉为当代生活中的巨大宝藏,全球用户对其依赖日益加剧,包括利用其搜寻图书、图片、新闻等各种信息,然而,事实上,许多网络内容正在逐渐淡出我们的视线。皮尤研究中心的报告揭示了目前网络内容易逝的现状。
此份报告基于Common Crawl(一种会定期从互联网上抽样收集网站快照的服务)的档案,随机选取了约100万个网页,涵盖了2013年至2023年的网页样本,并对这些样本在当下的存续状况进行了检查。
数据表明,在2013年存在的网页中,约有38%现已无法使用,而在2023年存在的网页中,这一比例降至8%。在2013年至2023年间收集的所有网页中,有25%-2023年10月已无法访问,其中16%的页面仍保留域名,而9%的页面甚至连域名都不复存在。
在新闻网站的调查中,研究人员发现,23%的网页至少含有一个失效链接,无论是高流量还是低流量新闻网站,坏链比例基本相当。在网站流量排名前20%的新闻网站中,约25%的网页至少含有一个失效链接;而在网站流量排名后20%的网站中,这一数字上升到了26%。
在百科类网站的调查中,研究人员关注了维基百科的“参考链接”部分。在总计超过100万个参考链接中,有11%已无法访问;而在54%的维基百科网页参考链接中,至少含有一个失效链接。
在社交网站的调查中,研究人员选取了社交媒体平台X(推特)在2023年3月8日至4月27日期间发布的近500万条推文样本,试图每日观察这些推文在网站上的存续状况。结果显示,接近18%的推文在三个月内几乎无法看到,其中60%的推文因账号设置为私密、被冻结或注销,另有40%的推文是由发布者自行删除,但账号本身仍保持活跃状态。
-
互联网
+关注
关注
54文章
11163浏览量
103430 -
网页
+关注
关注
0文章
73浏览量
19333
发布评论请先 登录
相关推荐
评论