服务关闭:当代人类知识保存的最大敌人?

国际新闻 阅读(1826)

最近,澳大利亚软件公司Atlassian宣布BitBucket(原始地址hg.io)将停止支持Mercurial,并将删除该平台上所有Mercurial管理软件的源代码。这迫使每个人都提出另一个问题:网站关闭是21世纪人类知识保护的最大敌人吗?

答案是肯定的。

对于Love Fan,BitBucket对Mercurial支持的支持将产生一定的影响 - 自2010年以来,Ai Fan的主要源代码已经在BitBucket上托管。虽然从技术上讲,Fan Faner可以(并且很快)可以建立自己的Mercurial服务器,但这些决策的影响远远不仅仅是一个热爱Fan的公司,或者是一些个人和团体产生影响的公司。

社区是否可以使用Mercurial DVCS项目(例如PyPy)来寻找替代方案?一些个人维护的项目和代码片段会丢失吗?即使大多数人最终找到替代品,那些无法找到替代品的人,或者被认为“不重要”的代码,也将永远丢失在互联网上。如果程序员已经去世,数据将永远消失 - 这可能是他对世界的贡献。此外,必须发生在大量文章,博客和书籍中与BitBucket的链接将完全无效。

这些问题不仅限于计算机行业。没有必要想太多,我们面前有很多例子。百度在2015年完全关闭了百度空间,导致大量中文内容 - 其中一些内容质量极高 - 在这个世界上消失了。虽然百度可能有10,000个理由认为这是一个很好的商业决策 - 我不会怀疑这一点 - 但不可否认的是,这是另一种书。

另一个例子是,百度最近在2017年之前删除了百度贴吧的所有内容。也许这是产品经理决定降低操作的劳动强度,也许这是决定治愈垃圾邮件,但这不能被黯然失色。事实上,这是一个非常愚蠢的决定。除了由百度贴吧的历史内容引起的长尾流量以及因删除历史数据而失去其他平台的愤怒用户外,曾经浮躁的中国互联网社区的质量讨论已经消失。

其他互联网用户可能还记得人人。在商业领域,它在内联网时期取得了成功,并且失败了。最近,人人已经关闭了日志记录功能 - 这个平台已经引起了无数次的战斗,并且有很多好的内容。整个日志记录功能完全脱机,只留下Tengine的默认404页面。

做出这样决定的决定也仅限于中国的互联网公司。微软也不例外。他悄悄地从MSDN中删除了旧的软件下载,并删除了FAQ“Q”文章,KB和MSDN文档,并提前关闭了FTP服务器。例如,今天,如果你想知道在Windows 95下运行DOS程序时如何与设备竞争 - 抱歉,除非你有一篇论文FAQ文件,否则你无法检查Q“Windows中的设备争用”本文档看起来得到答案(答案是system.ini的[386Enh]字段中Com [n] AutoAssign的值)。另一个例子,如果你想验证你的FAT32文件系统检查器是否与微软的实际实现兼容 - 你应该去MSDN下载Windows 95或MS-DOS 7.00的副本,然后执行CHKDSK.EXE验证,不过这是它的不可能这样做 - 因为Windows 95已在MSDN上删除。

即使是学者也无法避免人为或非人为损失造成的数据丢失。北京大学中文论坛是一个讨论中文的学术论坛。对中国文学,音韵学和中文信息处理的讨论是非常有价值的。论坛已经结束,每个人的脑力劳动都失去了。

那么,这个问题可以解决吗?答案是肯定的,但事实并非如此。

首先,一些网站即使关闭也可以从互联网Wayback Machine中检索到。但是,这仅适用于不使用复杂前端技术的站点 - 这意味着Internet时间机器的可用性将来会变得越来越糟,因为新的单页应用程序/丰富的交互式应用程序/需要登录。该应用程序不包含在Internet时间机器中。此外,对于应用程序,如果它丢失,它将永久丢失 - 它不能包含在Internet Time Machine中。

其次,从技术上讲,20世纪80年代和90年代互联网数据的保留率甚至高于当代互联网数据保留率。在互联网时代,协议的主流是USENET和Fidonet。由于其自然传输优势,档案可以阅读到今天。

然而,无论是在中国互联网还是在互联网环境中,很少有互联网公司有利于人类。相比之下,最典型的互联网公司模式是私人公司的风险投资。以利润为最终目标。在这种模式下,自由访问平台之外的信息自然与大多数企业家相悖。相反,在平台上留下独家内容以吸引用户进入平台以便更多流量可以使平台更好地发展(Ai Faner可能是一个例外,作为内容制作者,我们的内容是CC由BY-NC授权4.0协议和sitemap.xml可用于人工驱动的机器提取)。

这似乎是循环依赖的另一个问题 - 如果没有质量平台,那么高质量的内容呢?如果平台没有粘性和独特性,平台如何生存?但是,如果服务无法继续,这些高质量的内容和知识将因平台锁定而永久丢失。

从近几年的趋势看,从RSS阅读量的下降到谷歌阅读器的死亡,以及作为人们生活绝对核心的超级应用程序的现状,知识和数据越来越集中在少数公司手中。尽管我们在技术上具有分布式计算能力,例如IPFS,但事实上,由于其不方便的使用特性(更关键的是 - 人们不知道这个问题的严重性),它的受欢迎程度几乎为零。

最后,提出一个假设的问题 - 如果有一天暴风雨的Evernote关闭了,你的笔记会做什么?