关于 Web 3.0 ——炒作、思考与批判
关于 Web 3.0——炒作、思考与批判
Web 3.0 在近年来正逐渐变得越来越火。必须承认,Web 3.0 获得如此之高的热度绝大部分要归功于区块链炒作,尤其是 NFT 与元宇宙。
我最近看到有一些资料颠倒了这层先后关系,严肃地斥责“Web 3.0 的概念被元宇宙炒作污染了”,并认为“真正的 Web 3.0 与这些炒作几乎毫无关系”。这话既正确又错误。因为目前常提及的 Web 3.0 概念本身就是由以太坊联合创始人之一 Gavin Wood 提出的:“Web 3(或称 Web 3.0)是一种新的万维网迭代理念,它融合了去中心化、区块链技术及代币经济学等概念。”请注意,这里的 Web 3.0 原本是“Web 3”,只是后来被人误称为“Web 3.0”,而许多人并未搞清楚两者的区别,于是“Web 3.0”逐渐成为了“Web 3”的一个别称。
那么 Web 3.0 的原义又是什么?要谈起 Web 3.0,最早要追溯到“Web 2.0”。Web 2.0 这个词汇最早于 1999 年由 Darcy DiNucci 创造,后来于 2004 年在 O’Reilly 公司举行的 Web 2.0 会议上被推广。Web 2.0 即“内容互联网”,指在互联网泡沫破裂后反而涌现了一大批更注重交互式的网站,它们更注重交互性而非由网站管理者主导一切,一个很典型的例子就是大英百科全书(Web 1.0)与维基百科(Web 2.0)的对比。
既然有了 Web 2.0,很快人们就会开始想象什么是 Web 3.0。“Web 3.0”这个词语的最初出现已经不可考,或者说既然有了 Web 2.0,那自然而然地提出 Web 3.0 的概念简直毫无难度。大约在 2006 年初,于中外各学术网站上就开始陆续出现 Web 3.0 的说法,那么几乎可以肯定 Web 3.0 这个词语被提及至少在 2005 年就已经开始,甚至是在 Web 2.0 这个概念刚开始流行的 2004 年。
Web 3.0 这个词语真正流行起来和“语义网”有很大关联。2006 年,语义网概念的提出者 Berners Lee 谈到 Web 3.0 时,提到“人们反复询问 Web 3.0 是什么样子,我认为也许当你能够在 Web 2.0 上见到可缩放矢量图形(SVG)的大规模使用——互联网上的一切都像水中的涟漪一样相互关联与叠加、看不到确切的边界——与一张巨大的、涵盖大量数据的语义网时,你就能访问互联网上这些难以置信的海量数据资源了……”这可能是 Berners Lee 自 2001 年提出“语义网”该年以来第一次将其与“Web 3.0”关联起来。自此之后,“Web 3.0”某种意义上成为了“语义网”的一种别称——正如现在“Web 3.0”多数时候作为“去中心化互联网”的代称一样。
然而我们这些年似乎很少看到“语义网”这一概念了,甚至许多人从未听说过这个词汇。“语义网”其实是个非常简单的想法,即令网站不仅是“人类可读”的,而且也是“机器可读”的。换句话说,网站通常只是将信息以文字或图片形式发布给人类阅读,那为什么不为网站提供一些额外的信息,使得机器也能理解网站上包括了什么内容呢?例如,一个介绍某地区,如中国某个省份的网站可以附加一些额外信息,指出这是一个“地方网站”,而这些附加信息也指出其位于“中国”这个国家,而“中国”又位于“亚洲”这个大洲。如此一来,该网站就可以和介绍中国的网站、介绍亚洲的网站产生关联(如果这些网站也添加了类似的描述信息的话)。从而,机器就可以将这些网站组成一张“网”。
上面所举的简单例子可能不足以让你认识到“语义网”的野心。考虑这样一个场景,当你需要搜索某个作者的图书时,例如“鲁迅文集”,你或许常常会找到一些不那么令你满意的搜索结果,比如“鲁迅简介”,“鲁迅文集的历史地位”等网页。显然,你的意图应该是找到鲁迅具体写了哪些书,以及这些书的内容,但遗憾的是搜索引擎无法完美理解你的意思。然而,语义网可以给这些网站标注相关信息,这样搜索引擎就可以分辨哪些网页是“图书内容”,哪些又仅仅是无关的诸如“作者简介”的内容。甚至若这些附加信息更加详细,语义网还可以分辨出哪些是书籍前言、哪些是导引,而哪些又是正文。
听起来有点像“自然语言理解(NLU)”?的确,语义网的实现显然需要 NLU 方面的技术。在理想情况下,你可以直接告诉语义网,“我想要一张明天早上九点从北京飞往上海的机票”,然后语义网可以自动找到相关的机票网站,帮你筛选符合要求的航班,并且自动订票。
好吧,这个例子可能听起来不那么美好——毕竟现在网上订票,也不过就是在网站上点几下鼠标的事情,而且现在其实已经有一些语音助手可以做到类似的事情了。但在语义网刚提出的那段时间,订机票可是一项复杂的事情,需要筛选时间表、联系航空公司,然后还要预约时间让相关人员送票上门。而且语义网似乎是可行的,只要为每个网站提供那么些附加信息,机器就能理解每个网站在做什么,将它们联系在一起,并且通过某种途径达成“智能”。
“语义网”正如字面意义一样,你可以直接通过自然语言达成你想达成的目的,有点类似于现在火热的“人工智能”概念。不过后来,“语义网”概念的提出者 Berners Lee 认为“语义网”这个说法有些不太准确,毕竟语义网本质上还是通过为网站附加信息而达成目标,将不同网站连成一个“网”的,将其称为“数据网”可能更加合适一些。
然而正如大家现在看到的,“语义网”至今没见到什么靠谱的实现,而且人们严重低估了其实现难度,光是要使机器理解自然语言就是一件非常困难的事情,更别提让机器理解错综复杂的网络关系了。是不是有点像现在“Web 3.0”中的“元宇宙”概念?听起来未免有些过于自大与不切实际了。
后来,“语义网”确实产生了一些结果,例如 RDF 数据模型,这是一种旨在为全网数据交换而设计的模型,可以视作上面提到的“附加信息”的具体实现。然而,RDF 最大的成果并不在于它对语义网做出了多么巨大的贡献,而是它的三元存储数据模型启发了很多其他三元存储查询语言的出现,这些模型在图数据库中大获成功。某种意义上,“语义网”产生的这些成果确实应用了到了它最初设想的领域上,这些图数据库现在广泛应用于社交网络中,例如推特就使用类似的数据结构维护用户之间的关系。遗憾的是,“语义网”并没有实现“全网互联”,顶多只能说它的某些成果为社交网络上的“用户互联”提供了帮助。
为什么要花这么大的篇幅介绍“语义网”这个“旧”Web 3.0,而不是现在以“元宇宙”为热点的“新”Web 3.0?可以看到,实际上现在的“元宇宙”和当初的“语义网”在某种意义上非常相似,提出了一个现阶段难以被实现,甚至在理论上都缺乏有力支撑的概念。它的野心很大,其边界又非常模糊,好像要“革命互联网”,但又没提出具体要如何“革命”,只是拿来现在一些潮流的新技术名词往上堆砌,就称其为“元宇宙”,称其为“Web 3.0”。
其实现在的“Web 3.0”指向模糊不是最大的问题。当年 Web 2.0 被提出时,也被人批评“更近似一个炒作概念”。但 Web 2.0 被提出时,诸如博客、维基百科等被认为属于“Web 2.0”的交互式网站已经在不断涌现,并且在以惊人地速度不断增长用户了。而 Web 3.0 包括了什么?区块链、元宇宙、VR、或是 DeFi 与代币经济学,听起来都是一些不错的概念,但它们目前除了金融炒作外,实际应用少得可怜。一直被拿来宣传“元宇宙”的 Roblex,其实只是个更具社交性的小游戏平台。而 VRChat,也只是曾红极一时的 VR 技术的延续,再加上了一些社交功能而已。或许未来如 Roblex 这样的平台不再仅仅是当前简陋的小游戏平台,而 VRChat 这样的平台也可以使人们在某种意义上真正“度过一段虚拟世界的生活”。但在如此早期的阶段就大肆吹捧所谓“元宇宙”,将其称为“互联网的下一个阶段——Web 3.0”,实在是有些太早了。