嘉宾 | 韦青
作者 | 云昭
最近几年,技术圈内的新概念层出不穷,从早先的互联网到物联网,后来又有人工智能、机器学习、区块链,最新的话题就是元宇宙。在日前主办的MetaCon元宇宙技术大会上,微软(中国)首席技术官韦青带来了题为《共享新机遇,微软打造元宇宙“内驱力”》的精彩演讲,以一种独特的“技术官”的视角,去探讨和辨析元宇宙的本质与核心。
本文摘选其中精彩内容如下,希望可以给大家带来思维的启迪。
《雪崩》作者如何看待元宇宙?
元宇宙这个词来源于一本小说《雪崩》。今年,恰好是这本书发行的 30 周年。作者尼尔·斯蒂芬森,住在西雅图,跟微软的很多人都是老朋友。恰在去年年底,微软公司的CTO凯文·斯科特对尼尔做过一次采访,两人相谈甚欢,凯文·斯科特在采访中一直强调说他受尼尔的人文技术观念影响很大。其实微软CEO萨提亚·纳德拉在他的《刷新》一书中就谈及《雪崩》一书在三十年前产生的巨大影响,值得思考的是在《刷新》这本书中,Metaverse被翻译为虚拟空间,而不是现在火爆的元宇宙。
在被问及“对元宇宙怎么看”时,尼尔的回答很有意思。作为早在三十年前就发明了“元宇宙”与“虚拟人”(Avatar,也是电影“阿凡达”名称的由来)的科幻小说作者,他坦言道:“元宇宙这个30年前的旧词突然变得那么火,应该是好多人要把自己的产品装在这个概念里卖出去”。
图源:Microsoft
此外,尼尔还回答了关于AI的话题,认为“AI一旦成熟就被称为软件”。的确如此,大家现在关注的更多是机器学习里面的训练那一部分,很多技术进步的宣传都是讲训练之后的机器学习模型已经到达了什么样的高度,但无论模型多么先进,最终是要能够应用到实际的日常工作与生活中去。而在使用这些算法模型的时候,它的表现方式就类似于函数的功能,你把变量放进去,这个函数给你返回一个结果。
所以,作为技术行业的人,无论是业务的决策者还是技术的实现者,就要考虑如何从表面喧嚣的现象里发掘本质,从“第一性原理”入手。一个技术被“称作什么”不是最重要的,它到底“是什么”和“不是什么”才是根本。在对它“是什么”与“不是什么”形成共识之后,人们再对名词的选择达成一种共识,然后大家能够齐心协力为这种技术开拓出对人类有益的应用空间,才是在这个信息爆炸的时代该具备的重要特征和能力。技术是拿来用的,真正优秀的技术,不仅要看它的先进性,更重要的是它对人类社会的进步和人类福祉是否有很大的贡献,也就是它是否是“以人为本”,还是“以名称为本”,以及是唯“先进性”,还是兼顾“先进性”与“实用性”。
如何应对“无人区”的时代
这几年社会、政治、经济、技术各方面的变化,应该让我们体会到,人类正在进入一个前所未有的巨变时代,开始进入了一个无人区的时代。这种时代的显著特征就是我们需要不断地审视时代的变化,同时以理性的思维重新确认我们过去所有认知与知识的完备性,将其中符合时代发展的认知与知识保留,将不符合的认知与知识更新。而要做到这一点,需要我们具备非常清晰和理性的思考与判断能力。但是这种能力并不是每个人天生就能具备的,这是需要经过有意识地训练才能够得到的一种应对时代挑战的核心生存与发展能力。
这个时代一方面充满挑战,另一方面也非常令人兴奋,它意味着我们可能有机会进入一个全新的发展时代。但在这个时候,我们每个人首先要抱有一种谦虚的心态,“知之为知之,不知为不知”,不要忙于定义一个自己无法理解的新生事物,这首先要求不要试图去理解一个自己没有体验过的新生事物。从别人书本上看来的东西,终究是别人的,而且大概率情况下是还没有达成共识的一面之词,这也包括我今天说的所有内容。在“无人区”的时代,其实有资格说不懂,恰恰说明你可能比别人走得更远,已经没有成例可循。反而是那些说自己已经知道的人是否真的知道,倒是一个大大的问号。
能够有资格“真正的不懂”,本是一件令人高兴的事情,但是如果在思想上还没有转变过来,还是习惯于跟着别人后面走,这时候在思维范式上就不敢说“我不知道”,忽略了在这个时候敢说不知道恰恰可能比任何人都知道更多的事实。当然也不排除我们绝大多数人其实是真的不知道,因为有太多的新概念、新说法、新理念、新模式。正因为如此,我们更不能在没有实践的前提下去想象一个答案,或者以为仅仅通过学习就能够得到一个适用的方案。对于各种新生事物而言,尤其是对于远没有达成共识的新生事物而言,重要的是自己的实践以及实践之后而产生的见解。有了基于亲身实践之后的见解,再通过理性的方法形成自己的判断,再不断在不断的实践中验证和纠偏自己的判断,这种“做中学,学中做”的方法,也就是科学的方法,或许能够真正带领我们走出“无人区”。
具体而言,首先,在无人区,就好比“盲人摸象”,每一个摸到了一部分大象的人都倾向于说我已经知道这头大象是什么样子。这个时候审辩式逻辑思维能力就非常重要,尤其不要认为新名词就一定代表新概念,数字大就一定代表技术强。比方说现在常常被提及的第四次工业革命,对于经历过第一次、第二次以及第三次工业革命的国家和地区,有可能是第四次工业革命,但是对于我们而言呢?另外,真正审视时代的特征,我们可能又会发现另外一个从“物质”到“能量”到“信息”的社会演变过程,对应的是从“农业社会”到“工业社会”再到“信息社会”的发展次第。如果按照这种逻辑,考虑到信息时代信息的自由流通和泛滥对于人类心智的影响,再回顾五、六百年前由文艺复兴、启蒙运动而造就的现代社会,我们是否可以将当下的时代特征判断为对我们而言的一轮复兴与启蒙过程,其实这种判断更加符合我们现在常说的百年不遇甚至千年不遇的大变革时代的特征。
当然仍需强调的是,文艺复兴与启蒙运动的概念本身也有很多争议,虽然这不是本文的主题,说明这点其实是让我们知道在变化这么快的时代,几乎又回到了我们的祖先在两千多年前就提出过的“苟日新,日日新,又日新”的时代。既然如此,更要以实证的精神,以系统的方法,既要承认自身的无知,又要勇于实践,集众力,努力探索出一条符合我们自身特色的发展之路,这也就是我们常说的“小马过河”的精神。
其次,没有永恒的领先者。微软CEO萨提亚·纳德拉经常提醒我们要区别市场领袖(Leaders)与市场现任领导者(Incumbents),这里所说的现任领导者也就是《创新者的窘境》作者克莱顿·克里斯坦森一直强调的与市场挑战者(Challengers)相对应的市场现任领导者(Incumbents)。如果持有一种现任者的心态,就能够时刻提醒自己成功不是永恒的,也因此更有可能做到“胜不骄”,因为你知道随时会出现挑战者打破这种局面。当你没有成为领先者的时候,由于理解了落后也是暂时的这个道理,同样更有可能做到“败不馁”,你只要脚踏实地,勇于实践,善于学习,努力开拓,就有可能成为一个暂时的领先者。萨提亚的提醒是要让我们时刻认识到,无论是成功还是失败都是动态的,始终要保持成长思维,学习,实践,再学习,再实践,永无止境。
最后,避免过早陷入局部最优解。人和机器的关系其实是个永恒的话题,现在进入新的“人-机”交互时代,我们是不是也可以向机器学习呢?大家都知道,当设置好神经网络的结构后,机器学习开始计算的第一步是参数的初始化,基本上用的是某种形式的概率分布。它的思路就是尽量不要过早地陷入到一个局部最优解,某种意义上能够犯最“白”的错误,像白噪声一样,最白的错误,最没有特征或者最符合这种场景的一种概率分布,然后通过不断地循环迭代,不断地学习,直到得出相对理想的全局最优解。
我从机器学习的方法,再结合人类社会发展的现况,总结了“认错-知错-改错”三错法,期望能够更好的应对“无人区”时代的不确定性。首先要发自内心地勇于“认错”,在无人区犯错很正常,但要犯有质量的错误,也就是可以被学习的错误。跟机器学习是一样的,第一步不必纠结于对错,不用担心是不是做对,或者默认状态就是肯定会做错,那么我们的重心就没必要放在一定要做对这种理想状态。在不确定的时代,这种理想状态出现的概率太低,追求这么低概率的理想状态,反而会耽误我们以最快的速度和最小的代价找出不确定性下的全局最优解。之后我们就需要尽快把注意力放在“知道”哪儿错了和如何最高效地“改正”错误。这恰恰就是机器的能力最能帮助人类的地方,尽快地利用机器告诉我们哪里错了,通过人类自己的学习能力来尽快改错。对于现在所有流行的技术新名词而言,这种帮助人类“知错”和“改错”的能力,也就是微软基于控制论的原理所提出的数字化反馈链,这才是现阶段数字化技术对人类福祉最核心的贡献。
在这种“以人为本”的新型“人-机”关系逻辑下考察“元宇宙”的概念内涵与外延,可以帮助我们更加深刻地认识到它的价值与局限。
不必纠结称它作“元宇宙”还是“数字孪生”
“无论你把一朵玫瑰称为什么,它都同样芬芳”。当我们明白名词与本质是“能指”跟“所指”的关系之后,我们就无须纠结类似“数字孪生跟元宇宙有什么不同”的问题。我们要谈本质,无论我们是把它称为“元宇宙”、“数字孪生”、“赛博物理系统”,还是“语义网”,“Web3.0”,或者只要你愿意,还可以像《系统化思维导论》作者杰拉尔德·温伯格借亚伯拉罕·林肯之口所称的“狗尾巴”,从本质上来说,解决的都是人类发展史一个永恒的话题,即人类如何利用工具加强自身的能力。
随着人类利用工具能力的提高,从最初拓展人类四肢力的工具,发展到拓展人类大脑思维能力的工具。现在机器的计算能力已经能够实现将人类所处的真实物理世界建模、映射进入机器的张量空间,这种空间有时也称为赛博空间。如果再加上经过计算之后通过机器软、硬件能力所模拟的人类视觉与听觉表现,以及正在逐步实现的触觉、嗅觉和味觉表现,这种对物理世界的建模、映射、仿真、计算、优化、预测和表现能力,会给人类一种类似于让·鲍德里亚定义的比真还真的“超真实(Hyperreal)”拟像世界(Simulacra)的感觉。尽管以目前的技术实现能力而言,这种“拟像”还十分粗糙,但正是因为这种拟像的潜在可能性,以及信息对人类精神世界所带来的影响力,我们更要明确定义与区分真实物理世界与虚拟赛博空间的关系与作用。
图源:Microsoft
现在大家把关注点过多地放在了赛博空间,这当然有它存在的必要,但是对于人类而言,难道不是物理空间的真实体验更有价值吗?所以要均衡地看。均衡来看之后,用无处不在的计算力来支撑两个世界,将物理空间的对象映射进入虚拟空间之后进行仿真、计算、预测,然后将计算之后的结果反馈回物理世界加强人类的能力。从这个角度来看,目前我们已经在日用而不知的导航应用,不就是一个非常典型的已经为人类福祉作出巨大贡献的元宇宙应用吗?想象一下那么多汽车和人类的行动轨迹被建模到赛博空间进行计算、仿真、预测,把路径建议算好之后再返回物理空间,赋能人类开车或者自动驾驶,这算不算元宇宙?根据不同的前提约束和对于概念外延与内涵的不同定义,这可以是元宇宙,也可以是一条狗尾巴。
以现在的技术成熟度而言,如果我们不要过于强调模拟人类视觉、听觉的虚拟空间体验,那么这种真实物理空间与虚拟赛博空间互相映射、互为加强的落地应用已经在逐渐走向人类最基本的“衣、食、住、行”,而解决人类最基本的“衣、食、住、行”的问题,才是技术首先要考虑的落地方向。
人类社会的资源有限、时间有限、能力有限,虚拟赛博空间的计算能力也不是无穷的,同样要以消耗物理空间的物质与能量作为代价。那么这种宝贵的计算资源首先应当解决的或许应该是由联合国定义的着重人类基本生存福祉的可持续性发展目标,当全人类的温饱、教育、医疗等基本生存目标被满足后,元宇宙这个概念在真实与虚拟世界中实现的意义可能会更加明确。
图源:Microsoft
明白这一点之后,微软总结的“无处不在的计算” 、“无处不在的智能”和“以人为本的技术”以及Azure作为”世界的计算机“的技术愿景就更能凸显它的前瞻与社会价值,你不用纠结什么云计算、边缘计算等这些词汇,按照萨提亚初任公司CEO时对于微软Azure的定义就是一个云操作系统,大家知道操作系统,无非是管理计算、存储、网络,再加一个人机交互界面。仔细想一想,不管是云计算、云原生还是现在很火的元宇宙,是不是其实做的还是计算、存储、网络加上一些交互,但是最终背后的原动力是什么?是人的需求,不是技术。
利用由Azure所管理的遍布全世界范围的计算、存储与网络资源,让赛博空间的计算能力更好地为人类服务,帮助企业在整个产品、员工、客户、运营环节中都嵌入智能的数字化反馈链,再加上混合现实的展现能力,就是我们所说的企业端到端元宇宙解决方案。
图源:Microsoft
元宇宙应用机会立方体
再稍微展开一下,除了关注于提高生产力的企业元宇宙解决方案以外,如果回归到新型的“人-机”关系第一性原理,我们可以把物理空间与虚拟空间相结合所产生的应用机会做一个更广泛的概括,我把它描述为元宇宙机会立方体。它是一个三维的,有27个机会点。横向来讲是元宇宙作用对象,包括消费者、企业和行业对象;另一个维度是它的作用空间属性,包括真实物理空间、赛博物理空间和纯粹的赛博空间;再加上第三个作用职能对象,或者说内容任务对象,包括内容的生产者、内容的发布者和内容的使用者。当然还有更加广泛的法律、行政、技术、标准作用空间,但是暂时先不包括在这个立方体的描述范畴。单单这三个维度就已经有27个机会点可以去综合考虑,别忘了还有一个时间轴。
图源:Microsoft
从时间轴上来看,过去谈得更多的是数字孪生,和一些简单的游戏应用,现在正在发生的还是这些东西,只不过慢慢开始有一种更加密切的虚拟现实的融合。再往下发展,机会更加实在。同样的应用点,随着技术的不断进步,应用的能力和体验会不断地迭代、深化和完善。
图源:Microsoft
谈起对于元宇宙的定义,就像刚才所说,远没有达成共识,是一个百花齐放的阶段,这里再举一个微软合作伙伴DataMesh对于元宇宙应用的定义。他们反其道而行之,把他们的应用称为“实宇宙FactVerse”,正在帮助很多公司利用虚拟空间的计算能力和仿真能力来加强现实空间,依靠具有真实世界基础的数字孪生世界来实现对于真实世界的“可视化–可计算–可操作”。那么这种应用到底是“元宇宙”还是“实宇宙”呢?不管它叫什么,对人类有帮助才是我们需要的。
图源:DataMesh
再以微软的工业行业的数字孪生方案为例。还是这三个维度,只不过在这里,我们更多地是在工业行业,一样有三个空间的维度。另外,再加上对于内容的消费和生产,也可以有平台来进行传输、分享,这是一个完整的工业行业的数字孪生的应用。是不是元宇宙?当然也是。
图源:Microsoft
微软的数字孪生,Azure Digital Twins,除了常见的数字孪生的基本实现方式外,还通过一个与W3C的RDF、OWL和SHACL标准兼容的Digital Twins Definition Language(DTDL)将物理空间中各个对象的属性、关系与行动逻辑和Azure虚拟空间中的计算、仿真和机器学习能力统一在一起,基于强大的开发与Azure Devops环境,打造一个可被数字孪生空间所计算和加强的现实世界。同样的,根据不同的定义与约束,这也可被称作一个已经在应用的元宇宙。