大数据, 2023, 9(3): 85-96 DOI: 10.11959/j.issn.2096-0271.2023033

研究

生成式人工智能大模型赋能的元宇宙生命体:前瞻和挑战

王皓1, 潘昱杉2, 潘毅3

1 西安电子科技大学网络与信息安全学院,陕西 西安 710126

2 西交利物浦大学智能工程学院,江苏 苏州 215123

3 中国科学院深圳先进技术研究院,广东 深圳 518055

Generative AI empowered metaverse organisms: prospects and challenges

WANG Hao1, PAN Yushan2, PAN Yi3

1 School of Cyber Engineering, Xidian University, Xi’an 710126, China

2 School of Advanced Technology, Xi’an Jiaotong-Liverpool University, Suzhou 215123, China

3 Shenzhen Institute of Advanced Technology, Chinese Academy of Sciences, Shenzhen 518055, China

通讯作者: 潘毅,yi.pan@siat.ac.cn

网络出版日期: 2023-05-15

基金资助: 深圳市科技计划资助项目.  KQTD20200820113106007
国家自然科学基金资助项目.  U22A2041

Online: 2023-05-15

Fund supported: Shenzhen Science and Technology Program.  KQTD20200820113106007
The National Natural Science Foundation of China.  U22A2041

作者简介 About authors

王皓(1978-),男,博士,西安电子科技大学网络与信息安全学院华山学者、领军教授、博士生导师,主要研究方向为关键系统中的人工智能、大数据和(工业)物联网技术。

潘昱杉(1986-),男,博士,西交利物浦大学智能工程学院助理教授、博士生导师,主要研究方向为人机交互、参与式设计、计算机支持的辅助工作和经验软件工程。

潘毅(1960-),男,博士,中国科学院深圳先进技术研究院讲席教授,美国佐治亚州立大学州校董荣休教授,乌克兰国家工程院外籍院士,美国医学与生物工程院院士,英国皇家公共卫生学院院士,英国工程技术学会会士,日本学术振兴会会士,长江学者和国家特聘专家。主要研究方向为基于云计算、大数据分析、人工智能、深度学习等的生物信息和医疗信息的研究。

摘要

元宇宙已在医药、制造、金融产业、教育和公共服务等领域有所讨论,但基于虚拟现实的应用场景并未真正实现“现实-虚拟-现实”回路交互方式。其交互模式也没有真正意义上赋予虚拟世界等同现实世界的意识和感知。以医药为例,探讨了生成式人工智能大模型在元宇宙生命体中的前瞻应用和挑战,包括数字化生物细胞,构建数字化细胞之间的连接和数字神经元等,以促进元宇宙生命体具有与物理世界一致的感知和生物化学反应,从而赋能医药领域的发展。针对目前元宇宙和生成式人工智能大模型各自的优缺点,进一步讨论通过巧妙设计人机协同机制,促进人与元宇宙生命体在医药中的有意识交互。

关键词: 元宇宙生命体 ; 生成式人工智能 ; 人-元宇宙交互

Abstract

The metaverse has been discussed in fields such as medicine, manufacturing, finance, education, and public services, but the application scenarios based on virtual reality have not truly achieved the "real-virtual-real" loop interaction method.Its interaction mode has also not truly given the digital world the same consciousness and perception as the physical world.Taking medicine as a case study, the prospective applications and challenges of generative artificial intelligence models in metaverse organisms were explored, including digitizing biological cells, and building connections between digitized cells and digital neurons, in order to promote metaverse life forms to have perception and biochemical reactions consistent with the physical world, thereby empowering the development of the medical field.In response to the current advantages and disadvantages of the metaverse and generative artificial intelligence models, the clever design of human-machine collaboration mechanisms was discussed to promote conscious interaction between humans and metaverse organisms in medicine.

Keywords: metaverse organisms ; generative AI ; human-metaverse interaction

PDF (2778KB) 元数据 多维度评价 相关文章 导出 EndNote| Ris| Bibtex  收藏本文

本文引用格式

王皓, 潘昱杉, 潘毅. 生成式人工智能大模型赋能的元宇宙生命体:前瞻和挑战. 大数据[J], 2023, 9(3): 85-96 DOI:10.11959/j.issn.2096-0271.2023033

WANG Hao, PAN Yushan, PAN Yi. Generative AI empowered metaverse organisms: prospects and challenges. Big data research[J], 2023, 9(3): 85-96 DOI:10.11959/j.issn.2096-0271.2023033

0 引言

我国古代就有对宇宙的探索,形成了关于宇宙的朴素认知。战国时期有《庄子·齐物论》的“奚旁日月,挟宇宙”,也有尸佼的“四方上下曰宇,往古来今曰宙”。“宇”指空间,“宙”指时间,“宇宙”体现了时间和空间的统一。这与20世纪西方哲学代表之一的存在主义遥相呼应。Heidegger[1]认为一切的实体通过存在而被称为存在者。人们存在并生活在一个现实世界中。这个现实世界不因人们的意志而改变。人们不能跨越时空,无法选择现在与未来。

元宇宙的出现,使人们可以选择在特定时间、特定地点跨越到另一个时空中,即虚拟世界。这意味着生命体可以跨越时空,在虚拟和现实之间切换任务与角色,在虚拟和现实之间进行信息传递与交互[2]。在这种情况下,时间与空间可以被虚拟化,那么人们就可以将现实世界与虚拟世界合二为一[3],在不同的时间维度和空间维度进行一系列的人类活动和科研工作[4]。似乎一个平行的虚拟世界应运而生。

但是,目前的元宇宙虽然是现实世界的一个虚拟载体,但其仅实现了在虚拟空间模拟现实世界的基本功能[5]。例如它使人类从传递图文信息、视频信息进化到传递物理信息、生命信息,并整合网络通信、扩展现实、数字孪生、区块链、大模型语言人工智能等多种技术而产生的虚实的社会形态。但大多数的元宇宙应用依旧停留在游戏、电影、娱乐、教育、办公等场景。元宇宙的潜能并未有效地开发。其原因是科学界并没有真正地在不同的时间维度和空间维度有效利用元宇宙服务生活生产。特别是在医疗领域,元宇宙可以促使科学界更好地利用计算机、生物、物理、数字等技术模拟细胞培养、进行药物试验、展开手术前模拟风险探讨等。不可否认的是,得益于目前正在流行的人工智能大模型,科学界可以利用海量医学数据更精准、更快、更好地编辑、修改和重复各类实验,缩短试验周期,降低试验成本[6]

生成式人工智能大模型赋能的元宇宙生命体促成了人们同时生活在现实世界和虚拟世界的可能,并允许人们在虚拟世界中永续在线,可调整时间序列、可切换空间,快速计算问答结果,实现对现实中的本我和虚拟中的虚我的融合,最大限度地促使人们利用虚拟空间协助进行现实世界中高成本、难度大、风险大的各类活动[7-8]

1 元宇宙研究与发展现状

1.1 元宇宙研究现状

自2021年6月以来,全球关于元宇宙研究的热度持续增加,涌现了大量相关的学术论文、研究报告、白皮书、新闻报道等。国内外学者积极地开展元宇宙相关研究,官方发布了元宇宙研究报告和白皮书[9]。相关技术、产业链、场景应用、风险及治理、热点和未来展望等方面都得到了深入研究。

但是,人们对元宇宙应用的态度存在着积极拥抱、技术悲观主义和观望等不同的立场。虽然我国在中央层面的政策定调理性积极,地方政府也通过推出专项产业政策鼓励支持产业整合及细分赛道的发展,但元宇宙的研究始终停留在教育和游戏娱乐产业。

其原因可从目前元宇宙研究的两个大类分析。当前元宇宙研究主要分两部分,一是从宇宙学的角度研究元宇宙;二是借助元宇宙隐喻,从计算机、医学、经济等其他学科视角研究元宇宙。现有的技术缺陷让人们悲观地觉得元宇宙不过是资本炒作,也因此在一定程度上打击了人们科学利用元宇宙的信心。

1.2 元宇宙的技术研究缺陷和未来研究趋势

目前游戏、电影、娱乐、教育、办公等场景仅关注现实世界与虚拟世界的信息阅读与共享方式[10]。元宇宙被当作现实世界的一个虚拟镜像,而不是一个具有生命和自我认知能力的时间和空间的统一体。元宇宙提供的虚拟现实只是一个平行虚拟世界,未真正实现“现实-虚拟-现实”回路交互方式[11]

这种元宇宙技术主要研究的是一个基于区块链技术和人工智能的虚拟现实技术的融合[12]。它将现实世界和虚拟世界结合在一起,为人们提供了一种全新的、可交互的体验。例如,元宇宙需要具备高性能计算、存储和网络设施,以确保其可扩展性和可靠性。元宇宙还需要为人们提供高度沉浸式的体验,使人们可以自由地探索虚拟世界,与其他用户互动,参与到各种活动中[13]。但此类技术与人们生活生产的需求契合度不高,元宇宙本身没有社会、政治、物理、生命、化学、自然等问题,问题的本身是数据及数据利用的相关问题,如用户隐私、知识产权保护、数字身份认证等[14]

1.3 元宇宙与医疗世界的碰撞

从实用角度出发,元宇宙应该是复现现实世界中的生活生产,体现其社会规则、自然法则、化学机理以及物理原理等共同作用下的组织活动。例如,如何通过数字化赋予虚拟物体具有现实世界中的所有生物特性,包括其细胞、组织、神经连接等。其基本原理是通过计算机技术、生物技术以及信息技术等实现对细胞、细胞提取物、器官、神经元等基础生物信息的全面数字化,从而生成具有生命体特征的单细胞数字化生命体、多细胞生命体(如果蝇和蚂蚱等昆虫),乃至复杂生命体(如啮齿类动物、灵长类动物),甚至人类。元宇宙生命体的数字化技术进化过程如图1所示。因此,未来的元宇宙将不再是一个虚拟的平行世界,而是一个可以被人们充分利用并发挥其实用性价值的、可交互的。可仿真数字化、生物化一切生命体的虚实空间载体[5]

借助与虚拟世界的交互,笔者在不伤害现实世界中生命的前提下反复试验和验证其组织方式、病理反应、药物反应等数据。基于元宇宙平台的数字老鼠心脏药物试验如图2所示。

在治疗心理疾病方面,医生可以借助与虚拟世界的交互,对多动症、创伤后应激反应障碍、抑郁症等心理疾病采取早发现、早治疗的手段[5]。利用数字果蝇研究基因连锁-交换规律,以及数字细胞研究各类生物数据,对细胞内各种代谢和调控过程进行数学方程描述,准确描述细胞行为并构建人工生物系统。科学家和工程师可以从细胞本身和细胞之间的连接进行全面数字化。

图1

图1   元宇宙生命体的数字化技术进化过程


图2

图2   基于元宇宙平台的数字老鼠心脏药物试验


目前,国外已有文章介绍果蝇数字孪生体的技术成果,用CT建立逼真的果蝇生物模型,在果蝇真实肢体运动数据的支持下,世界上第一个黑腹果蝇的精确“数字孪生体”诞生了。这个数字果蝇是有反应和感知力的,如果向数字果蝇扔个球,数字果蝇会感受到危险并跳起来。除了果蝇,目前数字细胞已经成功发布。人们寄希望于依托数字技术逐渐建立起以监控医药健康为核心的全生命管理系统。可以想象,不远的将来还有望实现数字老鼠,进而再实现形神兼备的数字人类,这里包含了物理技术、生物技术和信息技术。可以预测,老鼠、猴子、人类都可能在未来的5~10年或者20~30年成功被数字化。这些一旦成功,就可以用元宇宙来筛选和测试新药物,大大降低试错成本。

2 元宇宙中的生命体

既然一个有用的元宇宙是现实世界和虚拟世界的无缝连接,那么在元宇宙中注入生命体将不得不讨论人工智能的发展动态和其在元宇宙中的应用。

2.1 人工智能的起源与研究现状

自20世纪50年代至今,人工智能领域在悲观主义和乐观主义的科研态度下跌宕起伏。虽然20世纪60年代Minsky和Papert[15]提出的感知器能解决的问题非常有限,但感知器足以被视为人类迈向人工智能的重要一步。随后人工智能领域诞生了专家系统,虽然该系统不能在面对新情况时像人类专家一样针对特定问题概括和总结出非常适合的答案,但其贡献使学术界意识到人类自身的意识和知识的重要性。

20世纪90年代和21世纪初计算机科学界见证了机器学习的迅速崛起:即从数据中创建预测模型的算法的发展。这类方法旨在执行特定任务,而不是获得一般智力。从一定程度上来说,这种方法并非模拟人类推理和决策的过程,例如人类可以利用脑神经进行推理和通过一系列心理推演做出决策。尽管最终效果一般,但其也为后来的人工智能专家提供了可靠的科研论证,即探索人工智能体需要模拟人类自身大脑神经网络且着眼于大规模数据。于是在2010年左右,深度学习模仿人类大脑的多层神经网络结构,通过这一机制利用大数据训练该人造脑神经。因此,这种多层脑神经网络方法从曾经在人工智能领域中落后的分支子领域迅速崛起,并推动着人工智能的科研落地,包括语音识别、机器翻译、聊天机器人、图像识别和蛋白质对叠等。

但计算机科学界不得不承认深度学习通常无法学习抽象概念。因为无法获得抽象概念使得人工智能的前期工作并不能有效地结合各种现实生活任务,如抽象医学领域中的专业知识、专家经验、生物的生化反应特征对计算机科学家就是个巨大挑战。这也是人工智能无法有效结合元宇宙并大规模展开研究的主要原因之一。

2.1.1 生成式人工智能大模型的原理

近期涌现的生成式人工智能大模型或许可以改变以上困境。了解了生成式人工智能大模型之后,不难发现其机理仍旧是自回归生成模型。虽然当前的大语言模型没有意识、欲望、情绪,甚至不理解自己说了什么,但不同于感知器、专家系统、机器学习、深度学习,这种生成式人工智能大模型并不是单一地关注某一个学习方式,而是将专家系统中的专家意识和知识,以及机器学习中的无监督学习、监督学习和强化学习合并叠加后的一种新的机器学习模式。这种新的学习模式具有创造并生产有效答案的能力。这使得计算机科学界看到了其与元宇宙结合的可能,并在元宇宙中利用这种机器学习能力组织实用性的科研工作的前景。

细看生成语言大模型的核心机理,其重要部分有两个,一是单字接龙,二是模型本身。单字接龙顾名思义是指将不同的载体,以续的方式上下联系起来,并可以像一条长龙一样无限制地往下延续。以此为机理去理解生成式人工智能大模型的单字接龙就不难发现,生成式人工智能大模型的核心是通过算法模型来生成输出,并根据上文内容,不断地生成文字输出。模型本身是通过不同的学习材料,通过不断地调整,结合学习材料的上下文生成对应的下一个字而进行单字接龙,并以概率分布的形式续写长文答案[16]。其特点是运算速度快。这种生成模式并不是在数据库中寻找相似的答案并拼接成回答。它的目的是训练模型,让模型学会生成语言大模型使用者的提问的通用规律,让模型泛化[17-18]。学习提问者的通用提问规律之所以重要是因为在训练模型之前,数据库已经存储了大量信息,生成式人工智能大模型不是把信息从数据库移到模型中,当成模型生成[10],而是根据提问者的问题生成通用的答案。即使模型没有见过某个问题,但通过学习后,模型就有可能生成一个正确的答案。学习材料足够丰富,生成语言模型就可以学会通用模式,并生成相应的答案。

2.1.2 生成式人工智能大模型的缺点及解决方案

虽然人们普遍认为生成式人工智能大模型高度依赖数据,且海量数据的确可以助力模型学会应答模式并生成有规律的应答来应对没有记忆的情况,但是这带给生成式人工智能大模型2个主要缺点:一是可能混淆记忆;二是通用模型无法直接被增删改查。

例如,在模型未曾见过且与之前任何问题的实际情况不同的情况下,生成式人工智能大模型可能会混淆问题,生成无效回答,即合乎规律的混合捏造。这也就是说当问到事实性的问题时,生成式人工智能大模型可能会一本正经地混合捏造答案。

再例如,任何问答模式都不能直接被增删改查。不论是生成式人工智能大模型记住的信息,还是其学到的规律,都是用同一个模型表达的,因此不能像数据库那样直接增删改查。人们无法直接查看它记住了什么,学到了什么,只能通过多次提问、评估和猜测。这导致生成式人工智能大模型的决策方式缺乏可解释性。因此在使用生成式人工智能大模型的过程中会存在安全风险。由于只能通过再次调整模型(即再次训练)来增加、删除或修改它的所记所学,这在一定程度上也导致更新时间长,降低了生成式人工智能大模型的效率。生成式人工智能大模型的缺陷及改进方案如图3所示。

通过以上两点不难看出,生成式人工智能大模型高度依赖数据,也就是学习材料。想要对无数未见情况给出答案,就必须提供数量足够多、种类足够丰富,质量足够高的学习材料,否则它将无法学会通用学习规律,给出的答案将会是以偏概全的。混淆和篡改也需要用优质的学习材料来修正。因此学习材料的模式、质量、和领域专业程度非常重要。同时可以利用人类的优质对话范式来训练模型学习人类语言的通用规律,通过丰富的学习资料调整模型的准确程度,最终形成类人的理解方式和思维模式。

2.2 元宇宙中的生命体

元宇宙对环境的模拟是由计算机生成的,并由实时动态构成的三维立体逼真图像。这种技术的优势在于增强由人的眼、耳、鼻、舌、身5种感官产生的所有色、声、香、味、触的感觉,为人类营造一种虚幻的存在。然而目前的技术手段并不能真正地赋予拟态生命体真正意义上的意识。但生成式人工智能大模型可以促使元宇宙中的生命体体现出类似现实世界的特征,即使用海量的专业领域学习材料训练人工智能大模型,就可以在元宇宙中注入生命体,并允许人们在虚拟世界中永续在线、调整时间序列,切换空间,快速计算仿真实验结果,最大限度地促使人们利用虚拟空间协助进行现实世界中高成本、难度大、风险大的各类生活生产实验。

因此,元宇宙生命体可以提供一种技术与认知作用与反作用、影响与反影响的互构空间[5]。在这个空间里,科学家能够仿真、演示、模拟、验证这种双向构建的过程与成果,进而更加精准高效地认知、改进方式。例如,元宇宙可以提供一个现实的医药试验场景数字孪生平行认知空间,在这里医药试验可以高效率推进、快节奏增强、全景式呈现药物临床试验的全维度实验。元宇宙中的医学试验如图4所示。

图3

图3   生成式人工智能大模型缺陷及改进方案(通过提示数据集对模型进行监督微调实现改进优化模型的目的)


元宇宙中数字小白鼠药物试验如图5所示。利用数字小白鼠技术,医药试验可以在不伤害现实世界小白鼠的前提下,加快进度,缩短试验周期,反复进行药品安全性验证,并能节省药剂使用和避免伤及实验白鼠。这不仅可以节省实验成本,也能加快新药投入市场的速度,同时缩短了药品产品升级换代的周期。

图4

图4   元宇宙中的医学实验


图5

图5   元宇宙中数字小白鼠药物试验


同样是医疗领域,培养一位医生不仅需要大量的教育资源,还需要大量的实习机会。医生只有通过实习才能不断巩固和加强所学知识的应用。元宇宙不仅可以提供逼真的实习场景,还允许医生反复地实践其所学,巩固其学术认知能力,并能检验新的医疗设备、新的医疗方法以及进行相应的医疗培训等,例如,利用数字化模拟心跳,仿真血液流动,心脏起搏次数、膨胀大小等。元宇宙中的数字心脏支架手术过程如图6所示。再例如,元宇宙全息影像可以大大提升医生之间的交流效率,实现医疗资源的有效复制。在手术操作培训中心,可以通过显示、触感、力反馈等设备,使接受培训的医生沉浸在虚拟场景中,进行手术操作和练习,体验真实的临床手术过程,可以有效提高医生针对病情和制订治疗方案的能力,同时大幅降低传统培训的器材、标本等成本。

图6

图6   元宇宙中的数字心脏支架手术过程


可见,元宇宙作为与现实世界平行的虚拟存在,不只是简单地将三维数字空间复制,还有着自身运作规律并能作用于现实世界,这种能动作用即元宇宙认知能力的着力点,为人们构建既有生物属性又有物理规律的仿生医疗器官。医疗领域是虚拟世界反作用于现实世界的典型案例。

虽然生成式人工智能大模型在一定程度上可以通过数据积累和AI推理实现人机互动,但元宇宙中的生物体依旧没有神经感知能力,在面对一些没有准备的问题时,人工智能大模型的弊端就会显现,即要么无法给出正确的医疗实验数据,要么数据的形式和内容超出人类伦理范围。因此,计算机科学界需要寻找到一种懂人类社会的既定规律而且博学的元宇宙生命体方案。这将是未来进一步研究元宇宙生命体的方向之一。

3 与元宇宙生命体的交互

人类的交互模式取决于人类的语言和基于一定社会规则的人类行为的生活实践。人类的交互是通过语言并无限地利用有限的手段创造具有普遍影响力的思想和理论的过程。人脑不是一个模式匹配统计引擎,也不会推断可能的对话回应,或不受控制地输出最可能的随机答案。人脑只需要少量的信息即可运作。它寻求的不是推断数据之间的关联,而是创造解释。例如,人类可以通过无意识的、自动且迅速的方式从少量数据中发现语法和逻辑规则,即因果机制或物理定律。人类会犯错并基于可能的解释和纠错对整个过程进行例行的思考。

因此,对元宇宙生命体进行科研探索和开发其潜在的应用和交互的目的并非替代人类,而是为人类服务。元宇宙生命体并非一定要实现真正的以假乱真、有意识、有情感的虚拟人,而是实现可以被人类控制、合理利用、服务于现实世界的人造物。正如合理地使用人工智能大模型的目的之一是实现一种基于元宇宙的人机协同,例如可以零风险、低成本地展开医药实验,或进行高效率、可复现的医疗技术培训等,与元宇宙生命体交互的宗旨是帮助人们在虚拟世界中协作创造、继承、应用现实世界的知识,并实现现实世界无法做到的重复性和高效率的事情。

元宇宙的生命体因此可以被看作一种对现实的补偿、映射和超越。元宇宙生命体也可以被看作一个人机协同智能系统,既可以控制元宇宙中生命体的逻辑思维,让它协同人类工作,也能逐步实现一种具有引导机制的智能体。元宇宙生命体将会在人类的监督和约束下,强化学习人类赋予它的智能模式,并产出协同效应。

4 元宇宙生命体的应用和挑战

4.1 元宇宙生命体的应用

虽然元宇宙生命体目前还处于萌芽阶段,但其未来应用场景十分丰富。生成式人工智能大模型赋能的元宇宙生命体会涌现出3个关键的能力:一是对指令的理解,二是对例子的理解,三是具有解决复杂问题的思维链。虽然目前对以上3种关键能力的产生学术界暂无明确的解释,但不能否认的是,当数据量增大到一定程度时,生成式人工智能大模型赋能的元宇宙生命体可以学会人类的规范问答模式,并通过特定的评价机制被引导和创造具有新意的答案反馈。而人类引导式的训练人工智能大模型可以利用这个机制训练出具有处理复杂且未知问题的能力的元宇宙生命体。例如,通过创意引导可以让人工智能大模型根据医生对药物实验过程中对人体造成的危害进行评估,以引导它快速生成药物试验结果。这将极大地促进生物医药产业的发展。

此外,生成式人工智能大模型赋能的元宇宙生命体还可以大幅提升元宇宙在各领域的落地应用。如元宇宙搜索引擎帮助用户查找和筛选信息;元宇宙助手辅助用户阅读和写作;元宇宙教育培训制订个人的学习计划和学习材料,并可担任全天家教;元宇宙开发工具辅助编写代码、开发和调试程序;元宇宙游戏让NPC给玩家带来更逼真的体验;元宇宙客服提供全天候温馨服务;元宇宙会议专家协助多语翻译、会议记录与总结、谈话查找;元宇宙国安服务筛选网上评论、统计舆论、给出提醒,并提供法律指导。目前新闻界、教育界、商业和游戏产业非常关注元宇宙生命体。这些行业的共同特点是其与语言中的知识密切相关,且是传授创新知识的行业,而不是既有知识。

因此这会促使对理解知识的层级做更精细的划分,将更高层次的创新和大语言模型的创新加以区分。而元宇宙生命体就是一种有效的工具,也是一种可以普及的方案。

4.2 机遇与挑战

可以预测的是,生成式人工智能大模型赋能的元宇宙生命可能会更出色、反应更快速、成本更低。在这种情况下,元宇宙生命体可以是一个熟读人类所有既有知识的智能体。除了以上在各行各业中的出色表现外,生成式人工智能大模型赋能的元宇宙生命体会给现有的社会模式带来挑战,如网络安全和国安问题、医药治疗、智能制造等。

例如,互联网上的内容不免存在偏见、歧视、文化和意识形态新奇的危害性言论,生成式人工智能大模型赋能的元宇宙智能体有可能接触到这些不良信息。另外也可能会有人提问特殊问题用于不法行为。尽管在模板规范阶段有约束,但是生成式人工智能大模型毕竟不像人类那样真正学会了知识,只是学到了贯穿于知识中的语言搭配模式,因此极有可能被诱导输出帮助犯罪的知识,从而使防范违法犯罪变得更加困难。

另外,医药治疗中提及的利用元宇宙生命体加快药物试验、培养数字生命体(例如组织器官),也有可能被人为地篡改数据,这会导致试验结果不准确而造成更加严重的医疗事故。同样的问题也可以被人为地复刻到智能制造领域。制造过程中任何一个步骤的错误都会造成不可挽回的成本损失。元宇宙生命体在彼此协作的过程中也可能泄露工作内容,进而泄露工作机密。

如何确保交互方式、数据保护和沟通问题不被泄露,将会是元宇宙生命体研究的主要核心问题之一。未来或许每个机构都需要部署自己的生成式人工智能大模型来确保安全,而非共用同一个人工智能大模型,如OpenAI。但这样可能会带来一个弊端,即无法发挥数据的规模效应。因此如何在保证数据安全的前提下实现联邦学习,是一个新的挑战。学术界已经针对这个问题提出了Prophet框架[19],即通过在人工智能大模型上游引入一个可学习的、与任务相关的小模型,更好地激发大模型的潜力。如果这个方法具备普适性,那么它可以简单、经济地解决计算机科学界和社会各界目前担忧的问题,应对面临的挑战。

5 结束语

本文回顾了元宇宙、生成式人工智能大模型和元宇宙生命体的发展动态。技术层面上,本文回顾了生成式人工智能大模型及生成式人工智能大模型的元宇宙生命体中可能的应用场景和机遇挑战。从交互层面、数据安全层面等方面讨论了元宇宙生命体及应用,提出和展望了如何利用元宇宙生命体服务于人类并将研究成果在医疗领域落地应用。未来元宇宙生命体可以有效地促进知识的创造、继承和应用,并提升人类工作效率,减少不必要的协作成本,改变人与人、人与机器的协作方式。这种方式会帮助人类克服记忆容量小、知识碎片化的短板,改变人类群体应用知识的方式,并提高人类继承知识的能力,在未来形成独特的现实与虚拟相融的人机协同,改变人类的生产方式。

参考文献

HEIDEGGER M .

Being and time

[M]. New York: State University of New York Press, 2008.

[本文引用: 1]

TAYLOR S , SONEJI S .

Bioinformatics and the metaverse:are we ready?

[J]. Frontiers Bioinform, 2022,2:863676.

[本文引用: 1]

PESCE M .

The metaverse could help us better understand reality

[J]. IEEE Spectrum Magazine, 2021.

[本文引用: 1]

DIONISIO J D N , BURNS W G , GILBERT R .

3D virtual worlds and the metaverse

[J]. ACM Computing Surveys, 2013,45(3): 1-38.

[本文引用: 1]

澎湃新闻.

潘毅院士:为元宇宙注入“生命体”

[Z]. 2022.

[本文引用: 4]

Pengpai News.

Pan Yi Fellow:Injecting“life forms” into the metaverse

[Z]. 2022.

[本文引用: 4]

WANG G , BADAL A , JIA X ,et al.

Development of metaverse for intelligent healthcare

[J]. Nature Machine Intelligence, 2022,4(11): 922-929.

[本文引用: 1]

WANGB C , PENG T , WANG X V ,et al.

Toward human-centric smart manufacturing:a human-cyber-physical systems (HCPS) perspective

[J]. Journal of Manufacturing Systems, 2022,63: 471-490.

[本文引用: 1]

YAO X F , MA N F , ZHANG J M ,et al.

Enhancing wisdom manufacturing as industrial metaverse for industry and society 5.0

[J]. Journal of Intelligent Manufacturing, 2022: 1-21.

[本文引用: 1]

贵州省大数据发展管理局.

2022年中国元宇宙政策汇编

[Z]. 2022.

[本文引用: 1]

Big Data Development Administration of Guizhou Province.

A compilation of China’s metaverse policies in 2022

[Z]. 2022.

[本文引用: 1]

XU J N , PAPANGELIS K , DUNHAM J ,et al.

Metaverse:the vision for the future

[C]// Proceedings of CHI EA’22:Extended Abstracts of the 2022 CHI Conference on Human Factors in Computing Systems. New York:ACM Press, 2022: 1-3.

[本文引用: 2]

DWIVEDI Y K , HUGHES L , BAABDULLAH A M ,et al.

Metaverse beyond the hype:Multidisciplinary perspectives on emerging challenges,opportunities,and agenda for research,practice and policy

[J]. International Journal of Information Management, 2022,66:102542.

[本文引用: 1]

YANG Q L , ZHAO Y T , HUANG H W ,et al.

Fusing blockchain and AI with metaverse:a survey

[J]. IEEE Open Journal of the Computer Society, 2022,3: 122-136.

[本文引用: 1]

LAM K Y , YANG L , ALHILAL A ,et al.

Human-avatar interaction in metaverse:framework for full-body interaction

[C]// Proceedings of the 4th ACM International Conference on Multimedia in Asia. New York:ACM Press, 2022: 1-7.

[本文引用: 1]

KIRKPATRICK K .

Applying the metaverse

[J]. Communications of the ACM, 2022,65(11): 16-18.

[本文引用: 1]

MINSKY M , PAPERT S A .

Perceptrons:An Introduction to Computational Geometry

[M]. Cambridge: The MIT Press, 2017.

[本文引用: 1]

KUMAR H , MUSABIROV I , SHI J K ,et al.

Exploring the design of prompts for applying GPT-3 based chatbots:a mental wellbeing case study on mechanical Turk

[Z]. 2022.

[本文引用: 1]

GROSSE R .

Generalization.Lecture note:CSC321 neural networks and machine learning (UTM)

[Z]. 2019.

[本文引用: 1]

MITCHELL T M , KELLER R M , KEDAR-CABELLI S T .

Explanationbased generalization:a unifying view

[J]. Machine Learning, 1986,1(1): 47-80.

[本文引用: 1]

SHAO Z W , YU Z , WANG M ,et al.

Prompting large language models with answer heuristics for knowledge-based visual question answering

[Z]. 2023.

[本文引用: 1]

/