im电竞官方网站AI下一站:从复活明星到数字永生?最近,用AI“复活”逝者这件事,着实是火出了圈,从包小柏用AI复活自己女儿,到各种用AI复活明星的视频,我们发现,通过AI技术,让死者“重回人间”似乎成了一件轻而易举的事。
这样的情节,不禁让我想起了《流浪地球 2》中,科学家图恒宇利用量子计算机,“复活”了因车祸去世的女儿丫丫,赐予她数字生命的情节。
但其实,现实中的这些AI“复活”,要远比科幻片中来得廉价、简易,有些甚至已经发展成了一套产业链。
不过,这样的技术,最多只能做到“让照片动起来”、“照片开口说话”,而且动作的幅度一般都很小,让人有种“一眼假”、“一眼AI”的感觉。
而稍微高级一点,表现得更加栩栩如生的,用的大都是现在的AI数字人技术,也就是通过收集大量的死者生前的信息,例如照片、视频、文本等,对其声音、形象和语言风格进行建模,来让死者“活过来”。
不过,这样的“复活”效果,其实还是基于真人的一个非常浅层的、表象的数字映像,跟真实社会当中的人所拥有的智慧差了老远。
比如像汤晓鸥这段视频,它里面的台词其实是工作人员提前编排好的,既不是来自汤教授本人,也不是来自一个能代表汤教授的AI智能体,只能说是一个样子货。
不过话虽这么说,这AI大模型可是眼看着越来越强大了,凭借大模型技术,是否真的有可能把人脑里的意识和记忆全扫描下来,然后上传到电脑里,从而实现“数字永生”呢?
二是通过文本信息建模,搜集逝者生前所留下的短信、社交账号的留言,或是其他人对他的印象等等,通过这些信息建立一个大致的思维模型。
例如,2018年,英国科学家宣称利用电子显微镜技术对小鼠的小脑进行了亚分子级别的三维扫描,并在蓝光超算中进行了有限的工作模拟。
而在2021年,耶鲁大学、普林斯顿大学和芝加哥大学的科学家们,成功地绘制了包含约130,000个神经元和5300万个突触的成年果蝇大脑连接组。
除了扫描的规模小,这些实验对神经回路的模拟能力也非常初级,往往只能提供静态的快照,无法捕捉到大脑的动态变化,而且哪个结构对应哪种功能,也是一头雾水。
而仅有的一些对人脑的扫描项目,例如德国海涅大学在2013年进行的实验,也仅仅只能对20微米见方的死者脑组织进行扫描。
首先,人脑那玩意儿实在太复杂细腻了,里头有860亿个神经元,要想完完整整把这么多玩意儿的精确到分子级别的结构都扫描出来,可不是件容易的事儿。
就拿现有最先进的透射电子显微镜(TEM)来说,它最高分辨率可以做到0.05纳米,听起来已经很了。
但问题是,为了通过TEM观察,样本需要切得非常薄,通常在几纳米厚度以内,人脑组织是极其复杂的,要将其制备成适合观察的样本,既需要保留细胞间的精细结构,又要防止在切割过程中造成损伤,这是一个极大的挑战。
但这玩意儿就有个大问题,它那电子流只能聚焦在样品的一小块区域,在任何给定时间,都只能照亮并拍下样品的一小部分。
860亿个神经元,就算只扫描神经元的大概形状和连接方式,也至少得拍上万亿张3D图像。每张图像数据量虽然能压缩到几十MB,但加起来总量也是几十艾字节级别的。
这里稍微解释下,艾字节(exabytes),是计算机存储容量单位。也常用EB来表示,1EB约等于一百万TB,也就是2的60次方字节。
现在最高端的数据中心级每块硬盘也就20TB的容量。你要存几十艾字节?那得几万亿几十万亿块硬盘啊,占地面积比整个中国都大!
再者,就算把这些数据存下来了,你还得有一个无与伦比的超级计算机系统,才能基于这些数据精确复制出人脑所有神经元的动态反应和交互。
每个神经元细胞内部,都有数以万计的各种离子通道、蛋白质分子,而它们的状态都在不断运动和变化。
如果要模拟全部860亿个神经元,那就等于是在同时解无数个巨大方程组,每个方程组都有上万个未知数和变量。
由于这些算力、硬件层面的种种限制,从物理层面完整复制人脑的设想,虽然理论上是可行的,但在没有找个更高效的方法之前,现阶段暂时实现不了。
与全物理层面的模拟相比,文本建模似乎是一个更实际可行的替代方案,但是在还原度方面,相较前者而言,实在是有些拉胯……
首先,并不是每个人生前都能留下足够数量im电竞、质量的文本信息,如果没有足够的文本信息可供学习,训练出模型的发言就会比较“大路货”,即便从感官上也无法给我们“这就是那个人”的感觉。
另外,要还原出这个人在各种特定场景下的行为反应、决策判断等高级认知功能,光用通用的语义关联可就难办了,你得针对具体场景做大量训练,缓解模型偏差。
更关键的是,你怎么保证经过AI建模后的这个系统,真的还能完整继承逝者的“自我意识”,而不只是个简单的模仿机器?
因为自我意识是一种内在的、高级的心智状态,包括自我认知、情绪体验等等,这些隐藏在内心深处的东西,单纯从文字记录是很难捕捉到的。
就目前来看,在打造数字生命这件事上,物理建模还原度高,但可行性低,文本建模可行性挺高,但还原度又拉胯。
今年一月,悉尼科技大学的科研人员,通过大语言模型、EEG(大脑活动检测工具)、脑机接口等技术,开发了一个可自动读取人类想法,并转化成文本的AI大模型——DeWave。
DeWave的核心是利用EEG(脑电图)等设备,直接捕捉大脑的神经活动信号,作为物理层面的输入数据源。
然后DeWave会把这些特征向量再次转化,变成一串串的离散编码,这相当于把你的大脑活动给转换成了机器能读懂的一堆特殊密码。
接下来就简单了,DeWave直接把这些大脑密码丢进一个训练好的大模型里,经过模型的“翻译”,最终就能将你大脑里的想法,化作人话给生成出来了!
就目前来说,DeWave在ZuCo数据集上的表现,用眼动标记的EEG信号,拿到了41.35的BLEU分数和33.71的ROUGE分数。
这个测试就是为了检验DeWave这种直接读脑的翻译模型的精确度有多高,看它能不能真正做到读心术把人脑子里的想法解码出来。
之前类似的技术,例如Wave2Vec,这玩意儿本来是用来识别语音的,后来有人把它改了改,用来识别大脑信号。但是,它在同样的数据集上,BLEU分数只有18.15,ROUGE分数是23.86。
想象一下,倘若在未来,DeWave这类技术更上了一层楼,任何人要想对自己的思维建模,只需要戴上EEG设备一段时间,记录下自己在各种情况下的思维、想法,之后将其解读和翻译,导入大模型,并进行思维建模,一个完整的“人格拷贝”就诞生了!
而这样的“人格拷贝”,这着实和《赛博朋克2077》中,荒坂公司研究的所谓“灵魂杀手”芯片有些相似,后者就是用来获取和备份人类意识的一种黑科技装置。
不过,这样建模出来的数字生命,也存在着一个问题,就是它是静态的,它只能代表你带上EEG设备的那段时间的水平,而真人是会学习和成长的。如果想让这个思维模型像真人一样,在经历各种人和事之后,思想和心理也跟着变化成长,那人们就必须让其具备“记忆”和“反思”的能力,让其能够通过一次次“前车之鉴”完善自己。
“人是所有社会关系的总和。”近期,新加坡南洋理工,商汤科技,上海 AI 实验室共同推出的一个项目「Digital Life Project」(简称DLP),可以说忠实地践行了这一思想。
简单来说,SocioMind就是一个智能社交系统,能让虚拟角色(数字生命)根据过去的经历和对话,模拟出具有人类特征的社交反应和情感变化。
就像我们在现实中,与各色人等打交道多了,就逐渐学会了为人处事之道,知道如何应对不同的社交场景,SocioMind也在帮助虚拟角色“学习”如何在虚拟世界里,怎么通过一次次的交流,变得更像个真实的人。
首先,SocioMind会根据角色的“背景故事”来塑造其个性。相当于是各类RPG游戏里的“创建角色”的环节,这一步决定了“数字人格”各方面的基础值,例如一个乐观的角色可能会积极的态度,一个内向的角色可能会更加谨慎。
之后,SocioMind为每个虚拟角色构建了一个记忆系统,记录角色在互动中的经历,以及基于这些经历产生的想法,相当于是让角色有了个“聊天记录”。
虽然嘛,聊天记录这东西很多系统都有,但SocioMind关键的地方,就在于它不仅会保存这些记录,还能进行深度理解与上下文关联。
最后,更关键的是,基于这样的深度理解,角色还能通过一系列复杂的算法,衍生出动态的适应和学习机制,而非公式化的机械反应。
但现实中的人性是和复杂的,假设A是一个宽容的角色,她可能刚开始会反感,但随着时间推移,反感就没那么强烈了。
如果A在争论后得到了朋友的安慰,或者A自己反思后,认为争论是不必要的,那么她对B的态度可能会有所缓和。
这个模型,就像一个不断生长,不断分叉的树枝,这棵树的每个分支代表了角色在社交互动中的一个可能的路径或结果。
与完全模拟人脑神经元交互的方式相比,这种基因社交理论的技术路径,成本要低太多,可行性也要高太多了。
加上前面提到的DeWave技术,人们几乎就有了一套将思想翻译、导入、建模并且让其“活过来”的完整技术路径。
不过,话说回来,比怎么实现“数字生命”更重要的,是实现了数字生命以后,它对人类究竟有什么意义?
在电影、游戏、小说等领域,这些没有肉身,不会疲劳的数字生命,可以作为互动角色参与创作,提供更加个性化和另类的体验。
其二,从更深、更远的层次来看,这样的“数字备份”,实际上可以当类的“集体智慧库”的组成部分。
Copyright © 2020-2025 im电竞·(中国)官方网站 版权所有 非商用版本陇ICP备20000903号-1 Xml网站地图 HTML地图 txt地图