普罗米修斯视觉:对标杀手级应用ChatGPT,用体积视频颠覆元宇宙

lhw 2023年3月13日09:02:24
评论
摘要

“五年前我去了北京亦庄的京东方研发中心和工厂,他们当时在展示一个柔性屏。当时我觉得他们是做了一个前沿的研究仅仅用于展示。但事实上,今天高端手机折叠屏已成为标配。”当谈及技术改变生活时普罗米修斯视觉的董事长孙伟教授告诉ARinChina。

“五年前我去了北京亦庄的京东方研发中心和工厂,他们当时在展示一个柔性屏。当时我觉得他们是做了一个前沿的研究仅仅用于展示。但事实上,今天高端手机折叠屏已成为标配。”当谈及技术改变生活时普罗米修斯视觉的董事长孙伟教授告诉ARinChina。

在孙伟教授看来,当技术逐渐成熟之后,一定会出现很多颠覆性的应用,体积视频也是如此。尤其是在见过ChatGPT带来的不亚于工业革命的技术之后,他坚信变革性的未来就在眼前。
不同于传统的二维视频是由每秒30张静态图片通过连续切换来形成的动态画面,体积视频则是由每秒30个3D静态模型通过连续播放而构成的三维视频。就如同1837年前人类用绘画、雕塑记录世界,1837年后用照相、2D静态记录世界,1896年后用2D动态电影记录世界,电影的展示形式是视频, 而现在则可以用3D动态来记录世界。“3D动态体积视频的出现颠覆了现有的普通视频,是未来视频技术的趋势。”孙伟教授表示。
每一项新技术的出现,都改变人类现有生活。然而目前体积视频的应用场景多为游戏、虚拟演唱会、虚拟直播等少数领域,还未大面积普及,主要受限于拍摄需要到专业拍摄棚完成不方便,以及较高的拍摄制作成本。基于此,ARinChina与孙伟教授深入探讨了体积视频的技术难点以及发展前景。
普罗米修斯视觉:对标杀手级应用ChatGPT,用体积视频颠覆元宇宙

普罗米修斯视觉董事长孙伟教授

每一项新技术的诞生都改变人们的现有生活,“体积视频”这项技术具体体现在哪些方面?在过去一年,普罗米修斯视觉有哪些突破性发展?

孙伟教授体积视频是由每秒30个3D静态模型构成的三维沉浸式视频来刻画客观世界。体积视频代表了下一代视频技术,将颠覆现有的普通视频模式。
我们刚刚和全世界最大的显示屏制造商北京京东方达成战略协议,他们最近成立了裸眼3D显示事业部,就是沉浸式3D视频。京东方认为,5年内裸眼3D显示屏会成为手机的标配。
裸眼3D显示屏每台只需要增加100多元人民币,事实上目前投入使用,成本上已不是问题。遗憾的是,沉浸式3D视频内容制作是挑战。我们研发的体积视频摄制棚可以通过拍摄方式,大规模、低成本来制作沉浸式视频。但相对普通视频,还是更昂贵和不方便。
至于突破性的发展具体体现在三个方面:
一是2022年夏天,普罗米修斯视觉技术的硬件和软件在过去的4年进行了第14次重大迭代,迭代后模型技术指标达到世界级水平。可以理解为,每秒30帧,每一帧是一个模型,模型是由10万个三角形面加上4K的贴图来完成的技术指标。当用二维视频来描述体积视频的时候,我们的品质相当于达到了2.5K视频标准,而一般2K视频标准在手机上就完全可以接受了。
二是在2023年3月底我们将一个庞大、昂贵的摄制棚,做成相对较小且较便宜的摄影棚,使得它更为普及化,更方便被接受。因此普罗米修斯视觉和一家头部企业达成合作意向,计划利用双方的资金和渠道把几百个体积视频拍摄棚部署到中国100万以上人口的社区,从而快速抢占市场。
三是完成了微信小程序和H5页面程序的测试和使用。体积视频是三维沉浸式的数字资产,接入小程序后,传播变的更方便。
普罗米修斯视觉:对标杀手级应用ChatGPT,用体积视频颠覆元宇宙

作为普罗米修斯视觉的核心技术,“体积视频”的难点和突破点在哪里?

孙伟教授体积视频技术门槛极高,它实际上是把例如100台摄像机拍摄的二维视频,通过计算机视觉和人工智能的算法,构造成高精度的模型序列。可以说,普罗米修斯视觉本质上是一个算法公司。虽然拍摄棚的工程构造部分也属于世界级难题,但算法问题才是根本难题。
最近爆火的ChatGPT,是一个比现象级成功还要重大的成功。我非常认同大家说它是一场工业革命,与电的发明、互联网的发明在同一个数量级上。而体积视频的重要性,我想也许会不亚于ChatGPT。

普罗米修斯视觉探索“体积视频”领域长达十年之久,对行业发展有什么贡献?

孙伟教授普罗米修斯视觉的CEO张博士十年前就开始研究体积视频,但我们的体积视频达到商用标准,也就近一两年。当视觉品质没有达到2K的时候,任何的应用基本上都没办法采纳。在最近一年达到2K以后,我们与娱乐行业展开合作,比如说和头部的湖南卫视、快手等推出的元宇宙演唱会。这是一个非常好的苗头:新的媒体格式,配合上娱乐内容,为消费者喜欢,很快就会得到普及。
普罗米修斯视觉:对标杀手级应用ChatGPT,用体积视频颠覆元宇宙
回想30年前的视频,西方排除了中国做了视频标准,中国的视频软硬件厂商都在支付授权费。体积视频目前也是如此,美国成立了一个VFA体积视频格式协会,目前协会中的30多家企业没有一家中国企业,他们的目标是打造体积视频的新标准,我国或有可能再度处于被卡脖状态。因此,倪光南院士呼吁打造体积视频的中国国家新标准。目前,普罗米修斯视觉技术正着力于打造中国体积视频联盟和中国标准。

“体积视频”作为元宇宙的重要组成部分,在您看来目前我们据真正的元宇宙时代还有多远?

孙伟教授元宇宙是要建立一个虚拟和现实的两个平行空间,虚拟空间是一个赛道,另一个赛道是要写实。在虚拟空间内写实,是元宇宙最大的挑战。

春节前,普罗米修斯视觉完成了元宇宙会议和教育实训平台,目标就是解决沉浸和写实问题。解决方案是通过体积视频的拍摄,直接把作为数字资产的人放到元宇宙空间中。

普罗米修斯视觉:对标杀手级应用ChatGPT,用体积视频颠覆元宇宙

这个实训平台是在PK腾讯会议、阿里钉钉会议等头部会议和教育系统。优点在于在元宇宙会议系统内,所有人能够沉浸式的交流和观看。CHATGPT 的出现使得每个人都在问我们是否能够驱动我们写实的3D沉浸式数字孪生人。因此团队正在做人工智能文本驱动的体积视频,输入文本,输出写实的人的动作(当然是3D和沉浸式的)和语音。如果成功,这是一场巨大的颠覆。今年下半年,我们来见证奇迹出现。

如果AI文本驱动写实的体积视频人研发工作完成以后,在加上个性化的CHATGPT,某种意义上来说,在元宇宙中人可以得到永生 – 社会属性的“你”已经完全不需要你了。这已经成为看得见的未来。 

2023年是各行业蓄势待发的一年,普罗米修斯视觉在新的一年有哪些挑战与规划?投融资方面是否有新的进程?

孙伟教授目前我司正在开放下一轮融资,且已有若干投资机构显露意向。2023年除了与一家超高流量的公司合作策划元宇宙演唱会和继续把视频品质提高到3K、4K之外,最重要的目标是要完成AI文本驱动的体积视频数字孪生人。毫无疑问,这个目标是世界级的超级难题,所以希望也能和大厂合作。
我们的愿景:个人数字资产、元宇宙可以进入日常生活和工作。黑科技一定要服务于广大的消费者,转化出价值来,而这个部分是最困难的,尤其是在大家都没有听过、也没有见过的情况下。我现在像个牧师布道一样,告诉大家什么是体积视频——如何看、如何用等,希望我这颗星星之火可以形成燎原之势。现在国家推出以元宇宙为明确目标的产业激励政策,借此东风我们可以更好、更快、更高的去发展。
投稿:tougao@arinchina.com   
稿件/商务合作: Vicky(微信 ARC-vicky)电话:18700987744
创始人:张明军(微信 13720775110)
更多精彩内容,请关注ARinChina微信公众号(ID:X增强现实)
版权申明:本文为.ARinChina原创,任何第三方未经授权不得转载。如需转载请注明转载来源、不得擅自更改内容,违规转载法律必究
weinxin
我的微信
这是我的微信扫一扫
广告也精彩
lhw
  • 本文由 发表于 2023年3月13日09:02:24
  • 转载请注明:https://www.arinchina.com/18445.html
广告也精彩
匿名

发表评论

匿名网友 填写信息

:?: :razz: :sad: :evil: :!: :smile: :oops: :grin: :eek: :shock: :???: :cool: :lol: :mad: :twisted: :roll: :wink: :idea: :arrow: :neutral: :cry: :mrgreen: