网易伏羲杨新伟:数据采集对工业大模型至关重要
7月6日至8日,以“智联世界生成未来”为主题的第六届世界人工智能大会
7月6日至8日,以“智联世界生成未来”为主题的第六届世界人工智能大会(简称WAIC)在上海举办。今年大会上,“大模型”成为大众关注的焦点。日前,网易伏羲工程机械产品负责人杨新伟接受上海证券报记者专访,他认为,相较于大众熟知的语言大模型,工业类大模型有望更快落地。同时他也表示,数据采集对工业大模型至关重要。
(资料图片仅供参考)
上海证券报:今年展会上我们看到一系列的大模型产品,但主要还是语言类的,工业类大模型大家了解不多,能否和我们介绍一下这两者的区别?
杨新伟:工业大模型和传统的语言类大模型区别还是比较大的。最主要的区别是,语言类大模型主要集中在文本领域,核心能力在于一些语义识别、语义理解上。但工业大模型其实是面向工业场景,那在这个领域,我们做得更多的可能是比如液压控制模型、运动控制模型、视觉感知模型等,它是针对特定工业场景所做的一系列特定优化。
上海证券报:统称为大模型,他们有哪些共同点?
杨新伟:一方面是“大”,包括我们常说的参数,基本都是百亿、千亿级的,然后训练它消耗的资源也比较多。另一方面,通用推理性更强,具备生成能力。也就是说,他不再局限于特定场景,生成特定的回答,而是根据不同的场景给出不同的答案。
上海证券报:也就是我们常说的,大模型的答案不是预备好的,都是即时推理生成的,对吧?
杨新伟:是的。具体到工业大模型领域,比如说我们的机械设备都由液压装置操控,但液压状态其实每时每刻都是不同的,液压本身是有损耗的,这意味着液压模型是不断变化的。所以我们的大模型需要针对不同的场景,不断地去学习,甚至每一天它的这个液压模型都会随着当天的状态实时反馈,实时演化,它的模型是不断迭代的。
上海证券报:所以相对于语料是训练语言大模型的数据,机械参数就是训练工业大模型的数据?
杨新伟:可以这么理解。
上海证券报:我们都知道数据对于大模型训练至关重要,目前国内工业领域,相关数据充足吗?
杨新伟:坦白说,目前工业领域数据量还是相对缺乏的,因为它需要从真实机器上去采集。目前我们有几种方式去弥补,一种方式是在工地上去安装大量传感器,去收集更多的数据。另一方面则是基于我们伏羲数字孪生系统。我们在整个仿真环境里去生成挖掘机、装载机,然后把一些从真机上收集到的数据,在仿真环境下,让它们在不同场景任务下去训练学习,从而进一步收集数据。
上海证券报:以网易伏羲为例,目前国内工业领域大模型落地情况如何?
杨新伟:工业设备之间差异很大,不像我们语言大模型,不同语言之间存在“迁移”能力,工业大模型还是需要根据不同场景进行调整。目前我们是利用去年积累的一个在挖掘机领域上的大模型,使用了我们 AOP的面向智能体编程技术,用了4个月的时间,把已有大模型迁移到无人装载机上。需要说明的是,在完成前期工作后,真正适配阶段其实只用了 5天时间,就能把过去液压的数据、感知的数据、运动控制的数据完整地迁移到一台物理装载机上。目前,我们跟中建八局一起在沪通铁路的搅拌站上已经完成初步验收和应用。
(文章来源:上海证券报·中国证券网)
关键词:
7月6日至8日,以“智联世界生成未来”为主题的第六届世界人工智能大会
直播吧7月9日讯据意大利记者罗马诺的消息,伯恩利将在未来几小时与多特
据美国《华盛顿邮报》,美国总统拜登已经批准向乌克兰提供美国的集束弹
女道士118岁返老还童,科学家迄今为止找不出合理的解释,在科技发达的今
阿玛尼私藏系列【苏州牡丹】苏州牡丹?牡丹在什么地方呢?我只闻到了一
促进高校毕业生等青年就业,政策保障持续发力。近日,各地各高校持续开
视频加载中 世界赛事名城建设点燃了成都的活力,特别是成都大运会的
今早马刺官宣和主教练波波维奇续下长约,名记Woj报道称波波的合同是5年
新华社喀土穆7月8日电苏丹卫生部8日在社交媒体上说,当天清晨,有22人
1、深圳市交运工程集团有限公司,成立于1993年,注册资金1亿元。2、公
如何做好风险控制?“股神”巴菲特这3个方法,半个世纪依然好用,沃伦·
最近,寰球公司的领导阵容变动以及涉及总经理胡继勇和其下属董小姐的“
据《全市场》报道,马竞前锋莫拉塔希望加盟米兰尽快解决自己的未来问题
在今年燃油车降价的背景之下,新能源汽车依然的快速发展,现在基本不管
当五季与北宋后期,有两位大文学艺术家,一是南唐后主李煜,一是北宋徽
1、你好。2、建筑面积,是地产名词,与实用面积及实用率计算有直接关系
8日下午,韩国多个党派、社会团体在韩国首尔市中心的光化门、南大门及
(谭镕记者宋薇萍)随着《浦东新区无驾驶人智能网联汽车创新应用规定》
今天上午,成都大运会在成都市内举行了第二个火炬传递日活动。7月28日
央视网消息:武夷山独特的自然环境和舒适的气候成为许多珍稀野生动物的