杨震:让智能和算力真正成为新质生产力
专题:2024中国高新技术论坛
“2024 中国高新技术论坛”于11月14日在深圳举行。北电数智CMO、战略与市场负责人杨震出席并演讲。他表示,希望通过北电数智提供的平台和产线,让广泛的企业能勇敢的把人工智能使用起来,真真正正形成新质生产力。
以下为演讲实录:
杨震:非常开心有这个机会在高交会的平台上跟大家分享一下北电数智对新质生产力的一些理解以及北电数智在新质生产力方面做的一些事情。
刚才两位院士已经对人工智能算力以及大模型提出了自己的观点,也提出了算力是核心竞争力,模型是引擎。下一步就是如何把算力、模型这些人工智能时代的东西变成新质生产力。
回头看人类历史过程中,尤其是近代,无论是蒸汽机、电力、计算机一直到互联网,都属于通用技术的范畴。每一次通用技术的出现都改变了整个社会的经济结构、生产模式,带来了一个大的跃进,确实成为了生产力。但就像刚才谢总分享的,我们如果想让它变成新质生产力,还有蛮多路要走。以电为例,发电机出现后,直到电力进入工厂,全面替代蒸汽动力,花了50年时间。为什么?因为算力的出现、模型的出现、人工智能的涌现,北电数智认为它是替换了一个动力源,谢总也好,北电数智也好,我们致力于把生产工具和生产系统也替换掉,这样才能实打实的把新的动力源转换成生产力。
我们就不说上世纪50年代达特茅斯后的计算机,个人计算机1980年代已经出现了,但真正进入企业带来效能提升也花了二三十年时间,高院士刚才提到2006年深度神经网络提出,2012年AlexNet,再到2022年的ChatGPT,但系统性的变革在哪里?这是蛮关键的一件事情,如果没有这个系统性变革,依然是无法解决人工智能能赋能千行百业带来推动数字经济发展的根本性原因。
人工智能这件事情,在全世界大家的步伐都差不多,虽然美国相对走入收敛期,但目前依然在模型层(所谓操作系统工具层)发力,左边的柱子是目前的业绩收入,但即便是模型层占人工智能产业只有7%,主要在芯片产值层做布局投入。
今年早些时候,有大模型厂商坐在一起讨论说大模型落地究竟先是To C还是To B。刚才讲到几个通用技术,To B端落地应该是率先的,而且确实能够推动整个社会发展。这时候又提出一个问题,To B目前大模型还在做点状应用,并没有形成系统性的工程。聊天机器人可能对个人来说更有用,但并不能真真正正解决企业的问题。
之前参加一个信创的会,我们听到邬贺铨院士提到说中国的大型企业搞信创有三个难点:不敢、不会和不愿。不会更多在硬件层、系统层。不敢主要在数据的问题。虽然刚才提到国内也逐步进入收敛期,但如果看到算力层,目前国内的GPU厂商还有将近30家,大部分厂商提供的芯片数据依然是单片的实验室数据,缺乏集群数据和实际场景使用中的表现数据,就会造成我们想用国产芯片、国产GPU,但选谁家的,怎么用,就是核心问题。二是模型层,算力相对结构性有些缺乏时,如何有效支持模型训练呢?上个月参加一个金融讨论,很多国内银行已经开始尝试用大模型支持很多金融场景。但由于算力有限,很多任务都在排队,这也是核心问题。三是数据问题,9月以来国家数据局国务院推了一系列政策,从早期的“20条”到现在鼓励引入市场化机制,共创商业模式,都希望让数据释放出应有的价值,但安全合规的问题、隐私的问题以及公平定价的问题依然制约着这部分还是在摸索和探索当中。
我刚才跟各位分享的是系统性的问题、工具的问题,是要解决不敢和不会的问题。愿意不愿意的问题,除了资金问题、政策问题,还有企业自身策略的问题,怎么思考人工智能和现有业务之间的结合点。
中国目前还没有真真正正进入收敛格局,相对离散。当它离散时就造成大家选芯片难、选模型难、选工具链更难。
国产芯片的状况,院士和专家都提到国产芯片和国际上芯片相对表现有一定差距,在这个情况下,再加上台积电又停止了7nm的供应,整体算力的量也会受牵制。如何让不同的芯片集群协同作战,包括和国内存量的英伟达协同作战,能有效支持模型的服务和训练。
大模型的工程也有如何高效调度计算资源,如何提升计算精度,如何在复杂的分布式情况下平衡不同硬件资源,让它有效支撑。最后是每一家芯片都有自己的生态,异构的生态会造成同一个数据中心里不同的算力集群依然在烟囱里待着,不能协同作战,这都是要解决的问题。
北电数智到这个月应该是第15个月,但我们是一家人工智能国企,我们看到算力确实是核心竞争力,但如何能够解决结构性的矛盾,如何能够有效地让国产算力以及国产算力和存量英伟达协同作战起来,是北电数智“前进·AI异构计算平台”正在解决的事。这里面有蛮多技术,一言而蔽之,我们可以让同一个数据中心里不同算力集群协同作战,大家可以把一个智算中心看作一块巨大的虚拟GPU。
今年3月GTC发布会时,说如果都用英伟达的卡,一个数据中心就是一块巨大的虚拟GPU。不同的是,面对异构的条件时有非常多问题要解决。比如要统一通信,比如要全面普适性的补齐算子库,以保证不同集群之间能够协同作战,向同一模型提供服务。比如也要有非常多灵活的调度策略,确保当我是一块巨大的虚拟GPU时,解决陈院士说的“老三高”问题。传统智算中心、数据中心是用裸金属租赁的方式,这时候有大量算力冗余,非常浪费和可惜。这也是我提到的结构性矛盾的问题。当我们把它变成一块巨大虚拟GPU时,大家使用算力时不需要再按台、卡、匹数计费,更多按实际消耗计费。真正让算力变成电力一样实现,同时也不需要考虑是核电还是火电,不需要考虑是哪个集群向你提供的服务。比如模型的A会话调用了两三个集群的能力,B会话又调动了另外集群的能力,但使用者完全无感。这个层面我们尝试解决说不会的问题,就是大家不知道怎么选国产芯片,如何选择最好的国产芯片。
当我们实现了不同的算力集群和模型之间的交叉、普适、适配时,进一步解决了和主流开发框架之间的交叉、普适和适配性。非常多开发者在我们的智算平台或者智算云上不用选择底层的芯片细节,依然可以使用他惯用的开发套件平台做他的智能应用。
不敢的问题,就是数据的问题。数据20条解决了确权的问题,最近国家持续推动的政策也提出了可信数据空间概念,要解决数据实际流通和交易的问题。数据的交易量在过去三年非常少,数据交易所和数据交易中心的存在,解决了信息差的问题,大家知道什么样的高质量数据握在谁手里。我们认为之所以数据难以流动和难以交易,最主要的原因是数据作为第五要素,和前面四个要素完全不一样,不具备稀缺性和不可复制性。如果把数据真正交出去,有可能被重复复制,交出去时无法控制使用用途和使用次数。在这个前提下,我们做出的可信数据空间更多是让数据并没有被真正被交出去,而是在这个空间内被使用,可用不可得。同时在这个空间内被使用的前提下,通过区块链技术、数字合约技术,可以有效约定使用次数和用途,给到这个数字定价底层支撑,让双方达成双方都愿意的支付价格,确保数据在某种意义上被流通和使用起来,也配合了隐私计算、同态加密、联邦计算,包括TE技术,让数据不裸奔,可用不可见的状况,保证了数据的隐私和安全。
我们也希望通过这样一个产品,无论是企业级还是行业级或者区域级的,能够把数据不敢被使用、不敢被交易的状况解决掉。
这是北电数智红湖·可信数据空间整体的架构(见PPT),无论是底层基础设施层还是技术层和平台层、空间层,我们也提供了全栈、可信、自主可控的信创平台,能够让人工智能尤其是我国特色的信创人工智能有一个生产系统或者生产线来使用。
最后快速说一下北电数智。
我们是只成立了15个月的人工智能国企,由于我们做了AI全栈布局,算力层、算法层、数据层,目前也在做一些垂类模型工作,比如今年4月我们揭榜挂帅了北京政务大模型,我们和数家全国医院和三甲医院联手做专科医疗辅助助手医疗模型等等方面。我们把建设数字中国作为我们这家公司的使命,同时也以总书记对科技企业提出的“三性”(原创性、颠覆性、引领性)作为我们自身的要求。
我们是北京电控旗下企业,北京电控可能很多在座嘉宾听说过,它也孕育出像京东方、北方华创这样在80年代解决了“卡脖子”问题的企业,我们也希望在人工智能时代能够承担起这样一个时代的重任。
刚才提到北电数智的布局与能力,也源于我们承载了比较多国家和北京市的重点项目,比如12月底建成达产的北京数字经济算力中心,是目前北京五环内唯一的智算中心,整体是五层建筑,一层做了全面开放设计,里面有算力剧场、展厅、联合实验室和协同办公空间,免费提供给人工智能生态伙伴使用,希望在这里有一个产业聚集和产业展示的空间。同时我们也承载了先进计算迭代验证平台重大项目,目的也是让国产芯片从单片可用到集群好用,同时提供“以评促用”让大家知道什么样的场景、什么样的用途可以用什么样的国产芯片。
我们通过提供了全栈的AI产品,有效搭起人工智能时代的设备和生态产线,让智能和算力真真正正能成为新质生产力,让每一个企业都能有自己的AI工厂。
最后稍微讲一点不愿的问题。最关键的是我们究竟是站在现在看未来,看人工智能能给我哪些,还是要站在未来看现在,重新思考我从事这个业务有没有可能被重塑,要不要重新思考这个商业模式和我为市场以及客户提供的价值。
以上是我的分享,也希望借这个机会,介绍北电数智提供的平台和产线,让广泛的企业能勇敢的把人工智能使用起来,真真正正形成新质生产力。感谢各位!
新浪声明:所有会议实录均为现场速记整理,未经演讲者审阅,新浪网登载此文出于传递更多信息之目的,并不意味着赞同其观点或证实其描述。
最新评论