正在AI海潮席卷之下,一个不雅念似乎已深切:CPU的时代曾经过去,现正在是GPU的全国。如许的不雅念也培养了现在英伟达如日中天的声望。我们能从中找寻谜底……AI虽做为智能化成长的鞭策力,但没有法子替代所有的计较需求。分歧的支流算力架构各有劣势,却也会存正在天花板,这并非手艺上的掉队取先辈之争,而是分歧手艺方案对特定问题域的‘适配性’问题。正在市场中,单一的GPU手艺线已无法满脚日益复杂的计较需求,而正在天气景象形象、生物医药、能源勘察等分歧范畴,我们都发觉HPC+AI带来质效的提拔。大学高机能计较研究所的学者、国内大模子范畴晚期研究取生态扶植的主要鞭策者之一的正在本年7月的这句论断,归纳综合了算力基石对于人工智能的主要性。所谓HPC是指操纵超等计较机或大规模计较集群,正在极短时间内完成单机无法胜任的复杂计较使命。它的焦点方针是“用并行计较换取时间”——把大问题拆成无数小块,让成千上万颗 CPU/GPU 同时运算,几天以至几小时就得出成果。早正在大模子呈现之前,HPC就曾经正在用算力处理良多复杂问题,但因为其架构并非为生成式大模子设想,CPU正在此中仍然饰演着焦点地位,这正在GPU从导的大模子时代天然会带来疑问:中国已经沉金投入的HPC扶植过时了吗?它取AI,事实该当若何融合?是简单的算力叠加,仍是深度的架构变化?带着这些问题,我们取太初(无锡)电子科技无限公司(以下简称“太初元碁”)首席产物官洪源进行了一场对话。
做为HPC+AI融合线的果断提出者和一线实践者,洪源的分享为我们揭开了智能计较财产正在喧哗之下,一条清晰、务实且充满决心的破局之。
而长久以来,业界对HPC取AI的融合之也着质疑。一些权势巨子声音,例自国防科技大学的专家就曾指出,HPC以CPU为焦点,逃求极致的双精度取低延迟,而AI则依赖GPU生态,侧沉低精度取高吞吐,两者手艺线存正在“天然矛盾”。但当GPU从导一切的概念几乎成为行业时,洪源却给出了一个源自财产一线的焦点判断:“HPC+AI融归并非凭空设想,而是客户实正在需求驱动的成果。”洪源认为,“归纳综合起来有三点:第一,若何获得相对低成本的算力;第二,这些算力能不克不及处理我的最终问题;第三,用算后能不克不及带来新的价值。”起首是当前最为人熟知的GPU(图形处置器)。它以图形衬着起身,凭仗数千个并行计较焦点,正在处置浮点数据方面能力强大,天然适合AI锻炼中海量的、布局单一的矩阵运算。为了更好地支撑通用计较,业界逐步成长出GPGPU(通用图形处置器),即削弱保守GPU的图形显示能力,将资本全数投入到计较中。然而,这条看似平坦大路的径,其现忧同样较着。因为GPGPU并非从通用计较原生出发,而是正在保守GPU架构上“去图形化、强计较化”,导致其正在功耗、内部指令安排等方面存正在先天的取冗余。对于国内玩家而言,选择类CUDA系统虽然能借帮其成熟生态快速迭代,但也意味着产物径趋同,正在焦点安排取驱脱手艺上难以脱节依赖,其成长上限被牢牢锁定。其次是ASIC(公用集成电)。这类芯片为特定算法(如音视频解码)量身定制,正在特定场景下能做到机能最优、功耗最低,很是适合AI推理等固化场景。但其“成也萧何,败也萧何”——架构被固化正在晶圆中,矫捷性极差。一旦算法变动(如Transformer布局变形、激活函数变更),芯片几乎无法适配。对于AI这种手艺快速演进的范畴,押注ASIC无异于一场豪赌,贸易化风险极高。这两种支流架构的流行,催生了一种遍及的行业思维:即认为大大都复杂的计较问题,都能够通过简单地“AI化”(用AI算法沉构问题)或“GPU化”(用GPU硬件加快处理)来应对。“这并非手艺上的掉队取先辈之争,而是分歧手艺方案对特定问题域的‘适配性’问题。”洪源的这句话点了然焦点。很多环节行业的焦点计较使命,并不克不及被简单地“AI化”或“GPU化”,其计较流程往往是 “强逻辑、高精度、复杂流程” 取 “大数据量、模式识别” 的夹杂体。具体到特定使命,从计较精度看:保守科学计较(HPC)常要求FP64双精度浮点运算以成果的精确性,而支流AI锻炼则遍及利用FP16/BF16单精度甚至INT8整型来提拔计较吞吐量。而从使命流程看:GPU擅长“一张大网算到底”,但对于需要屡次逻辑判断、使命安排和高频交互的复杂流程,其内部指令安排能力相对较弱。这时,CPU强大的通用计较能力和矫捷的节制逻辑反而更具劣势。华为可托计较首席科学家金意儿传授正在2024年OpenHarmony手艺峰会上也表达了雷同概念:“将来芯片系统最次要的模式,将是集成通用多核处置器及公用加快处置器,同时获得通用途理器的矫捷性和公用加快器的机能效率。”这也意味着,不走保守GPU线,并非无法之举,而是正在深刻理解客户需求后,自动选择的一条手艺上更优、更具顺应性的道。太初元碁选择并走异构众核的手艺线,打制通用高机能计较芯片,将HPC取AI深度融合。异构众核成立了一套更立体化的计较逻辑,适合各类通用计较场景,满脚人工智能计较效率的同时,也能支撑高精度科学计较。异构众核是将分歧架构的计较焦点根据相关手艺尺度和规范无机内正在融合正在一颗芯片上,使命由最合适的工做单位来承担,分歧异构内核之间实现协同计较。其正在建立公用范畴最大劣势正在于可按照范畴的使用需求正在芯片的系统架构设想中,矫捷的分派通用计较取加快部门的配比,而且按照范畴使用的特点设想为某个特定的范畴问题设想公用的计较架构,同时正在编程性上通过同一的编程模子实现异构系统的无缝整合。对于开辟者而言,异构众核架构的劣势正在于计较使命的拆解和并行处置上的便当性。基于严谨尺度系统的设想,分歧处置器单位之间能无机融合和对接,降低产物开辟门槛。同时,为算法开辟人员供给了更多的计较使命分化可能性,全栈开源的根本软件生态为手艺立异供给了更高效的平台。异构众核的诸多特点使得太初元碁自研的AI芯片正在机能取功耗、产物开辟、差同化立异取更改矫捷性以及生态建立等方面展示出较着劣势。洪源对察看者网注释道,正在很多前沿范畴,单一的手艺线已无法满脚日益复杂的计较需求,若何可以或许高效、并行去进行海量数据处置,成为很多行业、客户关心的问题。“正在高机能计较的场景里面,其实客户也有良多工智能计较的这种连系的需求。”天气景象形象范畴能够认为是高机能计较扎根最深的范畴之一,该范畴常借帮高机能计较来开展科学研究。AI大模子引入后,短临预告(一般为将来3小时的气候预告)的预测耗时能够从过往的6小时缩短到1小时,这是HPC+AI提拔效率和精确度最曲不雅的一个使用范畴。正在生物医药范畴,新药研发的“双螺旋”正正在构成:AI大模子操纵其强大的模式识别能力,从数以亿计的组合中筛选出最具潜力的候选药物,将过去需要数年的筛选工做缩短至几周以至几天;而被选中的“天选之子”,则需要通过HPC进行切确的动力学模仿,预测其取靶点卵白的连系结果和潜正在副感化。AI的广度取HPC的深度正在此完满连系。正在能源勘察范畴,AI正正在成为地质学家的“透视眼”。通过进修海量的地动波数据,AI可以或许以史无前例的精度勾勒出地下深处的地质构制。而一旦确定了潜正在的油气藏,HPC便会接管,通过复杂的流体力学模仿,优化钻井方案和开采策略,最大化资本操纵率。“这些其实都是有高机能计较和人工智能计较连系的如许一个融合的需求,”洪源总结道,“AI虽做为智能化成长的鞭策力,但没有法子替代所有的计较需求,因而芯片仅兼容低精度能力远远不敷。” 这种来自财产一线的实正在,恰是太初元碁果断HPC+AI融合之的底子缘由。
正在当下的AI范畴,英伟达CUDA生态的强大影响力毋庸置疑,它几乎成为了算力的代名词,让整个行业构成了一种默认的“径依赖”。然而,一个常被轻忽的现实是,英伟达GPU本身的成长就取HPC密不成分,以至能够说,其通用计较能力恰是正在HPC范畴的使用需求下成长强大的。现实上,察看当前市场支流的数据核心GPU,其架构本身就是正在单一芯片上集成了办事于AI的低精度张量焦点(Tensor Cores)和HPC所需的高精度计较单位。这恰好从侧面印证了HPC取AI的融归并非,而是行业成长的必然趋向。对此,洪源认为,任何强大的生态都非一日之功。“CUDA生态是挺伟大的,但强大的生态也是一步步成立起来的。”他回首道:“早些年它也是这么干出来的,只是后面慢慢构成一个尺度,所有人都环绕它去做的时候,它就能够卖标品了。”洪源认为,中国算力的将来,不该是简单的仿照或依靠,而是要走出本人的道。其实它该当是有它本人的,既兼容并蓄、又有本人特点的如许一个生态。”“兼容并蓄”,意味着卑沉用户习惯,正在手艺上兼容现有支流框架,降低开辟者的迁徙成本。“有本人特点”,则意味着敢于正在支流视野之外,按照财产的实正在需求,摸索更高效、更自从的手艺径。太初元碁的“异构众核”架构,以及取龙芯中科合做2小时适配DeepSeek的成功实践,恰是这一的活泼注脚。它证了然正在CUDA生态之外,通过软硬件的深度协同,同样可认为顶尖大模子供给强大的算力支撑。这不只是一次手艺上的冲破,更是建立全新自从财产生态的一次环节摸索,它向业界展现了另一条道的可能性。
“客户接管新的处理方案,是需要一个过程的。”洪源坦言。他认为,国产算力市场的心态演变,清晰地划分为三个阶段。第一阶段,是“国产替代”政策驱动下的强制利用。正在这一期间,用户的选择更多是出于计谋平安考量,对机能和易用性的疑虑遍及存正在。紧接着,是国产厂商奋起曲逃、机能逐渐跟上的第二阶段。跟着手艺的不竭迭代,国产算力起头正在越来越多的场景中证明本人“能用”且“够用”。而今天,市场正全面进入第三阶段——机能平替下的高性价比阶段。“越来越多行业,越来越多的用户,包罗客户的决策人,他认识到我们本人的处理方案是可以或许满脚需求的。”洪源判断道。这种心态的改变,能够用一个词来活泼比方,那就是“实喷鼻”。但“实喷鼻”的体验远不止于采购成本,更表现正在处理数据核心扶植的“不成能三角”上。洪源指出,特别正在如许的大城市,客户对算力密度、能耗(PUE值)的要求越来越高,扶植成本却要严控。对此,太初元碁推出的高密液冷处理方案,恰是破局的环节。
这并非简单的手艺堆砌,而是一笔需要算“总账”的经济学。“初期采办和液冷扶植成本可能会有一点上升,”洪源坦诚,“可是从将来5到10年的持久运营成本和单元算力成本来看,劣势是庞大的。” 高密度摆设节约了贵重的机房空间,而液冷手艺则无效处理了散热难题,大幅降低了PUE值和电费开销。回看近两年太初元碁的成长之,营业取订单即是市场对其最大的必定。公开材料显示,太初元碁已参取多个国度公共算力根本设备扶植,包罗盐城超等计较核心、蠡湖将来城算力核心、延安智算核心等。日前,央视《》对于中国联通三江源智算核心项目标报道中,浩繁拟签约名单里也呈现了“太初”字样。同时,察看者网领会到,截止到本年第三季度,太初元碁拿下多个贸易订单,总金额已跨越3亿元。从营收增加来看,太初元碁近年年均营收增加均跨越100%。
取上层大模子“以周为单元”的疯狂迭代比拟,底层的算力财产遵照着判然不同的成长逻辑。当模子厂商为了参数量和排行榜而陷入“迭代焦炙”时,洪源和他的团队却显得非常和果断。“良多大模子卷参数,但你卷完之后到底用正在哪?有人说不主要,先把参数提上去,跑分不克不及输。”洪源一针见血了模子层的急躁。他认为,这种模式不合用于算力行业。“芯片一个设想就是一两年,再出来产物周期一两年,整个三四年、四五年就过去了。这个行业其实就不适合赔快钱的人来干。”这种“慢”,并非痴钝,而是一种必然的厚沉。算力是基石,逃求的是极致的不变、能效和长周期的经济性。它需要的是计谋定力,而不是和术跟风。洪源将这种定力总结为“聚焦使用”。无论是取东润数字能源合做,将HPC取AI的能力注入新能源电厂的选址、安排和买卖,仍是赋能科研机构进行更复杂的科学计较,太初元碁的每一步都紧紧环绕着“处理实正在世界的问题”。“潮流退去之后,才晓得谁正在裸泳。”洪源的这句话,是对整个算力财产的最好注脚。正在本钱和概念的高潮中,唯有那些踏结壮实打磨产物、深切行业创制价值的企业,才能具有穿越周期的能力。迭代焦炙,回归使用素质,这不只是太初元碁的选择,也应是整个国产算力财产成熟的必经之。
放眼当下的智能计较市场,呈现出一派“百家争鸣”的繁荣气象。从太初元碁的HPC+AI,到其他厂商的多元化摸索,分歧的手艺线并行成长。对此,洪源表示出和乐不雅。“生态和市场脚够大,其实是能容得下行业里面优良的企业一路去做一些工作的。”他认为,当前阶段,每家企业起首需要找到本人最擅长的发力标的目的,明白本身劣势取定位。“这是大师协同办事客户的根本。”然而,百家争鸣只是过程,而非结局。洪源同样认为,建立同一的财产联盟和行业尺度,是将来的必经之。“我们也不单愿客户要去适配过程,每家就从头适配一遍,其实切换成本也高。”他透露,太初元碁从一起头就开源的线,最终的方针,是殊途同归——配合打制一个强大、协做、繁荣的中国算力重生态。正在对话的最初,洪源对大模子行业的将来给出了本人的见地。洪源认为,当前的文本大模子手艺正趋于不变,而实正的下一个算力需求迸发点,将正在于以视频生成为代表的“多模态”使用。“我小我的判断该当就是正在多模态系统,”他分享道,“将来若是视频可以或许很好的做阐发做处置,以至做合成,这块的算力可能又是一个指数型的(增加)。”这场环绕算力的长征,仍然正在上。而正在这场没有硝烟的和平中,以洪源为代表的中国算力扶植者们,正以他们的远见、务实取,为将来锻制着最的“中国芯”。
本文系察看者网独家,文章内容纯属做者小我概念,不代表平台概念,不得转载,不然将逃查法令义务。关心察看者网微信guanchacn,每日阅读趣味文章。武契奇:当当代界愈加动荡不安,中国一直是塞方线亿年终,“最爱发钱老板”崔培军:有1块花8毛,不要提前消费。
建湖J9直营集团官网科技有限公司
2026-02-15 08:33
0515-68783888
免费服务热线
扫码进入手机站 |
网站地图 | | XML | © 2022 Copyright 江苏J9直营集团官网机械有限公司 All rights reserved. 