2026世界杯官网 存储加价之后,怎样让AI走向数据?丨ToB产业不雅察
发布日期:2026-05-07 05:36 点击次数:169

国度数据局数据高傲,从2024年到2026年,中国日均Token调用量从1000亿飙升至140万亿(戒指2026年3月),两年增长逾越千倍,而在这组数据的背后,体现了AI正在从实验室里的模子检修,全面参加坐蓐糊口中的应用落地。
往常以“数据保存”为中枢工作的存储建造,如今被赋予了“数据赋能”的全新职责——它不再是被迫承载数据的“容器”,而是主动参与数据处理、解救AI高效运行的“中枢要道”。
关于存储行业来说,这个拐点带来的不是和顺的增量增长,而是一场全面重构。在这场重构的背后,不再是让数据走向AI,而是让AI走向数据。
存储架构迎来“基因重组”
“底本的企业存储是作念数据保护,咫尺AI存储的第一狡计是后果提高——怎样充分自在GPU关于数据的需求,而不让它空转”,海潮信息存储产物部副总司理郭海峰用这么一句话空洞了存储工作的根人道变化。
伸开剩余87%这不仅是产物定位的疗养,而是通盘这个词期间架构的“基因重组”。郭海峰指出,传统企业级存储是“通算架构”——以CPU为中枢,数据需要由CPU进行旅途领会、从内核态进行复制和转发,再传给GPU进行计较。这种架构在服务关联型数据库和传统应用时运行精致,但当它濒临智算期间的GPU集群时,后果极为低下:要是存储成为瓶颈,崇高的GPU就会空转。
数据不错阐述问题的严重性。IBM大中华区存储业绩部总司理吴磊告诉笔者,如今GPU部署动辄百卡、千卡、万卡范畴,投资以亿以致十亿计,“1%的闲置就意味着上亿元的浪费”。无迥殊偶,郭海峰同样曾公开暗意,存储和收罗在通盘这个词智算系统中可能只占5%-10%的本钱,但要是GPU空转,这5%-10%的本钱就会澌灭其余90%以上的投资答复。
为了自在现时企业关于算力哄骗率的需求,存储也迎来了“基因重组”的新阶段。咫尺来看,从软件和硬件两个层面切入,皆不错优化全体存储架构。这个历程中,海潮信息与IBM即是很好的两个方面的代表。比如,海潮信息在其新发布的A9000系列产物中就罗致了“全链路免锁零拷贝的用户态AI原生并行架构”,将数据传输旅途从内核态切换到用户态契约栈,终了端到端的免拷贝,将延伸从传统的毫秒级降至微秒级,单节点带宽达到160GB/s(行业主活水平为60GB/s至80GB/s)。
在软件层面的架构变革背后,暗含着一条更深层的期间干线,那即是KV Cache。在AI推理场景中,为了加快模子反馈、幸免重叠计较,系统需要将键值对缓存保留在高速存储中。但跟着高下文窗口的急剧扩大,KV Cache的范畴仍是远远超出了GPU显存(HBM)和土产货DRAM的承载才能。郭海峰向笔者缜密解说了这一期间逻辑:通过PD隔离(Prefill与Decode隔离),哄骗GlobalCast期间和“双旅途”想象,将适意的带宽整合哄骗,权贵镌汰首Token产生时期。海潮信息公布的数据高傲,通过Agent Memory外置存储架构,A9000可将首Token延伸(TTFT)虚拟97%,Token隐约量提高逾越20倍。
与之相对,米兰MILAN(中国)体育官网IBM则从另一个维度切入。IBM推出的Storage Scale并行文献系统在万卡集群中解救高频的checkpoint数据落盘,确保数据能够在极短时期内写入存储,充分开释GPU的计较后果。
除了“软件”层面的优化除外,IBM还在其自研的第五代闪存中枢模块(FlashCore Module 5)的每块NVMe闪盘上镶嵌一颗专用芯片和高性能处理器,终了硬件级的压缩、去重和加密。吴磊袒露,这一想象不错将压缩比作念到1:5,况且因为压缩在盘上完成,不会对存储抑制器的性能形成影响。
各样期间的变化皆揭示了AI期间存储架构的另一个紧迫宗旨:存储不再只是数据的被迫容器,而是具备感知和计较才能的主动节点。
加价是暂时的,后果优化才是重要
当存储节点不再是被迫容器,而是进化为承载KV Cache、主动参与计较卸载的智能要道之时,业界对高带宽、低延伸存储介质的依赖便呈指数级攀升。这种由架构变革催生的高大缺口,凯旋投射在了上游供应链的产量歪斜与价钱博弈之上。
据多方数据高傲,2026年第一季度DRAM内存合约价涨幅达90%-95%,NAND Flash闪存合约价涨幅达55%-60%。这轮加价潮的凯旋推手是AI——大模子检修和推理需求井喷,DRAM和NAND原厂将无数产能从破费级产物转向高利润的企业级AI产物,TrendForce展望,2026年第二季度NAND闪存合约价将赓续大幅跳升70%至75%。
但吴磊与郭海峰异曲同工地觉得,存储加价是一时的,果真需要存眷的是后果优化。郭海峰提到,有的企业将存储搬动到高带宽决议后,GPU哄骗率提高了15%——“用不到通盘这个词风光10%的钱采购存储,把卡的哄骗率提高了15%”。吴磊则算了一笔更直不雅的账:通过FCM的1:5压缩期间,用户在加价后开启压缩功能,世界杯执行可用容量的单元本钱以致比加价前更低。
可是本钱优化远不单是一个压缩比的问题。存储行业正在经验的,是对“数据应该放在那儿”这一根底问题的从头想考。传统企业级存储中,“热、温、冷”数据分层照看仍是是闇练理念,但AI期间的分层逻辑远比往常复杂。
这时候,五层存储体系也就应时而生了,其出现是AI给存储行业带来的最直不雅的结构性变化。按照业界通行的分类:第一层是HBM(高带宽内存),第二层是土产货DRAM,第三层是土产货SSD,第四层是传统企业级外置存储。而在第三层和第四层之间,咫尺出现了一个“3.5层”——这是一个特意服务于推理场景的外置缓存层。
为什么需要3.5层?郭海峰向笔者解说谈:“3.5层是为了后果,扬弃一定的可靠性,数据比是1:1,大不了数据丢了从头算,但不可捐躯后果。”这与第四层传统存储“数据保护优先”的理念形成了光显对比。无迥殊偶,吴磊也给出了近似的判断:“全用HBM虽然最佳,但HBM太贵了。”在经济学敛迹下,分层是势必遴荐。
而在五层存储体系分层的影响下,“磁带存储”这个“迂腐”的存储期间又一次成为了企业性价比之选。据吴磊先容,往常几年多家大厂已部署EB级以致10EB级的磁带库,包括百度智能云在底层的冷数据存储。LTO定约由IBM、HPE和Quantum联结鞭策,LTO-10已终了40TB原始容量,2.5:1压缩比下可达100TB,畴昔LTO-11可达70TB、LTO-12可达110TB。吴磊提供了一个实用视角:磁带机械臂从最远端捏取数据苟简需要一分五十多秒,但要是一个数据三个月以致六个月才拜谒一次,两分钟的恭候彻底不错收受。
让AI走向数据
这一轮存储行业的变革不单是是五层存储体系所能齐全体现的,而是映射出了一个更为深层的变化,传统的“让数据走向AI”模式仍是不可自在现时用户的需求,让AI走向数据将拔帜易帜。
在传统数据使用模式中,AI应用是“提取方”:应用发起央求,存储反馈。这种模式在小范畴、低频次场景下可行,但濒临EB级数据、百万并发央求时,彻底不可连接。更致命的问题是数据一致性的坍塌。吴磊用一段纯真的比方刻画了这一窘境:“咱们每个东谈主可能好几个TB的像片、视频,企业是几百个TB、几百个PB,以致EB级的时候,哪一个副本数别传出来的是实话,哪个副本数别传出来的是谎话?”
濒临此,IBM给出的处理决议是内容感知存储(Content-Aware Storage,CAS),结合单一数据副本和即时感知数据变化的机制。其核感情念是:数据发生了变化,模子能够即时感知,而不是通过繁琐的副本坐蓐和传输来同步。吴磊强调:“往常部分厂商出于销售目的建议客户扩容升级。存储照看员疲于应付评释和搬动。咫尺有了AI智能体,不错把所少见据分析完,一次性作念出决策,以致不错作念到跨洲的数据搬动。”
这意味着存储的变装从被迫的数据仓库转念为主动的数据编排平台。而这个解题想路似乎仍是行业的一个共鸣。IBM冷漠的内容感知存储核感情念与海潮信息冷漠的“AI Data Platform”想法有着很多相似之处。郭海峰告诉笔者,“AI Data Platform”想法强调的是数据不是静态的“湖”,而是“一条不竭流淌的河流,不竭少见据进来,不竭行止理、清洗、打标和再优化,从头检修模子”。这种动态的数据照看逻辑,与传统的“存下来以后再说”的想路有着骨子区别。
从产业视角看,“让AI走向数据”正在催生新的产业协同模式。海潮信息哄骗全栈才能(从底层算力到表层平台)为联接伙伴提供基础才略,郭海峰将其描摹为“搭台唱戏”——海潮信息搭台,伙伴唱AI这场戏。IBM则文告与英伟达进一步扩大联接,在GTC 2026上展示了深度集成决议:Storage Scale System 6000可提供10PB高性能存储,用于解救GPU原目生析引擎,IBM同期贪图于2026年第二季度初在IBM Cloud上提供英伟达Blackwell Ultra GPU。
但这一切的最终落点仍然是东谈主。吴磊在雷同会上反复强调:“AI是一个用具,不可代替东谈主,它莫得情谊,它莫得办法作念决定,最终作念决定的是东谈主类。”不管是海潮信息让GPU“不空转”,如故IBM用AI智能体让存储照看员照看数十个同构或异构节点,终极狡计皆是将东谈主从繁琐的运维中目田出来,将在意力投向翻新。
IBM买卖价值酌量院的调研高傲,76%的CEO对我方企业的IT架构“相等自信”,但43%的CIO感到惶恐。这种融会落差刚巧阐述,AI期间的数据基础才略挑战,远比名义看到的更复杂。“让存储融入常常的业务中,而不是让业务等存储”——金鑫这句归来,粗略是这个期间对存储行业最朴素也最重要的条款。
回望往常两年,存储行业经验了从波涛不惊到浊浪排空的转念。当大家AI总开销迫临万亿好意思元量级,当Token本钱的每一次下落皆凯旋影响大模子的经济可行性,存储不再只是期间的极端,而正在成为AI价值链条中不可或缺的一环。
(文|Leo张ToB杂谈,作家|张申宇2026世界杯官网,裁剪丨杨林)
发布于:北京市开云app官方下载- 上一篇:世界杯官网 被传仳离19年的朱琳:和初恋丈夫丁克到老,66岁后顿然调度儿孙绕膝
- 下一篇:没有了

备案号: