让建站和SEO变得简单

让不懂建站的用户快速建站,让会建站的提高建站效率!

科大讯飞:打造中国首个超大边界自主翻新算力平台“飞星一号”

发布日期:2025-08-09 08:13    点击次数:94

导语:

大模子之战,谁能快速部署高性能大模子查验平台,快速查验上线,谁就能霸占市集先机。“100+行业智能化转型故事”第111期,咱们走进有名东说念主工智能企业科大讯飞,它奈何打造存、算、网全栈自研的AI大模子科罚有盘算推算和算力平台?

2025上海WAIC大会的“翻译相连伙伴”、智能语音和东说念主工智能企业科大讯飞,领有语音及言语国度工程推行室和剖释智能世界重心推行室。濒临业界百模大战,奈何快速部署高性能大模子查验平台,快速查验上线,霸占市集有益位置?科大讯飞与华为聚拢打造存、算、网全栈自研的AI大模子科罚有盘算推算,共同缔造国内首个支捏万亿参数大模子查验的算力平台“飞星一号”。

]article_adlist-->

大模子缔造中遭逢了哪些问题?

星火剖释大模子从海量数据(维权)和大边界学问中捏续进化,已毕了从建议、权术到科罚问题的全历程闭环。东说念主工智能时期从感知贯通世界的专用边界向生成创造世界的通用边界进行跳动式演进,这一过程产生了对数据存储的新挑战:

集群可费用低:AI大模子查验以多机多卡任务为主,故障频率高,模子加载和断点续训CheckPoint读写时,对存储系统IO和带宽性能条款很高,千卡以上集群平均每天故障1次,断点收复时刻高达15分钟+,每次赔本几十万。

集群散布不行靠:多家存储“烟囱式”缔造,总容量几十PB,切分红几十个PB级的散布小集群,极地面增多了管束复杂度,并汲取软硬区别的容貌缔造存储集群,训斥了存储集群的可靠性同期也训斥了带宽才气。

数据治理贵重:AI查验集的文献数目有百亿个,刻下“烟囱式”存储集群的缔造模式,变成多个数据孤岛,数据需要东说念主工挪动,后果低。同期无全局数据可视才气,无法识别冷热数据与高价值数据,数据难以治理。

大模子厂商对存储的中枢诉求是:

1、高性能的存储底座,以相沿多机多卡的AI集群极致的查验时长和尽可能快的断点续训才气,训斥空幻回滚率。

2、谐和的AI存储数据湖管束才气,高效可靠的数据治理才气。

优质存储成为大模子时间的“黄金门票”

华为与科大讯飞聚拢打造中国首个超大边界算力平台AI数据湖存储底座,针对通用AI大模子查验,科大讯飞汲取算、存区别架构,计划侧追求愈加极致的算力开释,存储侧部署多套华为OceanStor AI数据湖科罚有盘算推算,提供可靠高效的几十PB超大可得存储容量。依托智能数据分级与多集群故障封锁、高效数据治理的高性能存储,已毕TB级带宽,端到端加快AI模子引诱。

15min→1min,断点续训收复速率提高15倍,日约略几十万元

断点续训收复速率提高15倍:集群最大提供TB级大带宽,裁减CheckPoint读写耗时,断点续训收复时长从15min裁减到1min,速率提高15倍。

谐和集群管束,99.999%高可靠

存储集群安全可靠:华为OceanStor AI存储单集群多Storage pool的有盘算推算,管束面合一,数据面区别,通过数据面封锁幸免AI集群故障扩散;同期通过亚健康管束、大比例EC等进一步提高存储可靠性,单集群可靠性达99.999%。

全生命周期管束TCO训斥30%

数据治理本钱低:谐和数据湖管束,GFS全局文献系统,无损多公约互通,受命数据孤岛,数据全局可视、可管,高效流动,跨域转机后果提高3倍,数据零拷贝,端到端加快AI模子引诱;千亿元数据秒级检索,智能识别数据热度,精确分级,已毕有储系统性能与容量平衡。

面向未来更大边界算力集群,华为与科大讯飞聚拢打造中国首个超大边界算力平台AI数据湖存储底座,借助海量数据和学问加快科大讯飞星火剖释大模子捏续进化,共建“让机器能听会说,能贯通会想考,用AI缔造好意思好世界”的好意思好愿景!

海量资讯、精确解读,尽在新浪财经APP

上一篇:好意思国平等关税8月1日重启,生意道判发达若何?    下一篇:没有了