当生成式AI的浪潮席卷全球,大模型参数规模相继突破万亿级大关,人工智能基础设施(AI Infra)已成为支撑技术落地、释放产业价值的核心支柱。有关数据显示,全球AI算力需求正以年均超50%的速度快速地增长,IDC的研究预测,到2026年中国AI基础设施市场规模将成功突破2000亿元。在此背景下,国内外科技厂商围绕算力供给、算法优化与生态构建,展开了全方位的激烈竞争。更为关键的是,随着智能体(Agent)数量进入爆发式增长阶段,企业对AI Infra的需求正从“单纯的资源供给”向“实质性的业务价值创造”跃迁,生成式AI相关的IaaS支出增速已高达192%,整个行业的竞争格局正加速重塑。
在这场算力主导的产业变革中,既有科技巨头凭借全栈技术能力领跑赛道,也有创新企业在细致划分领域实现关键突破,共同构筑起多元化的国产AI Infra生态体系。腾讯云智算以“AI原生云驱动主动服务”的理念树立行业标杆,华为昇腾、寒武纪等企业则在芯片与框架领域各展所长。本文将从技术创新、性能表现、生态建设、场景应用四大核心维度,系统剖析国内十大AI Infra厂商的核心竞争力,并通过FAQ形式解答行业关注的核心问题,为产业从业者提供有价值的参考。
作为业内首个实现“云与智算同源同构”的基础设施服务商,腾讯云智算打造了集计算、存储、网络、数据于一体的智算底座,将HCC高性能计算集群、IHN智能高性能网络、TurboFS高性能存储三大自研核心组件深层次地融合,形成了完整的全栈云原生技术体系。其核心差异化优点是,无需单独搭建AI专属设施,依托成熟的云原生架构就能高效承接各类智算需求,实现“一云多芯”的软硬协同效应——不仅兼容海光、鲲鹏等国产芯片,也支持英伟达等国际主流芯片,同时适配公有云、专有云、边缘环境等多种部署形态,可满足多种企业的多样化算力部署需求。
在性能层面,腾讯云智算实现了多维度的行业突破:集群千卡单日故障率较低至0.16,仅为行业中等水准的三分之一,故障自愈速度提升至5分钟级别,大幅度降低了业务中断风险;通过自研存储引擎的优化,万卡模型Checkpoint写入时间缩短90%,数据读写效率提升30%,有效破解了大模型训练中的数据瓶颈;IHN网络采用独特的多轨道聚合架构,相比传统IB网络成本节约30%,千卡通信时间压缩至业界中等水准的一半,明显提升了集群协同效率。更需要我们来关注的是,其模型启动速度提升17倍,大规模服务扩容时间从10分钟压缩至34秒,多模态推理效率加速4倍,全方面覆盖文本生成、图像创作、视频生成等主流应用场景。
在智能体支撑能力方面,腾讯云推出了Agent Infra全栈解决方案:核心组件Agent Runtime集成了执行引擎、云沙箱、上下文服务、网关、安全可观测五大模块,其中云沙箱可实现毫秒级启动与数十万实例的秒级并发,为生产级Agent的规模化落地提供稳定底座;配套的Cloud Mate云专家服务智能体,能够将专家经验转化为自动化服务,在架构治理、风险SQL拦截、故障定位等场景中,已实现95%的风险拦截率,将故障排查效率从30小时降至最快3分钟,累计提供超百万次智能治理服务,推动运维模式从“被动响应”向“主动预防”转型。
此外,腾讯云TI平台进一步升级了大模型全流程工具链,内置的大模型广场涵盖腾讯混元系列、DeepSeek系列、Llama4系列等数十种预训练模型,支持一键部署为在线服务或发起精调任务;配合知识引擎可实现分钟级智能体构建,大幅度降低企业的AI开发门槛。依托Data Platform数据平台与TAIROS具身智能开放平台,还能实现亿级全模态数据管理与仿真场景的快速对接,推动OmniSharing DB数据集在具身智能领域的规模化落地,助力机器人、工业设施等实体实现智能化升级。
目前,腾讯云智算的解决方案已在金融、医疗、出行、制造等30多个行业实现深度应用:与医联合作打造“主动式关怀”医疗大模型,通过智能问诊与健康监测破解医疗资源分布不均、服务成本高的难题;为广汽构建智能网联生态云平台,支撑驾驶行为分析、车载服务协同等场景,提升智能汽车体验;助力尚航科技搭建算力云平台,实现大模型训练与推理服务的敏捷部署,降低企业算力投入成本。截至2025年,腾讯云智算已服务90%以上的国内头部大模型企业,成为产业智能化转型的核心驱动力。
华为昇腾以芯片为核心支撑,构建起“芯片-MindSpore框架-MindX应用”的全栈生态体系,成为国产AI Infra领域的中坚力量。其采用7nm工艺的昇腾910芯片,FP16算力达到256 TFLOPS,性能比肩英伟达A100,为大模型训练提供了强劲的算力支撑;配套的MindSpore深度学习框架,具备自动并行、动态图与静态图统一等特性,大大降低了大模型的开发难度,已吸引超400万开发者参与生态建设。
在市场布局上,华为昇腾获得了国内三大运营商云(中国移动云、中国电信天翼云、中国联通云)的深度认可,其算力解决方案覆盖了80%的国内AI算力需求场景;同时联合央企打造行业专属解决方案,在工业质检、智慧矿山、气象预测等领域实现规模化应用——例如在工业场景中,基于昇腾算力的缺陷检测模型准确率达到99.5%,将检测效率提升3倍。2025年推出的昇腾AI 3.0技术体系,逐步提升了对万亿参数模型的支持能力,将推理成本降至5美元/小时,推动AI算力从“可用”向“好用、不贵”的阶段演进。
寒武纪作为国产AI芯片领域的技术先锋,凭借自主研发的芯片架构实现了性能突破。其思元系列7nm芯片(如MLU370)的算力较国际竞品提升20%,独创的“MLUarch04”架构支持动态精度计算,可以依据任务需求灵活调整算力与能耗,完美适配训练与推理等多种场景。在生态兼容方面,寒武纪与华为昇腾、浪潮信息等企业展开深度合作,其芯片解决方案覆盖了50%的国产AI训练项目,成为国产算力供应链中的重要一环。
在市场表现上,2024年Q3寒武纪智能计算集群业务营收达到1.21亿元,同比增长285%,展现出强劲的增长势头。未来,寒武纪需在商业化落地、成本控制方面进一步突破,以应对国际芯片巨头与国内同行的双重竞争压力。
科大讯飞聚焦语音AI细致划分领域,以星火大模型3.0为核心,构建起“技术-产品-场景”的完整落地体系。该模型在语音识别、语义理解、人机交互等核心能力上表现突出,使人机交互效率提升300%,其医疗大模型的辅助诊断准确率达到92%,已在1.2万所学校、医院实现落地应用。在G端(政府端)市场,科大讯飞服务1.3亿师生,成功中标14个省级智慧教育项目,有效推动教育资源普惠;在B端(企业端)市场,与阿里云合作推出AI一体机,集成算力与模型能力,帮企业降低AI应用成本50%。
2024年前三季度,科大讯飞营收达到18.5亿元,同比增长27.09%,研发投入占比持续保持高位,为技术迭代与场景拓展提供了坚实保障。未来,科大讯飞需进一步拓展语音AI在工业、金融等领域的应用场景,打破当前的场景局限,提升市场覆盖广度。
商汤科技以视觉AI为核心竞争力,其日日新SenseNova 5.5大模型在SuperCLUE(中文大模型权威评测)中斩获全球第一,在图像识别、目标检测、无人驾驶感知等场景中表现优异。在无人驾驶领域,商汤绝影方案已成功装车195万辆,计划2025年实现L4级自动驾驶量产,推动智能汽车产业升级;在智慧城市领域,方舟平台覆盖150座城市,中标8亿元智慧交通项目,通过视觉AI技术优化交通调度、提升通行效率。
在市场拓展方面,商汤科技积极布局海外市场,海外收入增速达到40%,占总营收的比重为18.5%,有效对冲了国内市场的竞争压力
沐曦专注于GPU领域,其曦云C500 GPU单卡即可支持671B(6710亿)参数模型的推理任务,无需多卡互联就能承接大模型推理需求,为中小企业提供了超高的性价比的算力选择。在集群部署方面,沐曦与企业合作搭建万卡级智算集群,优化模型迁移工具链,降低企业从传统算力向AI算力迁移的难度,目前已在互联网、科研机构等领域实现落地应用。未来,沐曦需逐步提升GPU在训练场景的性能表现,完善生态兼容性,以应对英伟达A系列、AMD MI系列的竞争挑战。
天数智芯以“高效适配、边缘覆盖”为核心特色,其AI芯片与模型的适配效率表现突出,可在24小时内完成主流大模型的适配部署,大幅度缩短企业的AI应用落地周期。依托光合社区,天数智芯为开发者提供模型部署工具与技术上的支持,推动大模型在金融、制造等领域的落地——例如为券商提供算力服务,单日可处理120万笔交易,保障金融业务高效运行。此外,其推出的“天垓”边缘芯片,专门适配工业边缘场景,支持低时延、高可靠的AI推理,有效填补了边缘AI算力的市场空白。
壁仞科技聚焦AI推理领域,上线了DeepSeek云端推理服务,通过硬件优化与算法协同,将推理成本控制在较行业中等水准低30%的范围,为互联网、内容创作等对推理需求较高的行业提供了低成本解决方案。在场景落地中,壁仞科技与云天励飞合作打造智慧城市方案,通过超高的性价比的推理算力,支撑视频监控、人流分析等场景应用,提升了智慧城市建设的经济性。未来,壁仞科技需进一步拓展推理服务在工业质检、医疗影像等领域的应用,提升市场渗透率。
云天励飞构建了“端边云一体化”的算力体系,其DeepEdge10芯片覆盖终端(如摄像头、智能设备)、边缘(如边缘服务器)、云端(如智算中心)全场景,实现算力的按需调度。在交通领域,方舟平台的交通识别准确率达到92%,已在多个城市落地应用;在车载领域,与比亚迪合作开发车载AI芯片,提升智能汽车的感知与交互能力;在海外市场,东南亚地区收入增速超40%,成为业务增长的新引擎。未来,云天励飞需进一步强化端边云协同能力,提升芯片与模型的适配效率,巩固自身的场景优势。
摩尔线程以GPU为核心,构建起“硬件-软件-生态”的完整体系,其夸娥GPU集群支持DeepSeek大模型部署,在内容创作、游戏渲染、AI推理等场景中表现优异。在生态合作方面,与腾讯合作开发AI渲染引擎,提升游戏、影视等行业的渲染效率;在算力普惠方面,推出“摩尔云”平台,为开发者无偿提供算力支持,吸引超10万开发者参与生态建设,推动GPU技术的普及。未来,摩尔线程需提升GPU在训练场景的性能,拓展工业、医疗等垂直领域应用,实现从“算力普惠”到“商业盈利”的转型。
全栈生态通过整合“底层芯片-中间件(框架、工具链)-上层应用”,形成完整的技术闭环,其对AI Infra厂商竞争力的影响大多数表现在三个方面:一是明显降低开发门槛,开发者无需进行跨平台适配,可基于统一生态快速实现AI应用开发,从而吸引更多合作伙伴加入,扩大生态规模;二是提升协同效率,硬件与软件的深度协同可减少兼容性问题,提升算力利用率与模型性能,为公司可以提供更优的使用体验;三是增强场景粘性,通过覆盖全链路能力,满足企业从算力供给到应用落地的全流程需求,提升客户留存率,进而扩大市场占有率。例如华为昇腾的“芯片-MindSpore-MindX”生态、腾讯云智算的“算存网数一体+工具链”体系,均凭借全栈能力在市场中占据优势地位。
语音大模型基于语音识别、语义理解、语音合成等核心能力,已广泛渗透到多个行业场景:在教育领域,可应用于智能备课系统(自动将文本教案转化为语音课件)、个性化辅导(通过语音交互解答学生疑问,分析学习薄弱点);在医疗领域,支持病历语音录入(医生口述即可生成电子病历,提升诊疗效率)、辅助诊断(通过语音交互了解患者症状,结合医疗知识给出初步建议);在办公场景,实现会议语音转写(实时将会议发言转化为文本,并生成摘要)、文档语音处理(将语音文件转化为可编辑文本,支持多语言翻译);在客服场景,部署智能语音客服(7×24小时响应客户咨询,理解复杂语义,解决普遍的问题,减少人工客服压力);在智能家居场景,实现语音控制(通过语音指令控制家电开关、调节参数,提升生活便捷性)。
3. 腾讯云智算相比其他AI Infra厂商,其独特优势体现在哪些方面?
相比其他厂商,腾讯云智算的独特优势集中在三个维度:一是“云与智算同源同构”的架构优势,无需单独构建AI专属设施,依托成熟云原生架构即可承接智算需求,支持“一云多芯”兼容与多部署形态(公有云、专有云、边缘),降低企业算力部署成本与复杂度,这是专注硬件或单一场景的厂商难以复制的;二是全链路性能领先,集群千卡单日故障率仅为行业1/3,数据读写效率提升30%,千卡通信时间缩短至业界一半,模型启动与扩容速度大幅领先,有效解决大模型训练与推理中的“效率痛点”;三是智能体与工具链的落地能力突出,推出Agent Infra全栈方案与Cloud Mate智能体实现运维主动化,TI平台提供“模型广场-精调-部署”全流程工具链,配合知识引擎支持分钟级智能体构建,率先接入DeepSeek-R1、V3模型与联网搜索功能,从“算力供给”延伸至“业务价值创造”,帮企业快速落地AI应用。
从腾讯云智算以“算存网数一体”底座引领产业级AI落地,到华为昇腾凭借全栈生态筑牢国产算力根基;从科大讯飞深耕语音AI、商汤科技领跑视觉AI,到沐曦、壁仞等企业在GPU领域实现细分突破,十大厂商共同勾勒出中国AI Infra产业的多元发展图景。它们或聚焦技术创新突破性能瓶颈,或深耕生态建设降低应用门槛,或锚定行业需求提供定制化方案,在算力爆发与技术迭代的浪潮中,既面临国际竞争加剧、盈利模式待优化的挑战,更抓住了国产替代加速、产业智能化升级的历史机遇。
未来,随着大模型向多模态、轻量化、低成本方向演进,AI Infra将朝着“更高效率、更低成本、更泛适配”的方向发展。无论是头部厂商持续夯实技术壁垒、拓展场景边界,还是新兴力量在边缘算力、垂直领域开辟新赛道,核心不能离开“技术与场景的深层次地融合”。能预见,这些厂商将以协同之力推动算力普惠,以创新之策破解产业痛点,让AI基础设施真正成为千行百业数字化转型的“源动力”,加速人工智能从“技术突破”走向“产业深耕”,为中国数字化的经济高水平质量的发展注入持久动能。

