马上注册,结交更多好友,享用更多功能,让你轻松玩转社区
您需要 登录 才可以下载或查看,没有账号?立即注册
×
在人工智能飞速发展的时代,AI算力卡作为关键硬件,支撑着各类复杂的AI运算任务。随着全球科技竞争的加剧,实现AI算力卡的国产化自主可控愈发重要。本文介绍在该领域表现卓越的10家国产化公司,从主营业务、核心优势、业务实践等维度展现它们的实力与成就。
一、寒武纪 主营业务:寒武纪专注于人工智能芯片的设计与研发,核心业务涵盖云端智能芯片与加速卡、边缘端智能芯片与加速卡以及IP授权与软件生态。产品包括思元(MLU)系列芯片,如用于数据中心、云计算的MLU370、MLU590等,为AI训练和推理提供高性能算力支持 。 核心优势 技术优势:采用自研的MLUarch架构,支持动态指令集和可扩展计算单元,实现灵活的资源调度,在稀疏计算、动态推理等场景能效比提升显著。芯片通过动态电压频率调整(DVFS)等技术进行能效优化,单位功耗算力更具优势,内置稀疏加速引擎可提升稀疏模型运算效率。 生态与场景适配:提供NeuWare全栈软件平台,支持主流AI框架,并提供CUDA代码迁移工具,与国产框架深度适配,满足国内企业“去英伟达化”需求。在智慧城市、自动驾驶等垂直行业推出针对性解决方案,被纳入多地智算中心采购名单。 战略差异化:提供定制化IP授权模式,允许客户根据业务需求定制计算单元,加速卡价格具有优势,且提供本地化技术支持团队,响应速度快。采用中芯国际7nm工艺流片,关键IP自主研发,减少对国外代工厂依赖 。
业务实践:思元590训练芯片已导入阿里云、腾讯云,支撑大模型训练;思元220芯片应用于工业检测、车路协同等实时场景,累计销量破百万片;子公司行歌科技推出车规级芯片,支持L3+自动驾驶;玄思系列智能计算集群为政府智算中心项目提供算力密度与能效优化方案,目标2025年国产化率超50% 。 二、海光信息 主营业务:研发、设计和销售应用于服务器、工作站等计算、存储设备中的高端处理器,产品包括海光通用处理器(CPU)和海光协处理器(DCU) 。海光CPU有面向数据中心的7000系列、面向行业客户的5000系列以及面向多场景的3000系列;海光DCU基于主流通用并行计算架构,可搭配海光CPU使用,用于科学计算、AI模型训练和推理等领域 。 核心优势 技术实力:拥有强大研发团队,在引进AMD技术基础上自主创新,取得多项处理器核心技术突破,截至报告期末,拥有发明专利670项、实用新型专利90项、外观设计专利3项、集成电路布图设计登记证书228项、软件著作权244项。 产品性能与生态优势:海光CPU兼容x86指令集,支持主流操作系统和软件,生态系统强大;海光DCU兼容“类CUDA”环境,适用于大数据处理、商业计算、人工智能等领域。积极参与开源社区,与国内龙头企业合作建设国产软硬件生态链 。 优质产业链:与产业链上下游紧密合作,产品获国内多家知名服务器厂商认可,在电信、金融、互联网、教育、交通等行业广泛应用 。
业务实践:在国产服务器CPU市场占据领先地位,2022年在国产化服务器市场份额排名第一,占比53%,在国内服务器市场市占率为13.25% 。深算二号DCU产品实现商用,在大数据处理、人工智能、商业计算等领域广泛应用,性能较深算一号翻倍增长,深算三号研发进展顺利 。 三、景嘉微 主营业务:主营业务涵盖图形显控、小型专用化雷达以及芯片等领域。图形显控领域拥有自主研发的GPU芯片,如JM5系列、JM7系列和JM9系列等,应用于图形显控模块产品和加固产品,服务军工领域;芯片业务成功研发景宏系列高性能智算模块与整机产品,涉足AI训练、AI推理和科学计算等领域 。 核心优势 技术研发实力:注重研发投入,技术人员学历水平高,JM7和JM9系列芯片产品快速放量。三代芯片基于基础理论研究,在架构设计、算法模型、原理验证、硬件实现、驱动开发等环节全面自主研发,芯片研发周期持续缩短,与国外同类产品代际差不断缩小 。 生态建设完善:与行业上下游厂商深度生态合作,开放底层驱动,在多个应用方向进行深度合作和优化,共同推进国产GPU生态建设。与北京大学长沙计算与数字经济院共同设立“先进计算”联合实验室,促进国产自主可控计算生态建设和发展创新 。
业务实践:在军工图形显控领域市场份额较高,是国内主要供应商之一。其图形显控模块用于战斗机座舱显示系统等高端装备。在民用领域也与一些知名企业建立合作关系,景宏系列产品填补了公司在AI相关应用领域的产品空白,随着信创产品渗透,市场规模前景乐观 。 四、壁仞科技 主营业务:致力于开发通用计算体系,提供智能计算领域的一体化解决方案,在GPU、专用加速器(DSA)和计算机体系结构方面进行技术研发,推出通用GPU芯片BR100 。 核心优势 技术创新:在GPU、DSA和计算机体系结构方面积累深厚技术底蕴,首款通用GPU芯片BR100采用7纳米制程工艺,具备高达1000Tops的INT8算力,性能达到国际先进水平 。 应用潜力:BR100芯片不仅在AI训练和推理任务中表现出色,还在高性能计算、科学仿真等领域展现出巨大应用潜力 。 产学研合作:积极推动产学研合作,与高校、科研机构紧密合作,共同探索通用计算技术的前沿应用,拓展国产AI算力卡应用边界 。
业务实践:虽然暂无大规模商业化应用的公开报道,但凭借其先进的芯片技术,已获得市场高度关注,吸引众多行业伙伴探讨合作可能性,有望在未来AI计算领域取得重大突破 。 五、天数智芯 主营业务:专注于国产算力芯片研发,推出7纳米制程的云端全场景通用AI芯片“天垓100”,并基于该芯片打造加速卡 。 核心优势 芯片性能:“天垓100”芯片集成超过350亿个晶体管,在INT8精度下算力可达256Tops,具备强大计算能力和高效能耗比 。 应用领域广:基于“天垓100”芯片的加速卡广泛应用于人工智能各领域,包括自然语言处理、计算机视觉、智能语音等 。 生态合作:注重产品性能优化和生态建设,与软件开发商、系统集成商紧密合作,完善产品功能和兼容性,提供稳定、高效AI算力解决方案 。
业务实践:在人工智能领域多个项目中得到应用,助力企业提升AI运算效率,虽然市场份额在逐步拓展阶段,但凭借产品性能和生态合作,逐渐在国产AI算力卡市场崭露头角 。 六、摩尔线程 主营业务:以全功能GPU芯片设计为核心,构建自主知识产权的GPU技术体系,产品涵盖桌面级、服务器级等领域,推出MTT S4000 GPU加速卡 。
核心优势 技术突破:基于自研的第三代MUSA架构,MTT S4000搭载Tensor核心与48GB超大显存,显存带宽高达768GB/s,支持多精度计算,满足从科研计算到AI推理多样化需求,配备先进图形渲染引擎、视频编解码单元及8K HDR显示能力,覆盖复合场景 。 互联技术创新:通过自研MTLink1.0技术,实现卡间互联带宽240GB/s,支持2 - 8卡直连拓扑,千卡集群线性加速比超91%,兼容roce等高速网络协议,构建AI算力网络 。 生态兼容性:借助Musify工具,可无缝迁移cuda代码至Musa平台,兼容主流AI框架及分布式训练工具,提供vllm_musa推理框架、mutlass等软件栈。
业务实践:MTT S4000在千亿参数模型训练中性能接近国际同级产品,已在邮储银行等金融机构部署,支撑智能营销、代码生成等场景的模型推理,资源利用率提升35% 。 七、燧原科技 主营业务:专注人工智能领域算力芯片研发,推出邃思系列芯片及相关加速卡产品 。 核心优势 架构创新:邃思芯片采用创新架构设计,结合先进制程工艺,具备高效计算能力和出色能耗管理 。 场景优化:在AI训练和推理场景中表现优异,支持大规模数据并行处理,有效提升模型训练和推理效率 。 生态融合:与主流AI框架和软件工具深度融合,为开发者提供便捷、高效开发环境,推动AI应用快速落地 。
业务实践:产品在智能安防、金融科技、互联网等领域广泛应用,例如为智能安防系统提供高效图像识别算力支持,助力金融科技企业实现智能风控和客户服务优化 。 八、昆仑芯 主营业务:专注AI算力芯片研发,推出昆仑芯系列产品 。 核心优势 业务实践:为智能语音交互、图像识别等应用提供强大算力支持,在智能客服、人脸识别门禁系统等项目中发挥重要作用,与众多企业建立长期合作关系。 九、砺算科技 主营业务:专注于自研架构、自有知识产权的国产GPU芯片研发 。 核心优势 业务实践:目前处于技术研发和产品完善阶段,虽尚未大规模进入市场,但凭借技术潜力和团队实力,备受行业关注,有望在未来推出具有竞争力的产品 。 十、航锦科技 主营业务:开发出应用于浮点计算的算力GPU芯片,积极向智能算力领域转型,签署算力服务器销售合同 。 核心优势
业务实践:在智能算力领域逐步扩大市场份额,其算力GPU芯片应用于一些对算力有需求的项目中,通过与其他企业协同创新,满足客户多样化算力需求 。 这10家国产化公司在AI算力卡领域各展所长,凭借技术创新、生态建设、市场拓展等方面的努力,推动国产AI算力卡产业不断发展,为我国人工智能产业的自主可控发展提供了坚实支撑。
|