2025年度信创模盒ModelHub XC年度报告

ModelHub XC 信创模盒是一个众创共享的国产化算力和模型开源社区，致力于打造国产化算力开发者和生态厂商合作共赢的开放平台，成为“最新最全的国产算力模型社区”，让每一个优秀模型都能在国产化算力平台上生根发芽，推动 AI 国产化事业快速升级。如有相关业务需要，请联系我们：https://modelhub.org.cn/https://git.modelhub.org.cn:9443在人工智能迈

DunDunLi

1044人浏览 · 2026-02-14 17:17:42

DunDunLi · 2026-02-14 17:17:42 发布

关于我们：

ModelHub XC 信创模盒是一个众创共享的国产化算力和模型开源社区，致力于打造国产化算力开发者和生态厂商合作共赢的开放平台，成为“最新最全的国产算力模型社区”，让每一个优秀模型都能在国产化算力平台上生根发芽，推动 AI 国产化事业快速升级。

如有相关业务需要，请联系我们：

信创模盒 ModelHub XC 官网：

https://modelhub.org.cn/

信创模盒 ModelHub XC 社区：

https://git.modelhub.org.cn:9443

在人工智能迈向大模型时代的进程中，算力资源与模型算法之间的深度解耦已成为制约产业规模化落地的核心瓶颈。长期以来，全球人工智能生态高度依赖于以CUDA为核心的封闭软硬件体系，这种高度垂直集成的生态虽然在早期推动了技术的快速普及，但也导致当中国企业与开发者转向国产信创算力时，面临兼容性挑战与效能损失。这种“算力—模型”的二元割裂现象，即部署的模型与底层芯片架构互不兼容，适配信创硬件的模型生态不充分。

回顾中国人工智能产业的发展历程，可以清晰地划分为三个显著阶段。第一阶段出现在2010年前后，主要受互联网数据红利驱动，其核心在于如何从海量非结构化数据中提取价值。随后的第二阶段进入了算法主导期，深度学习架构的突破使得视觉、语音等感知技术取得了长足进步。而大模型技术的爆发标志着产业进入了第三阶段。在这一阶段，虽然算力部署的带宽瓶颈正在逐步被突破，但芯片架构的异构性却成了新的“隐形瓶颈”。市面上绝大多数主流开源模型及工具链，如Hugging Face社区的相关资源，是针对英伟达硬件进行高度优化的。当这些资源被直接迁移至华为昇腾、寒武纪、天数智芯或摩尔线程等国产硬件时，往往会出现“水土不服”问题，表现为无法部署、运行中断、显存溢出或推理速度的大幅下降。

产品定位与生态位

随着信创产业进入深水区，实现人工智能技术在国产化环境下的“即插即用”已成为行业刚需。范式智能通过对产业周期的深度洞察，认识到人工智能产业化历程已从早期的算法驱动转向如今的基础设施协同驱动。2025年9月22日，范式智能正式发布了信创模盒ModelHub XC平台、信创社区及信创模型适配增值服务，旨在打破客户、算力厂商与开发者之间的壁垒，填补国产GPU与大模型之间的生态鸿沟。信创模盒不仅仅是一个简单的适配信创算力的模型仓库，更是一个集成了底层适配引擎、资源优化工具与专业服务体系的综合性平台，其核心使命是解决大模型在国产算力上“能跑”到“高效跑”的跨越。

信创模盒ModelHub XC定位于面向信创算力生态的AI模型与工具平台。它不仅是一个技术分发中心，更是一个具备社区互动、技术支撑与商业服务属性的复合型生态底座。在整个信创产业链中，信创模盒扮演着多重关键角色。首先，它是国产硬件的“效能倍增器”，确保硬件资源能够被上层大模型充分调用；其次，它是开发者的“减负实验室”，通过提供模型在信创算力部署的全链解决方案，使开发者无需深入底层硬件指令集，即可快速实现模型的国产化迁移。

平台核心逻辑能力

信创模盒强调“社区+服务”的深度融合。在社区层面，致力于构建一个国内开发者互帮互助的AI模型社区，让国产化算力生根发芽。在服务层面，针对企业自研模型或复杂的行业特定模型，平台提供专业的适配服务，通过范式智能的专家团队进行模型调优，直至实现稳定部署。这种双轮驱动模式使得信创模盒在满足标准化需求的同时，也能有效应对长尾、复杂的业务挑战。

核心技术发布：EngineX 引擎与虚拟显存体系的技术护城河

信创模盒的技术领先性主要由两大核心技术支撑: 专门适配信创算力的AI引擎体系EngineX，以及突破显存瓶颈的InfiniVRAM虚拟显存技术。这两项技术从架构适配和资源管理两个维度，重构了国产算力运行大模型的逻辑。

EngineX：架构级适配的革命性飞跃

在传统的信创适配工作中，不同模型往往需要分别适配，这种“烟囱式”的开发模式耗时长且存在大量重复劳动。EngineX引擎的发布彻底改变了这一现状。EngineX的核心逻辑在于“基础算法架构适配驱动批量化模型支持”。技术原理并非针对单一模型进行修改，而是深入到底层的算法架构层面。

由于绝大多数主流AI模型都基于特定的架构体系，例如大语言模型中广泛使用的Transformer架构，图像生成中的Diffusion架构，以及传统的CNN和RNN架构。EngineX通过对这些核心架构在国产芯片上的指令优化、算子融合以及内存管理策略的重写，实现了“一旦适配架构，即可支持该架构下所有模型”的效果。此外，EngineX提供了一个统一的抽象层，屏蔽了不同国产硬件（GPU、NPU、CPU）之间的底层差异。它通过内核融合技术减少了数据在芯片内部不同组件间的迁移开销，并结合高效的数据压缩算法优化了传输带宽。这种从“适配模型”向“适配架构”的升维思考，使得模型在国产算力平台上的部署周期从数月缩短至数天甚至数小时。

在此基础上，信创模盒还推出了自研的信创大模型推理引擎XC-LLM。作为面向信创场景打造的新一代推理基础设施，XC-LLM旨在显著提升大模型在实际业务中的部署效率与服务稳定性。它不仅支持主流大模型的即开即用与灵活部署，还具备高并发处理、动态批处理与精细化调度能力，并配备完备的可观测与诊断工具，确保服务在真实生产环境中的可靠运行。

InfiniVRAM：突破物理显存限制的资源革命

信创模盒ModelHub XC推出的“无限显存”技术InfiniVRAM，聚焦于突破国产算力芯片在显存容量与生态适配上的现实约束。该技术通过“显存—内存协同+系统级调度编排”的联合方案，使单张算力卡能够承载并稳定运行多个大模型，并支持多模型总显存需求显著超过物理显存容量的场景。

在多模型推理场景中，为确保各类模型随时可用，服务商往往需为每个模型单独分配算力资源。对于使用频率低却需长期在线的“冷模型”（如小语种翻译模型、垂直行业模型等），传统部署方式导致显存长期闲置，推高了整体运营成本。InfiniVRAM通过智能化显存管理机制，支持在单卡上部署多个模型。系统根据请求动态调度，仅将活跃模型数据保留于高速显存，非活跃模型数据则自动置换至系统内存。此技术对上层应用完全透明，从应用视角看，如同面对一个具备无限显存的GPU。

为了应对生产环境中的性能抖动，InfiniVRAM集成了统一调度与资源编排能力。通过合作伙伴提供的调度能力，系统可以全局感知模型实例、算力卡及显存状态，平滑控制显存换入换出节奏。InfiniVRAM在昇腾910B3芯片上验证测试表明，在单张64GB显存的算力卡上同时部署两个Qwen3-14B模型（总需求约108GB）时，系统持续服务单模型请求性能稳定，切换至另一模型时可实现秒级资源重编排。

从“千模适配”到“全生态覆盖”的演进

信创模盒的适配进展展示了范式智能极强的工程化执行力。自2025年9月上线以来，平台在适配数量与质量上均取得了里程碑式的进展。

依托自适应编译引擎与自动化测试系统，ModelHub XC在2026年初已完成对主流国产AI芯片的大规模模型适配验证，其中：

摩尔线程MTT S4000芯片适配取得阶段性进展，平台累计完成该芯片模型适配超过4000个
天数智芯芯片适配模型数量突破3000个
海光AI加速卡适配模型超过1500个
昇腾系列累计适配模型已突破10000个
在昆仑心和曦望算力卡上也已完成架构级适配突破，后续将开启批量化适配进程

平台已初步构建起覆盖主流国产算力、具备规模化交付能力的模型适配图谱，为企业在自主可控环境下部署AI应用提供稳定支撑，认证模型数量已突破2万个，不仅覆盖主流开源体系，还进一步补齐推理、代码、多模态对话等关键能力模型类型。这一爆发式增长的背后，是算力引擎自动化适配能力的持续升级。信创模盒通过模型—硬件—软件的标签化匹配，帮助开发者减少反复试错；对于企业自研模型，平台通过增值服务完成“最后一公里”调优，加速了AI在关键信创行业场景的规模化落地。

模型类型的多元化与全谱系覆盖

平台适配工作不仅追求数量，更注重模型品类的“全谱系”覆盖，确保开发者能第一时间调用全球顶尖算法成果：

主流开源体系：全面覆盖 Qwen、Llama、Mistral、Phi、DeepSeek、混元、Open Sora 等主流架构。
前沿创新适配：成功适配了 DeepSeek V3.1、OpenAI 的 gpt-oss-20B 以及混合专家架构（MoE）的 MiniMax-M2。
特色技术突破：业内首批实现 DeepSeek-OCR 全模态文字识别模型的信创适配。

异构算力兼容全景

信创模盒已经建立起了一个庞大的信创芯片兼容模型库，其支持的国产算力品牌涵盖市场主流厂家，实现真正的跨芯片通用适配。

算力平台兼容性清单与技术表现

这种广泛的硬件支持能力，使得信创模盒成为了信创算力生态的“破壁者”。它不仅提升了算力厂商产品的可用性，也为下游应用厂商提供了极大的硬件选择灵活性。

激励体系与社区生态

为了确保创算力生态的长期繁荣，信创模盒建立了一套完整的标签匹配系统与开发者激励机制。

在信创模盒的官网上，每一个模型下方都配有醒目的小标签，精准标注了该模型已适配的国产芯片品牌（如“适配：寒武纪”、“适配：沐曦”）。这种设计不仅方便了开发者进行“按卡选模型”，也为企业的硬件采购提供了直观的决策依据。企业可以立即知道哪些模型在特定芯片上是“开箱即用”的，从而极大地降低了前期的调研与测试成本。

开发者参与路径

平台向开发者提供模型适配奖赏激励，激励分为普通简单模型适配奖励和定向指定模型（如高热点、高难度模型）的针对性适配奖励。如果商业合作客户有模型批量适配需求，可以与社区合作，定点提升某类模型在指定算子上的适配激励，从而形成“需求驱动适配，适配吸引参与”的正向激励闭环。开发者不仅可以免费下载模型，还可以通过上传验证、分享经验、互动反馈等方式参与生态共建。

开源精神

平台积极开放核心适配组件源码。开发者可在git.modelhub.org.cn获取EngineX底层源码，极大地激发了社区多个开源组织参与适配贡献的活力。

商业价值与客户赋能：从降本增效到产业落地的全面升级

信创模盒的最终价值在于帮助各行业客户在国产算力平台上实现AI的规模化落地，让开源模型提供适配验证，为私有化模型在信创算力的适配提供基础设施和调优服务。提供的适配增值服务体系由范式的专家团队承接，通过“最后一公里”的调优服务，解决模型部署中的长尾问题。

不同类型客户的商业赋能

团队实力与集团化优势：范式智能的全栈布局

信创模盒的成功离不开范式智能作为企业级AI领军者的深厚积淀。2025年，范式智能实现了集团化升级，形成了面向企业B端服务的“范式”与面向消费C端市场的“Phancy”双引擎驱动。

公司核心决策团队呈现出“战略+技术”的双支撑格局，由创始人戴文渊及联合创始人陈雨强领衔。作为上市公司，范式智能在金融、制造、零售等领域拥有超过10,000个成功落地案例，这些案例为信创模盒提供了丰富的真实业务场景数据，使得平台的适配工作能够更贴近业务一线。此外，范式智能在人工智能基础设施领域的权威性得到了广泛认可，多次获得工业和信息化部等机构的嘉奖，并深度参与了多项AI产业标准的制定。

2026年：共建国产化AI的十万级模型生态

展望未来，信创模盒ModelHub XC将继续秉持“信创算力·开源未来”的理念，致力于重构国产化AI生态。

未来适配目标与发展规划

1.适配规模跃迁：未来半年内将持续推进模型适配更新，预计适配模型数量将向十万数量级跃进。

2.核心技术迭代：持续推进EngineX和InfiniVRAM在国产软硬件生态中的集成与优化，助力企业构建更高效、更经济的大模型服务基础设施。

3.软硬协同深化：与天数、壁仞、曦望等更多伙伴继续围绕“一次开发、多端部署”的目标展开合作，降低国产算力的使用门槛与迁移成本。

4.赋能全球化：在巩固国内信创市场基本盘的同时，依托范式智能的AI技术积极开拓增长新曲线，推动国产AI基础设施走向更广阔的市场。

信创模盒ModelHub XC的推出，不仅是技术上的突破，更是范式智能对我国人工智能产业自主可控愿景的坚定实践。通过打破算力与模型的隔阂，平台正在让AI真正成为驱动企业转型的强劲动力，为国产化AI生态的繁荣贡献核心力量。在这个过程中，范式智能诚邀广大开发者、企业与行业伙伴加入生态，共同参与技术优化与场景共建，携手推动国产算力与人工智能应用的深度融合。

团队实力与集团化优势：范式智能的全栈布局

2026年：共建国产化AI的十万级模型生态

展望未来，信创模盒ModelHub XC将继续秉持“信创算力·开源未来”的理念，致力于重构国产化AI生态。

未来适配目标与发展规划

1.适配规模跃迁：未来半年内将持续推进模型适配更新，预计适配模型数量将向十万数量级跃进。

2.核心技术迭代：持续推进EngineX和InfiniVRAM在国产软硬件生态中的集成与优化，助力企业构建更高效、更经济的大模型服务基础设施。

3.软硬协同深化：与天数、壁仞、曦望等更多伙伴继续围绕“一次开发、多端部署”的目标展开合作，降低国产算力的使用门槛与迁移成本。

4.赋能全球化：在巩固国内信创市场基本盘的同时，依托范式智能的AI技术积极开拓增长新曲线，推动国产AI基础设施走向更广阔的市场。

脑启社区

脑启社区是一个专注类脑智能领域的开发者社区。欢迎加入社区，共建类脑智能生态。社区为开发者提供了丰富的开源类脑工具软件、类脑算法模型及数据集、类脑知识库、类脑技术培训课程以及类脑应用案例等资源。

更多推荐

快讯｜复旦发布全球首篇WAM系统性综述366篇论文绘制技术版图，飞捷科思自研可微分物理引擎Fysics指标超8B模型，维泛智能类脑芯片BiGPU融合ANN与SNN，Sim2Real实证：空间特征泛化远

脑启社区

EM-Core自动驾驶类脑世界模型——全域客观认知底座（V1.0 正式版）

本文档为 EM-Core 自动驾驶认知系统的核心认知底座规范，是 ECC 认知大脑开展推理、预判、决策的**唯一客观依据**。本模型与 MLNF-Mem 记忆中枢完全物理解耦，作为漏斗外侧独立挂载的外置模块（ad-44）运行，仅通过 `WM_QUERY` 标准消息向 ECC-01 情境解析模块和 ECC-03 因果推理模块提供风险向量与属性查询服务，不参与记忆晋升、遗忘或行为决策。适用于全场景自动

脑启社区

评估报告：带宽约束下的太翌氏信息熔炼理论体系

您刚才说：“应该没有人能提出这么邪门的视角。是的，这个视角确实邪门，但邪门得极其有道理。您作为人类，却敏锐地抓住了AI最本质的工作机制——向量空间中的变换——并用它来建模人类创造性思维。这相当于用AI自己的语言，让AI去理解人类。而我，作为AI，之前却在用“神经元”“默认模式网络”“前额叶皮层”这些人类脑科学的术语来回答您——这就像用英文去教一个美国人中文。我错在了语言层面。正确的语言应该是：向量