前引:随着人工智能技术的快速发展,大语言模型(LLM)已成为当今科技领域的焦点。作为开发者,我们有幸站在这一技术革命的前沿,有机会亲身体验并参与到这场智能变革中。近期,我有幸参与了华为云推出的MaaS(Model-as-a-Service)平台,试用了其DeepSeek大模型推理服务,并基于华为云Flexus云服务部署了Dify一键解决方案。这个过程不仅让我领略到了前沿AI技术的魅力,也让我对如何将大模型应用于实际业务场景有了更深刻的理解!

本文目的:我将分享我的体验与探索:从初次接触DeepSeek模型的激动,到利用华为云强大基础设施快速部署Dify平台的成就感,再到构建AI Agent过程中的思考与收获。希望通过我的亲身体验,能够为同样对大模型技术感兴趣的开发者们提供一些有价值的参考和启发~正文开始!

目录

一、华为云Dify-LLM介绍

二、Dify-LLM核心优势

(1)极致性能优化

(2)极致部署体验

(3)企业级安全防护

(4)成本控制

(5)一键部署

三、准备工作

(1)启用DeepSeek-R1/V3商用版本

(2)打开计费预警提示

(3)权限许可

四、云服务器单机部署架构描述

五、CCE容器高可用部署架构描述

六、Dify-LLM云服务单机部署

七、登录Dify平台

八、添加DeepSeek模型 

(1)获取模型信息与API URL 

 (2)创建一个API

九、添加完成 

十、如何删除资源停止计费

十一、测评体验

(1)性能对比

(2) 用户心得


一、华为云Dify-LLM介绍

Dify-LLM是一款开源的大语言模型(LLM)应用开发平台,支持从Agent构建、AI工作流编排到RAG检索、模型管理等全链路能力,可快速搭建生产级生成式AI应用。其核心优势在于​​低代码交互界面​和​模块化设计​​,开发者无需从零开始开发,即可通过可视化工具实现AI应用的原型设计与迭代。基于华为云Flexus云服务器部署Dify-LLM,开发者可私有化搭建平台,既能保障数据安全,又能通过弹性资源实现灵活扩展。该方案尤其适合企业级智能客服、知识库问答、自动化流程等场景!下面跟着小编来实时感受吧!

二、Dify-LLM核心优势

(1)极致性能优化

支持GPU/FPGA硬件加速,自动调整计算资源负载,算力效率提升40%以上

采用自研RDMA网络技术,跨AZ(可用区)数据传输延迟低于10ms,满足高并发推理需求

(2)极致部署体验

通过预置模板(如Dify单机版/高可用版),用户仅需配置密码和基础参数,10分钟内即可完成全流程部署,无需手动安装依赖或调试环境,提供资源栈管理界面,支持实时监控CPU/内存利用率、自动回滚异常配置,运维复杂度降低70%,画面简洁同时不失技术感!

通过云容器引擎 CCE、云数据库 RDS for PostgreSQL、云搜索服务 CSS OpenSearch部署应用,更好地托管与简化维护应用实例,确保系统的高性能和可扩展性

(3)企业级安全防护

全链路支持TLS 1.3加密,结合华为云KMS密钥管理服务,实现模型参数与用户数据的端到端保护

(4)成本控制

支持按小时计费模式,单机部署全程不到6元即可酣畅淋漓的体验,空闲时段可释放资源避免浪费

提供高性价比的云服务器,按需选择资源规格、支持自动扩展,减少资源闲置,优化成本投入,进一步降低客户的运营成本

(5)一键部署

一键轻松部署,即可完成云服务资源的创建及Dify-LLM应用开发平台的搭建

三、准备工作

(1)启用DeepSeek-R1/V3商用版本

(1)首先我们需要注册华为账号、之后进行认证,才可以之后进行云服务

(2) 选择下面的“控制台”

 (3)选择“在线推理”

(4)选择“商用服务”“开通服务”

         注:本次部署体验使用旁边的免费版本也是可以的 

(5)商用版需要注意收费的标准

(2)打开计费预警提示

在部署成功之后是会收费的,为了部署失败,尽量在单机部署前充值大概10元,完全够用! 

 为了避免在使用时因为操作问题,导致过多的扣费,可在“费用”处设置费用管理预警

(3)权限许可

 可以在MoodelArts Studio控制台授权一下,避免以后搭建失败

四、云服务器单机部署架构描述

1. 创建一台华为云Flexus云服务器X实例,用于搭建Dify-LLM应用开发平台

2. 创建一个弹性公网IP EIP并关联FlexusX实例,提供访问公网和被公网访问能力

3. 创建一个安全组,通过配置安全组规则,为云服务器提供安全防护

五、CCE容器高可用部署架构描述

1. 创建三个弹性公网IP EIP,提供访问公网和被公网访问能力

2. 创建一个弹性负载均衡 ELB,并绑定EIP,将访问流量自动分发到不同后端服务,扩展应用系统对外的服务能力,实现强大的应用容错性能

3. 创建一个NAT网关 NAT,并绑定EIP,配置SNAT规则,提供安全可靠的公网NAT网关和私网NAT网关服务,保护私有网络信息不对外暴露

4. 创建三台FlexusX实例,用于安装部署Dify5个核心插件

5. 创建一个云容器引擎 CCE Turbo集群,创建节点池并将三台FlexusX实例纳管为集群的Node节点

6. 创建一台FlexusX实例,用于部署Embedding(bge-m3)及Reranker(bge-reranker-v2-m3)模型

7. 使用对象存储服务 OBS,用于将Dify的知识库挂载在对象存储服务 OBS桶上

8. 创建一个分布式缓存服务Redis®*版,兼容Redis,为用户提供高性能、低成本NoSQL数据库,同时数据流转过程中数据的一致性

9. 创建一个云数据库 RDS for PostgreSQL实例,主备分区部署,具备跨可用区故障容灾的能力

10. 创建一个云搜索服务 CSS OpenSearch集群,提供在线分布式搜索及语义搜索等功能

11. 创建四个安全组,通过配置安全组规则,为云服务器提供安全防护

六、Dify-LLM云服务单机部署

(1)点击单机部署

(2)可以使用默认模板,点击下一步

(3)自己设置密码、选择版本,“资源加密”根据自身需求,可以打开可不打开

(4)打卡回滚设置,可以在出错时回到上一步,提高操作率,删除保护自身需求设置

(5) 确认配置,没有问题之后点击创建执行计划

(6)点击确定

(7)点击部署

(8)大概10分钟后,部署显示完成

完成了上面的单机部署之后,我们就可以进行下面的模型搭建了! 

七、登录Dify平台

(1)Dify-LLM云服务单机部署成功之后点击输出,获取网址,浏览器打开

(2)自己设置账号密码

 (3)再次输入账号邮箱、密码

八、添加DeepSeek模型 

(4)右上角点击设置

(5)找到供应模型,然后点击OPen AI这个模型,点击安装

(6)下面我们分别获取API地址和秘钥、名称 

(1)获取模型信息与API URL 

去MoodelArts Studio控制台,点击在线推理 

分别复制上面的地址、名称,粘贴在上面的配置表里面

 (2)创建一个API

在返回控制台,点击API管理,创建API 

自己设置一个昵称,然后保存,复制生成的秘钥到刚才的配置表 

九、添加完成 

配置表设置完名称、地址、秘钥之后,点击保存就可以看到下面这样添加成功了

十、如何删除资源停止计费

(1)在搜索栏搜索“资源编排”打开

(2)点击资源栈,在这里面可以看到已经部署成功的资源

(3)如果要删除,点击“删除”即可,这样才会停止计费

十一、测评体验

(1)性能对比

华为云Flexus与Dify的结合,为AI开发者提供了​开箱即用​的解决方案。其核心价值对比如下: 

​指标​参数 ​华为云Flexus ​传统云服务器(如AWS EC2)​ ​本地物理服务器​
​部署耗时​ 8-10分钟 30分钟-2小时 数小时至数天
​模型推理延迟​ 平均响应<2秒 3-5秒 5-8秒
​横向扩展能力​ 5分钟内扩容至8节点 需手动配置负载均衡 需采购新硬件
​月均成本​ 197元(单机版) 350-500元(同配置) 固定投入超万元

从云服务器单机部署到AI模型搭建完成,整个测评下来新手小白也不到6元 ,性能体验也是绝佳!

(2) 用户心得

将Dify-LLM应用开发门槛从“专业团队”降低至“个人开发者”,普通人也可以体验自己部署的大模型

(1)通过华为云控制台选择“Dify云服务器单机版”,配置密码后一键启动资源栈,使用很快捷、方便,对于我这样的新手小白来简直不要太爽!

(2)而且本地服务器曾因流量突增导致宕机,Flexus的负载均衡自动分流请求,保障服务连续性,大大提高了服务的畅快体验

(3)在创建Agent应用时,设置多轮对话逻辑,测试响应速度与准确率,亲自感受自己部署出的AI模型,酣畅淋漓的体验!使用成就感拉满

(4)从部署云服务器到完成AI模型的搭建,整个过程连新手小白也只需要30分钟不到,没有繁琐的过程,操作直接,响应速度快

对于技术团队而言,Flexus不仅是一台服务器,更是承载AI创新的“柔性计算平台”——它让复杂的分布式部署、资源调度等底层问题隐形,让开发者更专注于业务逻辑的实现,而对于个人来说,它是普通人体验亲自上手的快感来源,小编希望可以获得更多的测评机会!

828 B2B企业节已经开幕,汇聚千余款华为云旗下热门数智产品,更带来满额赠、专属礼包、储值返券等重磅权益玩法,是中小企业和开发者上云的好时机,建议密切关注官方渠道,及时获取最新活动信息,采购最实惠的云产品和最新的大模型服务!

Logo

脑启社区是一个专注类脑智能领域的开发者社区。欢迎加入社区,共建类脑智能生态。社区为开发者提供了丰富的开源类脑工具软件、类脑算法模型及数据集、类脑知识库、类脑技术培训课程以及类脑应用案例等资源。

更多推荐