在高通跃龙IQ-9100平台上部署RAGflow(2): 模型部署、配置验证与调优
本文是高通跃龙 IQ-9100 平台部署 RAGflow 系列下篇,讲解 Embedding、Rerank 模型落地全流程。文中提供 BGE、BCE 模型下载、ONNX 转换、INT8 量化编译至适配 NPU 格式的完整脚本,基于 FastAPI 开发兼容 OpenAI 接口的独立推理服务,详述 RAGflow 对接本地模型配置与接口、端到端验证方法。同时给出模型及系统调优参数,汇总 NPU 识别异常、推理缓慢等问题排查方案。方案依托 Hexagon NPU 加速,性能、功耗优于纯 CPU,可搭建本地隐私 RAG 系统。
Qualcomm 高通跃龙 IQ-9100 RAGflow 模型部署时间:2026-06-18 09:42:25
在高通跃龙IQ-9100平台上部署RAGflow(1): 系统架构与环境准备
高通跃龙IQ-9100是一款面向边缘/本地部署场景的AI推理 设备,内置Hexagon NPU,支持通过Qualcomm AI Engine Direct和ONNX Runtime进行高效的模型推理。将RAGflow部署在IQ-9100平台上,可以实现数据不出局域网的隐私安全RAG方案,同时借助NPU加速Embedding和Rerank模型推理,显著降低延迟和功耗。本文将详细介绍如何在高通跃龙IQ-9100上安装部署RAGflow,并配置本地Embedding和Rerank模型。
Qualcomm 高通跃龙 IQ-9100 系统架构时间:2026-06-17 09:27:57
在骁龙X2 Elite上安装Hermes Agent(3): 进阶配置与玩法
本文是系列的最后一篇。进阶配置与玩法,演示 网关、本地 NPU、MCP、定时任务及 WSL2 方案。你将学会如何通过 Telegram 远程访问 Hermes、利用 Snapdragon X2 Elite 的 NPU 加速本地模型、扩展 MCP 工具、设置无人值守定时任务,以及 WSL2 备选方案和常见问题排查。
Qualcomm 高通骁龙 AI PC X2 Elite时间:2026-06-16 09:54:19
在骁龙X2 Elite上安装Hermes Agent(2): 一键脚本从零安装Hermes Agent
本文是系列的第二篇。上一篇我们介绍了硬件选型和安装准备工作,本文将正式进入安装环节,使用官方一键脚本完成部署,并通过 hermes doctor 验证环境,最后启动交互式 CLI 体验第一个智能体示例。
Qualcomm 高通骁龙 AI PC X2 Elite时间:2026-06-15 09:41:53
在骁龙 X2 Elite 上安装 Hermes Agent(1): 硬件规格和安装准备
为什么 骁龙Snapdragon X2 Elite 是 Hermes Agent 的最佳搭档?本文是《在骁龙 X2 Elite 上安装 Hermes Agent》系列的第一篇。你将了解 骁龙 X2 Elite 的强大硬件规格、Hermes Agent 的核心能力,以及安装前的准备工作。
Qualcomm 高通骁龙 X2 Elite AI PC时间:2026-06-11 09:33:35
基于高通跃龙IQ-9100端侧多模态大模型赋能具身智能交互系统(1): 从场景理解到VLM部署
本文介绍了具身智能为何需要端侧大模型,对比了端云部署差异,并详细给出了IQ-9100上VLM的部署代码。下一篇我们将继续深入LLM任务链规划、语音交互集成以及完整的系统演示,敬请期待。
Qualcomm 高通跃龙 IQ-9100 具身智能时间:2026-06-09 09:26:24
Qualcomm 开发者专区是 Qualcomm 联合CSDN 共同打造的面向中国开发者的技术专区。致力于通过提供全球最新资讯和最多元的技术资源及支持,为开发者们打造全面一流的开发环境。本专区将以嵌入式、物联网、游戏开发、Qualcomm® 骁龙™处理器的软件优化等技术为核心,打造全面的开发者技术服务社区,为下一代高性能体验和设计带来更多的想法和灵感。
加入 Qualcomm 开发者专区
申请成为“Qualcomm荣誉技术大使”
“Qualcomm荣誉技术大使”是Qualcomm开发者社区对开发者用户技术能力与影响力的认证体现,该荣誉代表Qualcomm社区对用户贡献的认可与肯定。
立即申请
高通技术公司推出头戴式AR开发套件骁龙Spaces™ XR开发者平台,助力打造无缝融合现实世界和数字世界边界的沉浸式体验。
为开发者提供实现创意的工具,并将变革头戴式AR的可能性,现已面市!




