HTP 是否计划支持 grouped quantization?
发帖人:weixin_46424698 时间:14小时前 AI 大赛
端侧 GenAI 隐私:如何实现?模型和数据是否完全离线?还有哪些“容易忽略的泄露面”?
发帖人:weixin_46424698 时间:14小时前 AI 大赛
新模型(GLM4.6、YOLO13):能否直接转换与量化?有哪些前置条件/限制?
发帖人:weixin_46424698 时间:14小时前 AI 大赛
QAIRT 支持主流框架:TF/PyTorch 模型能“开箱即用”吗?还要不要转换?
发帖人:weixin_46424698 时间:14小时前 AI 大赛
QAIRT 生态建设:有没有类似 Hugging Face 的“可直接跑”模型社区?
发帖人:weixin_46424698 时间:14小时前 AI 大赛
模型转换的完整pipeline是怎样的?从训练到部署中间有哪些坑要注意?
发帖人:nomomoly 时间:14小时前 AI 大赛
多模态模型(如 CLIP、Whisper)如何使用 AppBuilder 部署?是否有现成的案例?
发帖人:nomomoly 时间:14小时前 AI 大赛
LangFlow 构建的流程如果要嵌入本地应用(桌面端或移动端),有没有推荐的接入方式?
发帖人:nomomoly 时间:14小时前 AI 大赛
目前端侧运行大语言模型 (LLM) 是否靠谱?例如 7B 模型在最新骁龙平台上的 token 速度、功耗大概是什么水平?
发帖人:nomomoly 时间:14小时前 AI 大赛
除了常规算子融合、量化外,QAIRT 2025 在编译器上是否有独特优化策略?
发帖人:nomomoly 时间:14小时前 AI 大赛
做性能分析时,可视化工具能否看到每一层在 NPU 上的耗时和内存占用?
发帖人:nomomoly 时间:14小时前 AI 大赛
QAIRT 2025 相比之前的版本,对开发者来说最直观、最明显的提升是什么?
发帖人:weixin_61922525 时间:14小时前 AI 大赛
GenAl在端侧的个性化微调 (Fine-tuning) 具体是怎么实现的?
发帖人:weixin_61922525 时间:14小时前 AI 大赛
当模型部署到手机上之后,效果和在PC上不一样,咱们的调试工具有没有什么“一键诊断”之类的便捷功能,帮我们快速定位问题?
发帖人:weixin_61922525 时间:14小时前 AI 大赛
GenAl新特性里,有没有一些针对Stable Diffusion这类文生图模型的特殊优化?比如推理速度或者内存占用方面的
发帖人:Llehevo 时间:15小时前 AI 大赛
设备端跑多模态或个性化的 GenAI 应用时,延迟有时候会比较高。有没有推荐的优化方法?比如模型拆分、缓存策略、或者 Python API 的调用方式有没有最佳实践?
发帖人:Llehevo 时间:15小时前 AI 大赛
使用 Qualcomm AI Stack 做端侧部署时,如果模型精度出现下降,该从哪些环节排查?
发帖人:Llehevo 时间:15小时前 AI 大赛
老师您好!请问这些技术可以用来做本地AI助手吗?
发帖人:super111654 时间:1天前 AI 大赛
请问在移动设备NPU上能跑多大参数量的LLM?比如7B、13B模型可以吗?
发帖人:super111654 时间:1天前 AI 大赛
GenieAPIService 调用本地NPU上的大语言模型时,对设备有什么性能要求?内存或算力要达到什么水平?
发帖人:super111654 时间:1天前 AI 大赛
Qualcomm 开发者专区是 Qualcomm 联合CSDN 共同打造的面向中国开发者的技术专区。致力于通过提供全球最新资讯和最多元的技术资源及支持,为开发者们打造全面一流的开发环境。本专区将以嵌入式、物联网、游戏开发、Qualcomm® 骁龙™处理器的软件优化等技术为核心,打造全面的开发者技术服务社区,为下一代高性能体验和设计带来更多的想法和灵感。
加入 Qualcomm 开发者专区
申请成为“Qualcomm荣誉技术大使”
“Qualcomm荣誉技术大使”是Qualcomm开发者社区对开发者用户技术能力与影响力的认证体现,该荣誉代表Qualcomm社区对用户贡献的认可与肯定。
立即申请
高通技术公司推出头戴式AR开发套件骁龙Spaces™ XR开发者平台,助力打造无缝融合现实世界和数字世界边界的沉浸式体验。
为开发者提供实现创意的工具,并将变革头戴式AR的可能性,现已面市!