Skip to content
火山知识库
Search
K
Main Navigation
首页
客户端
服务端
系统与底层
DevOps
AI应用与大模型
关于
Appearance
Menu
Return to top
On this page
部署与优化
部署与优化领域关注如何将AI模型高效地部署到生产环境,以及如何优化模型性能、资源利用率和用户体验。
主要内容
模型部署
- 云服务、边缘设备和混合环境的模型部署方案
性能优化
- 量化、剪枝、蒸馏等模型优化技术
推理引擎
- ONNX Runtime、TensorRT等高性能推理引擎
监控与管理
- 模型性能监控、版本管理和A/B测试
子领域
模型部署
模型量化与压缩
推理优化
服务化与扩展
成本优化