模型加载优化:HuggingFace集成、tensorizer与分片加载

课程名称:VLLM 从入门到精通 更新日期:2025-12-04