0P-2026-0626-005
Hugging Face Blog 发布 HF Jobs 运行 vLLM Server 资料
事实摘要
Hugging Face Blog 在 2026-06-26 发布题为“Run a vLLM Server on HF Jobs in One Command”的资料。
该页面说明,用户可使用 hf jobs run 在 Hugging Face infrastructure 上运行 vllm/vllm-openai
容器,并通过 --expose 8000 暴露 vLLM 的 OpenAI-compatible endpoint。页面示例使用
Qwen/Qwen3-4B,并列出通过 curl、OpenAI Python client、Gradio UI 和 SSH 访问运行中 job 的方式。
相关图像
图像记录待补。