0P-2026-0626-005

Hugging Face Blog 发布 HF Jobs 运行 vLLM Server 资料

事实摘要

Hugging Face Blog 在 2026-06-26 发布题为“Run a vLLM Server on HF Jobs in One Command”的资料。

该页面说明,用户可使用 hf jobs run 在 Hugging Face infrastructure 上运行 vllm/vllm-openai 容器,并通过 --expose 8000 暴露 vLLM 的 OpenAI-compatible endpoint。页面示例使用 Qwen/Qwen3-4B,并列出通过 curl、OpenAI Python client、Gradio UI 和 SSH 访问运行中 job 的方式。

相关图像

图像记录待补。

关联资料

相关实体