快速开始#

使用lightllm部署模型非常简单，最快只需要两个步骤：

准备 Lightllm 所支持的模型的权重文件。
使用命令行启动模型服务。
(可选) 对模型服务进行测试。

Note

在继续这个教程之前，请确保你完成了安装指南 .

1. 准备模型文件#

下面的内容将会以 Qwen3-8B 演示lightllm对大语言模型的支持。下载模型的方法可以参考文章：如何快速下载huggingface模型——全方法总结

下面是下载模型的实例代码：

（可选）创建文件夹

$ mkdirs ~/models && cd ~/models

安装 huggingface_hub

$ pip install -U huggingface_hub

下载模型文件

$ huggingface-cli download Qwen/Qwen3-8B --local-dir Qwen3-8B

2. 启动模型服务#

下载完Qwen3-8B模型以后，在终端使用下面的代码部署API服务：

$ python -m lightllm.server.api_server --model_dir ~/models/Qwen3-8B

Note

上面代码中的 --model_dir 参数需要修改为你本机实际的模型路径。

3. 测试模型服务#

$ curl http://127.0.0.1:8000/generate \
     -H "Content-Type: application/json" \
     -d '{
           "inputs": "What is AI?",
           "parameters":{
             "max_new_tokens":17,
             "frequency_penalty":1
           }
          }'

快速开始

Contents

快速开始#

1. 准备模型文件#

2. 启动模型服务#

3. 测试模型服务#