快速开始#
使用lightllm部署模型非常简单,最快只需要两个步骤:
准备 Lightllm 所支持的模型的权重文件。
使用命令行启动模型服务。
(可选) 对模型服务进行测试。
Note
在继续这个教程之前,请确保你完成了 安装指南 .
1. 准备模型文件#
下面的内容将会以 Qwen3-8B 演示lightllm对大语言模型的支持。 下载模型的方法可以参考文章:如何快速下载huggingface模型——全方法总结
下面是下载模型的实例代码:
(可选)创建文件夹
$ mkdirs ~/models && cd ~/models
安装
huggingface_hub
$ pip install -U huggingface_hub
下载模型文件
$ huggingface-cli download Qwen/Qwen3-8B --local-dir Qwen3-8B
2. 启动模型服务#
下载完Qwen3-8B模型以后,在终端使用下面的代码部署API服务:
$ python -m lightllm.server.api_server --model_dir ~/models/Qwen3-8B
Note
上面代码中的 --model_dir 参数需要修改为你本机实际的模型路径。
3. 测试模型服务#
$ curl http://127.0.0.1:8000/generate \
-H "Content-Type: application/json" \
-d '{
"inputs": "What is AI?",
"parameters":{
"max_new_tokens":17,
"frequency_penalty":1
}
}'