通过docker起了一个后端服务
docker run --gpus '"device=3"' -d -p 8000:8000 -v /opt/sol/DeepAnalyze/models:/models --name deepanalyze-vllm registry.cn-shanghai.aliyuncs.com/cong-cong/deepanalyze-env:latest python3 -m vllm.entrypoints.openai.api_server --model /models/deepanalyze-8b-q4_k_m.gguf --tokenizer /models/DeepAnalyze-8B --tensor-parallel-size 1 --host 0.0.0.0 --port 8000 --gpu-memory-utilization 0.67 --max-model-len 4096 --kv-cache-dtype fp8 --enforce-eager --max-num-seqs 64 --load-format gguf

然后又起了一个前端,然后执行相关命令
cd demo/chat
npm install
cd ..
bash start.sh
stop the api and interface
bash stop.sh

最终前端无法上传文件,也无法正常聊天
