feat: pass the max_lora_rank parameter to vLLM backend

Former-commit-id: a8756d839405ecb5deabe885cf11d1a61564deee
2024-05-17 16:07:39 +08:00
parent a32c3a50fc
commit 6373d307ec
2 changed files with 2 additions and 0 deletions
--- a/src/llamafactory/hparams/model_args.py
+++ b/src/llamafactory/hparams/model_args.py
@@ -117,6 +117,7 @@ class ModelArguments:
        default=False,
        metadata={"help": "Whether or not to disable CUDA graph in the vLLM engine."},
    )
+    vllm_max_lora_rank: int = field(default=8, metadata={"help": "The maximum supported rank of all LoRAs."})
    offload_folder: str = field(
        default="offload",
        metadata={"help": "Path to offload model weights."},