Merge pull request #2849 from S3Studio/DockerizeSupport

Improve Dockerize support Former-commit-id: b63cba317266f5ba217de54fda77ec26a4df344d
2024-03-15 19:16:02 +08:00
parent ed020579dc 096869c7b6
commit 772fc2eac7
3 changed files with 7 additions and 5 deletions
--- a/src/llmtuner/model/patcher.py
+++ b/src/llmtuner/model/patcher.py
@@ -283,6 +283,9 @@ def patch_config(
            setattr(config, dtype_name, model_args.compute_dtype == dtype)

    _configure_attn_implementation(model_args, init_kwargs)
+    if getattr(config, "model_type", None) == "qwen" and init_kwargs["attn_implementation"] != "flash_attention_2":
+        config.use_flash_attn = False
+
    _configure_rope(config, model_args, is_trainable)
    _configure_longlora(config, model_args, is_trainable)
    _configure_quantization(config, tokenizer, model_args, init_kwargs)