[data] qwen3 fixes (#8109)

2025-05-20 02:00:30 +08:00
parent 45030ff803
commit 9b5baa97f0
13 changed files with 197 additions and 160 deletions
--- a/src/llamafactory/hparams/data_args.py
+++ b/src/llamafactory/hparams/data_args.py
@@ -115,6 +115,14 @@ class DataArguments:
        default=None,
        metadata={"help": "Tool format to use for constructing function calling examples."},
    )
+    default_system: Optional[str] = field(
+        default=None,
+        metadata={"help": "Override the default system message in the template."},
+    )
+    enable_thinking: bool = field(
+        default=True,
+        metadata={"help": "Whether or not to enable thinking mode for reasoning models."},
+    )
    tokenized_path: Optional[str] = field(
        default=None,
        metadata={
--- a/src/llamafactory/hparams/generating_args.py
+++ b/src/llamafactory/hparams/generating_args.py
@@ -13,7 +13,7 @@
 # limitations under the License.

 from dataclasses import asdict, dataclass, field
-from typing import Any, Optional
+from typing import Any

 from transformers import GenerationConfig

@@ -62,18 +62,10 @@ class GeneratingArguments:
        default=1.0,
        metadata={"help": "Exponential penalty to the length that is used with beam-based generation."},
    )
-    default_system: Optional[str] = field(
-        default=None,
-        metadata={"help": "Default system message to use in chat completion."},
-    )
    skip_special_tokens: bool = field(
        default=True,
        metadata={"help": "Whether or not to remove special tokens in the decoding."},
    )
-    enable_thinking: bool = field(
-        default=True,
-        metadata={"help": "Whether or not to enable thinking mode for reasoning models."},
-    )

    def to_dict(self, obey_generation_config: bool = False) -> dict[str, Any]:
        args = asdict(self)