fix chat engine, update webui

Former-commit-id: 8b32dddd7d883bae07735796a517927c79d1c33b
2024-03-08 03:01:53 +08:00
parent 8042c66a76
commit 48d4364586
9 changed files with 250 additions and 83 deletions
--- a/src/llmtuner/webui/locales.py
+++ b/src/llmtuner/webui/locales.py
@@ -245,20 +245,6 @@ LOCALES = {
            "label": "样例",
        },
    },
-    "cutoff_len": {
-        "en": {
-            "label": "Cutoff length",
-            "info": "Max tokens in input sequence.",
-        },
-        "ru": {
-            "label": "Длина обрезки",
-            "info": "Максимальное количество токенов во входной последовательности.",
-        },
-        "zh": {
-            "label": "截断长度",
-            "info": "输入序列分词后的最大长度。",
-        },
-    },
    "learning_rate": {
        "en": {
            "label": "Learning rate",
@@ -287,6 +273,20 @@ LOCALES = {
            "info": "需要执行的训练总轮数。",
        },
    },
+    "max_grad_norm": {
+        "en": {
+            "label": "Maximum gradient norm",
+            "info": "Norm for gradient clipping.",
+        },
+        "ru": {
+            "label": "Максимальная норма градиента",
+            "info": "Норма для обрезки градиента.",
+        },
+        "zh": {
+            "label": "最大梯度范数",
+            "info": "用于梯度裁剪的范数。",
+        },
+    },
    "max_samples": {
        "en": {
            "label": "Max samples",
@@ -304,15 +304,29 @@ LOCALES = {
    "compute_type": {
        "en": {
            "label": "Compute type",
-            "info": "Whether to use mixed precision training (fp16 or bf16).",
+            "info": "Whether to use mixed precision training.",
        },
        "ru": {
            "label": "Тип вычислений",
-            "info": "Использовать ли обучение смешанной точности fp16 или bf16.",
+            "info": "Использовать ли обучение смешанной точности.",
        },
        "zh": {
            "label": "计算类型",
-            "info": "是否使用混合精度训练（fp16 或 bf16）。",
+            "info": "是否使用混合精度训练。",
+        },
+    },
+    "cutoff_len": {
+        "en": {
+            "label": "Cutoff length",
+            "info": "Max tokens in input sequence.",
+        },
+        "ru": {
+            "label": "Длина обрезки",
+            "info": "Максимальное количество токенов во входной последовательности.",
+        },
+        "zh": {
+            "label": "截断长度",
+            "info": "输入序列分词后的最大长度。",
        },
    },
    "batch_size": {
@@ -343,34 +357,6 @@ LOCALES = {
            "info": "梯度累积的步数。",
        },
    },
-    "lr_scheduler_type": {
-        "en": {
-            "label": "LR scheduler",
-            "info": "Name of the learning rate scheduler.",
-        },
-        "ru": {
-            "label": "Планировщик скорости обучения",
-            "info": "Название планировщика скорости обучения.",
-        },
-        "zh": {
-            "label": "学习率调节器",
-            "info": "学习率调度器的名称。",
-        },
-    },
-    "max_grad_norm": {
-        "en": {
-            "label": "Maximum gradient norm",
-            "info": "Norm for gradient clipping.",
-        },
-        "ru": {
-            "label": "Максимальная норма градиента",
-            "info": "Норма для обрезки градиента.",
-        },
-        "zh": {
-            "label": "最大梯度范数",
-            "info": "用于梯度裁剪的范数。",
-        },
-    },
    "val_size": {
        "en": {
            "label": "Val size",
@@ -385,6 +371,20 @@ LOCALES = {
            "info": "验证集占全部样本的百分比。",
        },
    },
+    "lr_scheduler_type": {
+        "en": {
+            "label": "LR scheduler",
+            "info": "Name of the learning rate scheduler.",
+        },
+        "ru": {
+            "label": "Планировщик скорости обучения",
+            "info": "Название планировщика скорости обучения.",
+        },
+        "zh": {
+            "label": "学习率调节器",
+            "info": "学习率调度器的名称。",
+        },
+    },
    "extra_tab": {
        "en": {
            "label": "Extra configurations",
@@ -452,6 +452,20 @@ LOCALES = {
            "info": "嵌入向量所添加的噪声大小。",
        },
    },
+    "optim": {
+        "en": {
+            "label": "Optimizer",
+            "info": "The optimizer to use: adamw_torch, adamw_8bit or adafactor.",
+        },
+        "ru": {
+            "label": "Оптимизатор",
+            "info": "Оптимизатор для использования: adamw_torch, adamw_8bit или adafactor.",
+        },
+        "zh": {
+            "label": "优化器",
+            "info": "使用的优化器：adamw_torch、adamw_8bit 或 adafactor。",
+        },
+    },
    "resize_vocab": {
        "en": {
            "label": "Resize token embeddings",
@@ -508,6 +522,20 @@ LOCALES = {
            "info": "仅训练块扩展后的参数。",
        },
    },
+    "shift_attn": {
+        "en": {
+            "label": "Enable S^2 Attention",
+            "info": "Use shift short attention proposed by LongLoRA.",
+        },
+        "ru": {
+            "label": "Включить S^2 внимание",
+            "info": "Использовать сдвиг внимания на короткие дистанции предложенный LongLoRA.",
+        },
+        "zh": {
+            "label": "使用 S^2 Attention",
+            "info": "使用 LongLoRA 提出的 shift short attention。",
+        },
+    },
    "freeze_tab": {
        "en": {
            "label": "Freeze tuning configurations",
@@ -569,16 +597,16 @@ LOCALES = {
        },
        "zh": {
            "label": "LoRA 秩",
-            "info": "LoRA 矩阵的秩。",
+            "info": "LoRA 矩阵的秩大小。",
        },
    },
    "lora_alpha": {
        "en": {
-            "label": "LoRA Alpha",
+            "label": "LoRA alpha",
            "info": "Lora scaling coefficient.",
        },
        "ru": {
-            "label": "LoRA Alpha",
+            "label": "LoRA alpha",
            "info": "Коэффициент масштабирования LoRA.",
        },
        "zh": {
@@ -588,7 +616,7 @@ LOCALES = {
    },
    "lora_dropout": {
        "en": {
-            "label": "LoRA Dropout",
+            "label": "LoRA dropout",
            "info": "Dropout ratio of LoRA weights.",
        },
        "ru": {
@@ -603,15 +631,15 @@ LOCALES = {
    "lora_target": {
        "en": {
            "label": "LoRA modules (optional)",
-            "info": "Name(s) of target modules to apply LoRA. Use commas to separate multiple modules.",
+            "info": "Name(s) of modules to apply LoRA. Use commas to separate multiple modules.",
        },
        "ru": {
            "label": "Модули LoRA (опционально)",
-            "info": "Имена целевых модулей для применения LoRA. Используйте запятые для разделения нескольких модулей.",
+            "info": "Имена модулей для применения LoRA. Используйте запятые для разделения нескольких модулей.",
        },
        "zh": {
            "label": "LoRA 作用模块（非必填）",
-            "info": "应用 LoRA 的目标模块名称。使用英文逗号分隔多个名称。",
+            "info": "应用 LoRA 的模块名称。使用英文逗号分隔多个名称。",
        },
    },
    "use_rslora": {
@@ -659,7 +687,10 @@ LOCALES = {
    "additional_target": {
        "en": {
            "label": "Additional modules (optional)",
-            "info": "Name(s) of modules apart from LoRA layers to be set as trainable. Use commas to separate multiple modules.",
+            "info": (
+                "Name(s) of modules apart from LoRA layers to be set as trainable. "
+                "Use commas to separate multiple modules."
+            ),
        },
        "ru": {
            "label": "Дополнительные модули (опционально)",
@@ -726,6 +757,87 @@ LOCALES = {
            "info": "PPO 训练中奖励模型的适配器路径。（需要刷新适配器）",
        },
    },
+    "galore_tab": {
+        "en": {
+            "label": "GaLore configurations",
+        },
+        "ru": {
+            "label": "Конфигурации GaLore",
+        },
+        "zh": {
+            "label": "GaLore 参数设置",
+        },
+    },
+    "use_galore": {
+        "en": {
+            "label": "Use GaLore",
+            "info": "Enable gradient low-Rank projection.",
+        },
+        "ru": {
+            "label": "Использовать GaLore",
+            "info": "Включить проекцию градиента на низкоранговое пространство.",
+        },
+        "zh": {
+            "label": "使用 GaLore",
+            "info": "使用梯度低秩投影。",
+        },
+    },
+    "galore_rank": {
+        "en": {
+            "label": "GaLore rank",
+            "info": "The rank of GaLore gradients.",
+        },
+        "ru": {
+            "label": "Ранг GaLore",
+            "info": "Ранг градиентов GaLore.",
+        },
+        "zh": {
+            "label": "GaLore 秩",
+            "info": "GaLore 梯度的秩大小。",
+        },
+    },
+    "galore_update_interval": {
+        "en": {
+            "label": "Update interval",
+            "info": "Number of steps to update the GaLore projection.",
+        },
+        "ru": {
+            "label": "Интервал обновления",
+            "info": "Количество шагов для обновления проекции GaLore.",
+        },
+        "zh": {
+            "label": "更新间隔",
+            "info": "相邻两次投影更新的步数。",
+        },
+    },
+    "galore_scale": {
+        "en": {
+            "label": "GaLore scale",
+            "info": "GaLore scaling coefficient.",
+        },
+        "ru": {
+            "label": "LoRA Alpha",
+            "info": "Коэффициент масштабирования GaLore.",
+        },
+        "zh": {
+            "label": "GaLore 缩放系数",
+            "info": "GaLore 缩放系数大小。",
+        },
+    },
+    "galore_target": {
+        "en": {
+            "label": "GaLore modules",
+            "info": "Name(s) of modules to apply GaLore. Use commas to separate multiple modules.",
+        },
+        "ru": {
+            "label": "Модули GaLore",
+            "info": "Имена модулей для применения GaLore. Используйте запятые для разделения нескольких модулей.",
+        },
+        "zh": {
+            "label": "GaLore 作用模块",
+            "info": "应用 GaLore 的模块名称。使用英文逗号分隔多个名称。",
+        },
+    },
    "cmd_preview_btn": {
        "en": {
            "value": "Preview command",
@@ -806,6 +918,17 @@ LOCALES = {
            "label": "保存预测结果",
        },
    },
+    "infer_backend": {
+        "en": {
+            "label": "Inference engine",
+        },
+        "ru": {
+            "label": "Инференс движок",
+        },
+        "zh": {
+            "label": "推理引擎",
+        },
+    },
    "load_btn": {
        "en": {
            "value": "Load model",