fix chat engine, update webui
Former-commit-id: 8b32dddd7d883bae07735796a517927c79d1c33b
This commit is contained in:
@@ -245,20 +245,6 @@ LOCALES = {
|
||||
"label": "样例",
|
||||
},
|
||||
},
|
||||
"cutoff_len": {
|
||||
"en": {
|
||||
"label": "Cutoff length",
|
||||
"info": "Max tokens in input sequence.",
|
||||
},
|
||||
"ru": {
|
||||
"label": "Длина обрезки",
|
||||
"info": "Максимальное количество токенов во входной последовательности.",
|
||||
},
|
||||
"zh": {
|
||||
"label": "截断长度",
|
||||
"info": "输入序列分词后的最大长度。",
|
||||
},
|
||||
},
|
||||
"learning_rate": {
|
||||
"en": {
|
||||
"label": "Learning rate",
|
||||
@@ -287,6 +273,20 @@ LOCALES = {
|
||||
"info": "需要执行的训练总轮数。",
|
||||
},
|
||||
},
|
||||
"max_grad_norm": {
|
||||
"en": {
|
||||
"label": "Maximum gradient norm",
|
||||
"info": "Norm for gradient clipping.",
|
||||
},
|
||||
"ru": {
|
||||
"label": "Максимальная норма градиента",
|
||||
"info": "Норма для обрезки градиента.",
|
||||
},
|
||||
"zh": {
|
||||
"label": "最大梯度范数",
|
||||
"info": "用于梯度裁剪的范数。",
|
||||
},
|
||||
},
|
||||
"max_samples": {
|
||||
"en": {
|
||||
"label": "Max samples",
|
||||
@@ -304,15 +304,29 @@ LOCALES = {
|
||||
"compute_type": {
|
||||
"en": {
|
||||
"label": "Compute type",
|
||||
"info": "Whether to use mixed precision training (fp16 or bf16).",
|
||||
"info": "Whether to use mixed precision training.",
|
||||
},
|
||||
"ru": {
|
||||
"label": "Тип вычислений",
|
||||
"info": "Использовать ли обучение смешанной точности fp16 или bf16.",
|
||||
"info": "Использовать ли обучение смешанной точности.",
|
||||
},
|
||||
"zh": {
|
||||
"label": "计算类型",
|
||||
"info": "是否使用混合精度训练(fp16 或 bf16)。",
|
||||
"info": "是否使用混合精度训练。",
|
||||
},
|
||||
},
|
||||
"cutoff_len": {
|
||||
"en": {
|
||||
"label": "Cutoff length",
|
||||
"info": "Max tokens in input sequence.",
|
||||
},
|
||||
"ru": {
|
||||
"label": "Длина обрезки",
|
||||
"info": "Максимальное количество токенов во входной последовательности.",
|
||||
},
|
||||
"zh": {
|
||||
"label": "截断长度",
|
||||
"info": "输入序列分词后的最大长度。",
|
||||
},
|
||||
},
|
||||
"batch_size": {
|
||||
@@ -343,34 +357,6 @@ LOCALES = {
|
||||
"info": "梯度累积的步数。",
|
||||
},
|
||||
},
|
||||
"lr_scheduler_type": {
|
||||
"en": {
|
||||
"label": "LR scheduler",
|
||||
"info": "Name of the learning rate scheduler.",
|
||||
},
|
||||
"ru": {
|
||||
"label": "Планировщик скорости обучения",
|
||||
"info": "Название планировщика скорости обучения.",
|
||||
},
|
||||
"zh": {
|
||||
"label": "学习率调节器",
|
||||
"info": "学习率调度器的名称。",
|
||||
},
|
||||
},
|
||||
"max_grad_norm": {
|
||||
"en": {
|
||||
"label": "Maximum gradient norm",
|
||||
"info": "Norm for gradient clipping.",
|
||||
},
|
||||
"ru": {
|
||||
"label": "Максимальная норма градиента",
|
||||
"info": "Норма для обрезки градиента.",
|
||||
},
|
||||
"zh": {
|
||||
"label": "最大梯度范数",
|
||||
"info": "用于梯度裁剪的范数。",
|
||||
},
|
||||
},
|
||||
"val_size": {
|
||||
"en": {
|
||||
"label": "Val size",
|
||||
@@ -385,6 +371,20 @@ LOCALES = {
|
||||
"info": "验证集占全部样本的百分比。",
|
||||
},
|
||||
},
|
||||
"lr_scheduler_type": {
|
||||
"en": {
|
||||
"label": "LR scheduler",
|
||||
"info": "Name of the learning rate scheduler.",
|
||||
},
|
||||
"ru": {
|
||||
"label": "Планировщик скорости обучения",
|
||||
"info": "Название планировщика скорости обучения.",
|
||||
},
|
||||
"zh": {
|
||||
"label": "学习率调节器",
|
||||
"info": "学习率调度器的名称。",
|
||||
},
|
||||
},
|
||||
"extra_tab": {
|
||||
"en": {
|
||||
"label": "Extra configurations",
|
||||
@@ -452,6 +452,20 @@ LOCALES = {
|
||||
"info": "嵌入向量所添加的噪声大小。",
|
||||
},
|
||||
},
|
||||
"optim": {
|
||||
"en": {
|
||||
"label": "Optimizer",
|
||||
"info": "The optimizer to use: adamw_torch, adamw_8bit or adafactor.",
|
||||
},
|
||||
"ru": {
|
||||
"label": "Оптимизатор",
|
||||
"info": "Оптимизатор для использования: adamw_torch, adamw_8bit или adafactor.",
|
||||
},
|
||||
"zh": {
|
||||
"label": "优化器",
|
||||
"info": "使用的优化器:adamw_torch、adamw_8bit 或 adafactor。",
|
||||
},
|
||||
},
|
||||
"resize_vocab": {
|
||||
"en": {
|
||||
"label": "Resize token embeddings",
|
||||
@@ -508,6 +522,20 @@ LOCALES = {
|
||||
"info": "仅训练块扩展后的参数。",
|
||||
},
|
||||
},
|
||||
"shift_attn": {
|
||||
"en": {
|
||||
"label": "Enable S^2 Attention",
|
||||
"info": "Use shift short attention proposed by LongLoRA.",
|
||||
},
|
||||
"ru": {
|
||||
"label": "Включить S^2 внимание",
|
||||
"info": "Использовать сдвиг внимания на короткие дистанции предложенный LongLoRA.",
|
||||
},
|
||||
"zh": {
|
||||
"label": "使用 S^2 Attention",
|
||||
"info": "使用 LongLoRA 提出的 shift short attention。",
|
||||
},
|
||||
},
|
||||
"freeze_tab": {
|
||||
"en": {
|
||||
"label": "Freeze tuning configurations",
|
||||
@@ -569,16 +597,16 @@ LOCALES = {
|
||||
},
|
||||
"zh": {
|
||||
"label": "LoRA 秩",
|
||||
"info": "LoRA 矩阵的秩。",
|
||||
"info": "LoRA 矩阵的秩大小。",
|
||||
},
|
||||
},
|
||||
"lora_alpha": {
|
||||
"en": {
|
||||
"label": "LoRA Alpha",
|
||||
"label": "LoRA alpha",
|
||||
"info": "Lora scaling coefficient.",
|
||||
},
|
||||
"ru": {
|
||||
"label": "LoRA Alpha",
|
||||
"label": "LoRA alpha",
|
||||
"info": "Коэффициент масштабирования LoRA.",
|
||||
},
|
||||
"zh": {
|
||||
@@ -588,7 +616,7 @@ LOCALES = {
|
||||
},
|
||||
"lora_dropout": {
|
||||
"en": {
|
||||
"label": "LoRA Dropout",
|
||||
"label": "LoRA dropout",
|
||||
"info": "Dropout ratio of LoRA weights.",
|
||||
},
|
||||
"ru": {
|
||||
@@ -603,15 +631,15 @@ LOCALES = {
|
||||
"lora_target": {
|
||||
"en": {
|
||||
"label": "LoRA modules (optional)",
|
||||
"info": "Name(s) of target modules to apply LoRA. Use commas to separate multiple modules.",
|
||||
"info": "Name(s) of modules to apply LoRA. Use commas to separate multiple modules.",
|
||||
},
|
||||
"ru": {
|
||||
"label": "Модули LoRA (опционально)",
|
||||
"info": "Имена целевых модулей для применения LoRA. Используйте запятые для разделения нескольких модулей.",
|
||||
"info": "Имена модулей для применения LoRA. Используйте запятые для разделения нескольких модулей.",
|
||||
},
|
||||
"zh": {
|
||||
"label": "LoRA 作用模块(非必填)",
|
||||
"info": "应用 LoRA 的目标模块名称。使用英文逗号分隔多个名称。",
|
||||
"info": "应用 LoRA 的模块名称。使用英文逗号分隔多个名称。",
|
||||
},
|
||||
},
|
||||
"use_rslora": {
|
||||
@@ -659,7 +687,10 @@ LOCALES = {
|
||||
"additional_target": {
|
||||
"en": {
|
||||
"label": "Additional modules (optional)",
|
||||
"info": "Name(s) of modules apart from LoRA layers to be set as trainable. Use commas to separate multiple modules.",
|
||||
"info": (
|
||||
"Name(s) of modules apart from LoRA layers to be set as trainable. "
|
||||
"Use commas to separate multiple modules."
|
||||
),
|
||||
},
|
||||
"ru": {
|
||||
"label": "Дополнительные модули (опционально)",
|
||||
@@ -726,6 +757,87 @@ LOCALES = {
|
||||
"info": "PPO 训练中奖励模型的适配器路径。(需要刷新适配器)",
|
||||
},
|
||||
},
|
||||
"galore_tab": {
|
||||
"en": {
|
||||
"label": "GaLore configurations",
|
||||
},
|
||||
"ru": {
|
||||
"label": "Конфигурации GaLore",
|
||||
},
|
||||
"zh": {
|
||||
"label": "GaLore 参数设置",
|
||||
},
|
||||
},
|
||||
"use_galore": {
|
||||
"en": {
|
||||
"label": "Use GaLore",
|
||||
"info": "Enable gradient low-Rank projection.",
|
||||
},
|
||||
"ru": {
|
||||
"label": "Использовать GaLore",
|
||||
"info": "Включить проекцию градиента на низкоранговое пространство.",
|
||||
},
|
||||
"zh": {
|
||||
"label": "使用 GaLore",
|
||||
"info": "使用梯度低秩投影。",
|
||||
},
|
||||
},
|
||||
"galore_rank": {
|
||||
"en": {
|
||||
"label": "GaLore rank",
|
||||
"info": "The rank of GaLore gradients.",
|
||||
},
|
||||
"ru": {
|
||||
"label": "Ранг GaLore",
|
||||
"info": "Ранг градиентов GaLore.",
|
||||
},
|
||||
"zh": {
|
||||
"label": "GaLore 秩",
|
||||
"info": "GaLore 梯度的秩大小。",
|
||||
},
|
||||
},
|
||||
"galore_update_interval": {
|
||||
"en": {
|
||||
"label": "Update interval",
|
||||
"info": "Number of steps to update the GaLore projection.",
|
||||
},
|
||||
"ru": {
|
||||
"label": "Интервал обновления",
|
||||
"info": "Количество шагов для обновления проекции GaLore.",
|
||||
},
|
||||
"zh": {
|
||||
"label": "更新间隔",
|
||||
"info": "相邻两次投影更新的步数。",
|
||||
},
|
||||
},
|
||||
"galore_scale": {
|
||||
"en": {
|
||||
"label": "GaLore scale",
|
||||
"info": "GaLore scaling coefficient.",
|
||||
},
|
||||
"ru": {
|
||||
"label": "LoRA Alpha",
|
||||
"info": "Коэффициент масштабирования GaLore.",
|
||||
},
|
||||
"zh": {
|
||||
"label": "GaLore 缩放系数",
|
||||
"info": "GaLore 缩放系数大小。",
|
||||
},
|
||||
},
|
||||
"galore_target": {
|
||||
"en": {
|
||||
"label": "GaLore modules",
|
||||
"info": "Name(s) of modules to apply GaLore. Use commas to separate multiple modules.",
|
||||
},
|
||||
"ru": {
|
||||
"label": "Модули GaLore",
|
||||
"info": "Имена модулей для применения GaLore. Используйте запятые для разделения нескольких модулей.",
|
||||
},
|
||||
"zh": {
|
||||
"label": "GaLore 作用模块",
|
||||
"info": "应用 GaLore 的模块名称。使用英文逗号分隔多个名称。",
|
||||
},
|
||||
},
|
||||
"cmd_preview_btn": {
|
||||
"en": {
|
||||
"value": "Preview command",
|
||||
@@ -806,6 +918,17 @@ LOCALES = {
|
||||
"label": "保存预测结果",
|
||||
},
|
||||
},
|
||||
"infer_backend": {
|
||||
"en": {
|
||||
"label": "Inference engine",
|
||||
},
|
||||
"ru": {
|
||||
"label": "Инференс движок",
|
||||
},
|
||||
"zh": {
|
||||
"label": "推理引擎",
|
||||
},
|
||||
},
|
||||
"load_btn": {
|
||||
"en": {
|
||||
"value": "Load model",
|
||||
|
||||
Reference in New Issue
Block a user