implement efficient packing without cross-contamination attention

Former-commit-id: a64a5305c0da5ef092d4cc26faf829bb44de65d1
This commit is contained in:
ancv
2024-06-12 11:56:01 +07:00
parent 6d9fbb3fa9
commit c7ab302c69
9 changed files with 287 additions and 8 deletions

View File

@@ -494,6 +494,20 @@ LOCALES = {
"info": "将序列打包为等长样本。",
},
},
"efficient_packing": {
"en": {
"label": "Pack sequences for efficient training",
"info": "Pack sequences into samples of fixed length without cross-contamination attention for efficient training.",
},
"ru": {
"label": "Пакетные последовательности для эффективного обучения",
"info": "Упакуйте последовательности в образцы фиксированной длины без учета перекрестного загрязнения для эффективного обучения.",
},
"zh": {
"label": "打包序列以实现高效训练",
"info": "为了提高训练效率,将序列打包成固定长度的样本,无需注意交叉污染。",
},
},
"upcast_layernorm": {
"en": {
"label": "Upcast LayerNorm",