update readme

Former-commit-id: 9b8e7ccdab167f53fb897e1940562682324e8ff0
2024-04-02 20:37:37 +08:00
parent 2074cf99fb
commit c1510d19c7
4 changed files with 71 additions and 15 deletions
--- a/examples/README.md
+++ b/examples/README.md
@@ -0,0 +1,43 @@
+We provide diverse examples about fine-tuning LLMs.
+
+```
+examples/
+├── lora_single_gpu/
+│   ├── pt.sh: Pre-training
+│   ├── sft.sh: Supervised fine-tuning
+│   ├── reward.sh: Reward modeling
+│   ├── ppo.sh: PPO training
+│   ├── dpo.sh: DPO training
+│   ├── orpo.sh: ORPO training
+│   ├── prepare.sh: Save tokenized dataset
+│   └── predict.sh: Batch prediction
+├── qlora_single_gpu/
+│   ├── bitsandbytes.sh
+│   ├── gptq.sh
+│   ├── awq.sh
+│   └── aqlm.sh
+├── lora_multi_gpu/
+│   ├── single_node.sh
+│   └── multi_node.sh
+├── full_multi_gpu/
+│   ├── single_node.sh
+│   └── multi_node.sh
+├── merge_lora/
+│   ├── merge.sh
+│   └── quantize.sh
+├── inference/
+│   ├── cli_demo.sh
+│   ├── api_demo.sh
+│   ├── web_demo.sh
+│   └── evaluate.sh
+└── extras/
+    ├── galore/
+    │   └── sft.sh
+    ├── loraplus/
+    │   └── sft.sh
+    ├── llama_pro/
+    │   ├── expand.sh
+    │   └── sft.sh
+    └── fsdp_qlora/
+        └── sft.sh
+```
--- a/examples/extras/fsdp_qlora/fsdp.sh
+++ b/examples/extras/fsdp_qlora/fsdp.sh