LlamaFactory

ros/LlamaFactory

Fork 0

mirror of https://github.com/hiyouga/LlamaFactory.git synced 2026-03-17 10:43:08 +00:00

Commit Graph

Select branches

Hide Pull Requests

main

#1

#10109

#10110

#10112

#10114

#10123

#10124

#10124

#10127

#10131

#10137

#10139

#10145

#10147

#10152

#10155

#10156

#10157

#10159

#10161

#10163

#10165

#10172

#10172

#10173

#10174

#10176

#10181

#10183

#10185

#10185

#10188

#10188

#10189

#10190

#10190

#10192

#10192

#10194

#10196

#10198

#10199

#10200

#10201

#10202

#10203

#10204

#10205

#10206

#10208

#10209

#10210

#10211

#10212

#10212

#10213

#10214

#10215

#10220

#10222

#10223

#10225

#10227

#10232

#10236

#10237

#10242

#10252

#10254

#10255

#10255

#10259

#10260

#10262

#10262

#10264

#10264

#10265

#10267

#10268

#10269

#10273

#10274

#10274

#10276

#10276

#10280

#10280

#10281

#10283

#10283

#10284

#10284

#10288

#10288

#10289

#10289

#1059

#11

#1186

#119

#1252

#1326

#1348

#1353

#1375

#1436

#145

#1454

#1486

#1525

#1544

#1553

#156

#158

#1624

#1689

#1690

#1695

#1699

#1700

#171

#179

#1796

#1800

#1802

#1861

#1864

#1868

#1918

#1932

#1946

#1947

#1953

#1954

#200

#2007

#2019

#2100

#2117

#213

#2163

#2194

#22

#2201

#221

#2226

#2262

#2264

#2266

#2283

#2285

#2319

#2350

#2411

#2423

#2426

#2435

#2445

#2462

#2469

#2474

#2514

#2519

#2525

#2531

#2568

#2570

#2572

#2575

#258

#26

#2608

#2683

#2689

#2730

#2739

#2743

#2746

#2764

#2766

#2830

#2845

#2849

#2872

#2903

#2905

#2919

#2944

#2945

#2963

#2967

#2993

#3004

#3046

#3053

#3057

#306

#3066

#307

#3083

#3103

#3103

#3158

#3159

#3160

#3161

#3201

#3226

#3254

#3256

#3261

#3263

#3267

#3275

#3276

#3287

#3288

#3291

#33

#3332

#3338

#3357

#3371

#3383

#3394

#3412

#3423

#3435

#3449

#3450

#3454

#3471

#3484

#3487

#3490

#3498

#3511

#3513

#3527

#3532

#356

#3578

#3584

#3588

#3596

#3601

#3604

#3651

#3654

#3655

#3661

#3683

#3692

#3702

#3741

#3746

#3748

#3755

#3756

#3785

#3792

#3794

#3799

#3804

#3812

#382

#3829

#3835

#387

#3876

#3921

#3923

#3925

#3930

#3941

#395

#3958

#3976

#3987

#4003

#4006

#4007

#4009

#4011

#4015

#4029

#4043

#4045

#4053

#4066

#4080

#4082

#4083

#4098

#4099

#4119

#4136

#4166

#4167

#4173

#4191

#4204

#4224

#4227

#4234

#4237

#4245

#4246

#4307

#4309

#4314

#4321

#4329

#4334

#434

#4342

#4347

#4348

#4352

#4355

#4377

#4382

#4409

#4417

#4445

#4446

#4461

#451

#4544

#4561

#4580

#4589

#4590

#4636

#4651

#4662

#4663

#4673

#4680

#4680

#4686

#4687

#4691

#4692

#4700

#4706

#4724

#4733

#4746

#4781

#479

#4793

#4804

#4821

#4822

#4877

#4878

#4892

#4939

#4950

#4957

#4961

#4970

#4995

#4996

#5010

#5019

#5032

#5037

#5068

#5072

#5095

#51

#5109

#511

#5111

#5112

#5115

#5118

#5156

#516

#5163

#5170

#5185

#5188

#5193

#5208

#5226

#5230

#5233

#5237

#5242

#5278

#5290

#5317

#5323

#5326

#5339

#5343

#5346

#5365

#5372

#5388

#5405

#5424

#5427

#5438

#5445

#5451

#5458

#5473

#5475

#5480

#5483

#5486

#5507

#5522

#5532

#5533

#5536

#5546

#5547

#5555

#5563

#5574

#5580

#5581

#5585

#5606

#5615

#5639

#5642

#5653

#5665

#5673

#5746

#5752

#5752

#5758

#5781

#5799

#5801

#5816

#5819

#5839

#5852

#5856

#5857

#5871

#5873

#5880

#5889

#5895

#5897

#5901

#5906

#5907

#5909

#5910

#5912

#5913

#5914

#5920

#5922

#5924

#5926

#5927

#5929

#5933

#596

#5970

#5971

#5973

#598

#5982

#5984

#599

#5990

#5993

#6010

#6022

#6046

#6052

#6065

#6078

#6083

#6098

#6103

#6120

#6121

#6123

#6124

#6125

#6126

#6127

#6128

#6129

#6137

#6138

#6140

#6141

#6151

#6152

#6156

#6157

#6160

#6170

#6175

#619

#6190

#6192

#6204

#6224

#6226

#6233

#6238

#6242

#6246

#6251

#6253

#6265

#6275

#629

#6310

#6313

#6317

#6334

#6359

#6362

#6363

#6364

#6365

#6367

#6368

#6369

#6379

#6384

#6388

#6395

#6396

#6401

#6416

#6418

#6420

#6426

#6430

#644

#6441

#6443

#6444

#6457

#6462

#6465

#6471

#6478

#6483

#6492

#6493

#6498

#6503

#6506

#651

#6512

#6513

#6514

#6515

#6524

#6527

#6528

#6542

#6547

#6564

#6565

#657

#6585

#6588

#6597

#6598

#6600

#6601

#6617

#6620

#6624

#6625

#6626

#6628

#6629

#6631

#6632

#6637

#6640

#6641

#6642

#6645

#6648

#6653

#6657

#6684

#6688

#6689

#6690

#6691

#6692

#6693

#6698

#6701

#6710

#6722

#6753

#6767

#6771

#6778

#6779

#678

#6786

#6787

#6788

#6796

#6797

#68

#6801

#6810

#6814

#6830

#6831

#6834

#6843

#6854

#6855

#6857

#6865

#6866

#6868

#6874

#6879

#6890

#6892

#6895

#6896

#6899

#6901

#6902

#6903

#6904

#6905

#6906

#6907

#6913

#6916

#6917

#6918

#6920

#6930

#6931

#6944

#6946

#6954

#6963

#6972

#6975

#6976

#6977

#6982

#6983

#6985

#6998

#7019

#7051

#7053

#7054

#7058

#7060

#7061

#7067

#7074

#7077

#7089

#7106

#7108

#7117

#7120

#7126

#7142

#7143

#7161

#7166

#7174

#7176

#7179

#7181

#7183

#7190

#7193

#7201

#7204

#7205

#7206

#7207

#7209

#7211

#7219

#7229

#7230

#7231

#7235

#7241

#7242

#7244

#7247

#7253

#7254

#7255

#7256

#7257

#7258

#7259

#7264

#7272

#7273

#7275

#7277

#7278

#7287

#7288

#7294

#7295

#7304

#7308

#7312

#7317

#7318

#7330

#7332

#7338

#7340

#7343

#7345

#7347

#7349

#7351

#7361

#7378

#7381

#7395

#7404

#741

#7413

#7419

#7420

#7432

#7436

#7437

#7440

#7441

#7442

#7445

#7448

#7449

#7453

#7455

#7456

#7462

#7466

#7469

#7471

#7481

#7500

#7505

#7509

#7519

#7523

#7530

#7537

#7546

#7553

#7564

#7566

#7567

#7570

#7573

#7576

#7578

#7594

#7609

#7611

#7612

#7623

#7625

#7635

#7638

#7639

#7644

#7645

#7646

#7647

#7654

#7655

#7657

#766

#7660

#7674

#7686

#7694

#7695

#7700

#7704

#7714

#7715

#7719

#7724

#7725

#7728

#7732

#7739

#7740

#7744

#7745

#7746

#7747

#7748

#7749

#7754

#7765

#7786

#7792

#7793

#7794

#7795

#7797

#7801

#7803

#7804

#7808

#7810

#7817

#7826

#7830

#7840

#7854

#786

#7867

#7870

#7872

#7875

#7879

#7883

#7885

#7887

#7910

#7911

#7912

#7913

#7923

#7924

#7928

#7945

#7946

#7958

#7962

#7964

#7966

#7974

#7988

#7992

#8000

#8015

#8039

#8042

#8050

#8051

#8057

#8067

#8077

#8078

#8095

#8099

#8101

#8103

#8108

#8109

#8110

#8124

#8125

#8128

#8129

#8130

#8156

#8159

#8161

#8162

#8167

#8176

#8178

#8179

#8180

#8181

#8183

#8195

#8196

#8197

#8201

#8202

#8203

#8215

#8220

#8227

#8235

#8245

#8248

#8249

#8258

#8264

#8270

#8276

#8286

#8288

#8291

#8293

#8298

#83

#8303

#8311

#8312

#8314

#8325

#8327

#8328

#8333

#8335

#8348

#8362

#8367

#8385

#8386

#8387

#8388

#8389

#8390

#8396

#84

#8403

#8414

#8421

#8422

#8423

#8432

#8433

#8438

#844

#8441

#8448

#8449

#8457

#8458

#8460

#8461

#8462

#8480

#8481

#8505

#8509

#8517

#8519

#8529

#8530

#8532

#8535

#8538

#8539

#8542

#8543

#8546

#8547

#8548

#8554

#8556

#8557

#8559

#8564

#8565

#8567

#8569

#8571

#8587

#86

#8614

#8623

#8627

#8637

#8651

#8680

#8685

#8689

#8721

#8722

#8731

#8736

#8739

#8750

#8752

#8762

#8770

#8773

#8774

#8776

#8783

#8784

#8787

#8788

#8795

#8812

#8813

#8818

#8823

#8826

#8827

#8829

#8839

#8842

#8845

#8851

#8861

#8863

#8866

#8869

#8875

#8876

#8887

#8899

#8906

#8917

#8930

#8960

#8961

#8962

#8970

#8972

#8975

#8976

#8978

#8985

#8992

#900

#9000

#9008

#9018

#9022

#9024

#9028

#9029

#9046

#9071

#9077

#9078

#9086

#9086

#9112

#9117

#9124

#9128

#9129

#9130

#9137

#9143

#9165

#9176

#9177

#9183

#9188

#9196

#9198

#9204

#9215

#9217

#9219

#9221

#9223

#9224

#9225

#9226

#9227

#9229

#9230

#9231

#9232

#9236

#9237

#9243

#9248

#9249

#9259

#9262

#9263

#9265

#9267

#9274

#9275

#9284

#9293

#9296

#9297

#9299

#9316

#9333

#9337

#9337

#9343

#9351

#9351

#9352

#9354

#9360

#9368

#9370

#9370

#9388

#9391

#9395

#9397

#9399

#9400

#9405

#9406

#9407

#9409

#9449

#9463

#9467

#9477

#9484

#9485

#9486

#9492

#9501

#9504

#9505

#9509

#9511

#9514

#9518

#9520

#9521

#9532

#9536

#9539

#9541

#9543

#9544

#9547

#9549

#9552

#9557

#9569

#9575

#9579

#9582

#9586

#9587

#9588

#9593

#9595

#9602

#9604

#9607

#9608

#9610

#9611

#9612

#9613

#9615

#9615

#9616

#9617

#9619

#9621

#9624

#9626

#9627

#9630

#9630

#9632

#9633

#9634

#9636

#9637

#9638

#9640

#9643

#9645

#9649

#9651

#9652

#9654

#9661

#9665

#9669

#9670

#9673

#9675

#9676

#9677

#9678

#9680

#9682

#9685

#9687

#9688

#9692

#9696

#9700

#9701

#9702

#9703

#9705

#9707

#9709

#9710

#9714

#9715

#9716

#9717

#9717

#9720

#9721

#9722

#9724

#9725

#9726

#9729

#9730

#9731

#9732

#9733

#9733

#9734

#9735

#9736

#9738

#9740

#9740

#9741

#9742

#9744

#9745

#9746

#9749

#975

#9750

#9751

#9752

#9754

#9773

#9867

v0.0.9

v0.1.0

v0.1.1

v0.1.2

v0.1.3

v0.1.4

v0.1.5

v0.1.6

v0.1.7

v0.1.8

v0.2.0

v0.2.1

v0.2.2

v0.3.0

v0.3.2

v0.3.3

v0.4.0

v0.5.0

v0.5.2

v0.5.3

v0.6.0

v0.6.1

v0.6.2

v0.6.3

v0.7.0

v0.7.1

v0.8.0

v0.8.1

v0.8.2

v0.8.3

v0.9.0

v0.9.1

v0.9.2

v0.9.3

v0.9.4

70653026f5 [fix] make position_id_per_seconds configurable for Qwen2OmniPlugin (#10281) main LincolnBurrows2017 2026-03-16 19:42:38 +08:00
246192abd2 [data] correct gpt_oss template format_assistant (#10269) Ruijie Hou 2026-03-10 21:36:38 +08:00
0258dc14d0 [docker] update npu docker (#10268) 浮梦 2026-03-10 19:37:27 +08:00
3045adf0ba [fix] fallback to audio_processor when feature_extractor is missing (#10267) xxddccaa 2026-03-10 19:36:41 +08:00
a3d44e3152 [mca] support qwen3.5 (#10265) Kingsley 2026-03-10 10:55:16 +08:00
edeb953bc7 [data] convert filter() to list in read_cloud_json to fix broken empty-check (#10260) JiangNan 2026-03-09 17:12:53 +08:00
d045794387 [docs] fix Python version requirement from 3.10 to >=3.11.0 (#10259) yizhouChen 2026-03-09 16:44:07 +08:00
9501c3308a [train] fix compatibility issue with HuggingFace Dataset Column when sav… (#10254) pyx 2026-03-06 18:44:57 +08:00
0ee1c42c2b [v1] Support meta loading for full and free (#10236) jiaqiw09 2026-03-05 23:15:27 +08:00
3061f48d55 [ray] fix get ray head ip (#10252) SnowCharm 2026-03-05 23:14:38 +08:00
2d9bd2aa14 [fix] qwen3.5 projector path (#10242) LittleYanlin 2026-03-04 01:31:09 +08:00
c0245c43fc [model] support Qwen3.5 all series models (#10237) Hertz 2026-03-03 17:34:59 +08:00
eb976d75a2 [tracker] Add Trackio Integration for LlamaFactory (#10165) Parag Ekbote 2026-03-03 14:49:37 +05:30
b5cb7cb0e6 [misc] fix constants (#10232) Yaowei Zheng 2026-03-02 11:10:48 +08:00
0779846513 [infer] support mixed multimodal payloads (#10225) Philip Ottesen 2026-02-28 13:26:53 +01:00
45d335c709 [v1] add seed for training and fix gradient checkpointing (#10211) jiaqiw09 2026-02-28 18:16:06 +08:00
816480012f [fix] register visual part for Qwen3.5 (#10227) Kingsley 2026-02-28 16:39:24 +08:00
d3bf882e87 [docker] upgrade to ROCm 7.2 base image, drop PyTorch reinstall (#10223) Mikko Tukiainen 2026-02-27 14:16:33 +02:00
589da21d32 [model] support Aeva (#10214) 娄宗志 2026-02-26 23:03:13 +08:00
122cd46084 [model] update constants (#10220) Yaowei Zheng 2026-02-26 21:13:56 +08:00
2b8b871475 [model] Adapt Qwen3.5 (#10213) 浮梦 2026-02-26 20:45:02 +08:00
aab9b400bb [model] Add DeepSpeed Z3 leaf module for Qwen3-Next (#10194) Shanay Mehta 2026-02-24 17:24:37 +05:30
50599c719b [misc] remove safe_serialization arg for transformers v5 compatibility (#10208) P. Clawmogorov 2026-02-24 04:14:19 +01:00
a0f3ad0cee [mca] update supported models (#10196) Kingsley 2026-02-20 22:02:49 +08:00
f80e15dbb4 [ci] fix ut huggingface hub 429 error when transformers>=5.0.0 (#10155) jiaqiw09 2026-02-12 22:14:10 +08:00
991267fd3b [v1] support quantization (#10161) sunyi0505 2026-02-12 20:37:41 +08:00
5c52afa30d [v1] support deepspeed (#10181) 浮梦 2026-02-12 17:24:30 +08:00
675ce8cc7f [algo] add ASFT (#10174) Junyou Su 2026-02-12 13:12:14 +08:00
ab073f4c13 [v1] add LoRA/Freeze support and merge workflow (#10157) jiaqiw09 2026-02-12 13:02:09 +08:00
184304b5b4 [model] add liger kernel support for Qwen3-Next (#10176) Shanay Mehta 2026-02-10 19:17:48 +05:30
d3ebd5678d [model] support GLM-OCR SFT (#10183) Xue Yadong 2026-02-10 21:41:01 +08:00
1d5e8ebcd0 [v1] init commit for v1 docs (#10145) 浮梦 2026-02-09 19:43:55 +08:00
ea644d04ec [model] support GLM-4.7-Flash SFT (#10173) Shanay Mehta 2026-02-09 08:10:44 +05:30
92fa3df4c4 [trainer] add dpo/kto fsdp fsdp2 support (#10127) Username_Full 2026-02-04 23:27:12 +08:00
8bedfafa4e [model] support MiniCPM-o-4.5 (#10163) Hertz 2026-02-04 23:21:27 +08:00
1a02717fa8 [assets] update readme (#10159) Yaowei Zheng 2026-02-03 19:11:15 +08:00
e7cb145f5d [logging] Fix race condition in LoggerHandler during multi-GPU training (#10156) ゆり 2026-02-03 11:14:07 +08:00
b53d7037c2 [model] support youtu-vl model (#10152) Hertz 2026-02-02 21:42:43 +08:00
bf04ca6af8 [deps] adapt to transformers v5 (#10147) 浮梦 2026-02-02 12:07:19 +08:00
762b480131 [feature] support using ray.remote to start distributed training. (#10109) xvxuopop 2026-01-28 16:05:29 +08:00
9640f79ae5 [fix] add visual.pos_embed to Qwen3-VL visual model keys (#10139) Jewon Lee 2026-01-27 17:33:01 +09:00
7ef19eea00 [v0] Fix reward model training safetensors saving (#10137) jiaqiw09 2026-01-27 16:27:14 +08:00
f9f11dcb97 [v1] support training with fsdp2 (#9773) 浮梦 2026-01-25 19:41:58 +08:00
641bfdd482 chore: Update outdated GitHub Actions versions (#10123) Pádraic Slattery 2026-01-25 12:12:39 +01:00
e70651ac58 [feat] support all_exhausted_without_replacement in datasets.interleave_datasets (#10112) Meng WANG 2026-01-20 15:54:07 +08:00
db2f794f7b [misc] update mcore related docker and mca supported models (#10114) Kingsley 2026-01-19 14:55:16 +08:00
44eadbda1c [v1] fix kernel moe patch (#9867) jiaqiw09 2026-01-17 09:24:54 +08:00
9829ae0a77 [ci] using mp to run kernel test (#9754) 浮梦 2026-01-13 19:43:59 +08:00
958b9c3468 [v1] add sft (#9752) Yaowei Zheng 2026-01-12 03:15:01 +08:00
4d3621e3d3 [model] fixed&added Hunyuan models (#9750) Hertz 2026-01-12 01:15:00 +08:00
a296723697 [v1] upgrade batching (#9751) Yaowei Zheng 2026-01-12 00:21:36 +08:00
15b87f3125 [model] support HY-MT model (#9746) Hertz 2026-01-11 16:25:56 +08:00
9f73a6eb23 [deps] fix package (#9745) Yaowei Zheng 2026-01-10 04:27:53 +08:00
b2effbd77c [v1] add batch generator (#9744) Yaowei Zheng 2026-01-10 04:24:09 +08:00
d7d734d54c [misc] fix fp8 (#9742) Yaowei Zheng 2026-01-09 16:17:26 +08:00
8abb8fb533 [v1] use async streamer (#9741) Yaowei Zheng 2026-01-09 16:07:40 +08:00
766d5ae6ad [ci] fix workflow (#9738) Yaowei Zheng 2026-01-09 14:48:16 +08:00
5cccaeec82 [model] clean obsolete models (#9736) Yaowei Zheng 2026-01-09 14:08:18 +08:00
5fb5d7ebd3 [model] support for microsoft's Phi-4-mini (#9734) Jackey 2026-01-09 12:24:45 +08:00
03a70ba8dd [fix] correct ktransformers example config paths and templates (#9732) Peilin Li 2026-01-08 10:52:50 +08:00
5cfd804b59 [refactor] rename lfm template to lfm2 and add LFM 2.5 to README (#9731) Vo Van Phuc 2026-01-07 18:25:04 +07:00
4c1eb922e2 [misc] fix parser (#9730) Yaowei Zheng 2026-01-07 17:36:08 +08:00
958fb523a2 [model] support LiquidAI's LFM2.5-VL vision-language model (#9729) Vo Van Phuc 2026-01-07 16:20:29 +07:00
b4e051bea4 [model] support for LiquidAI's LFM2.5 (Liquid Foundation Models) (#9726) Vo Van Phuc 2026-01-07 13:14:47 +07:00
d43e1007e8 [ci] improve cuda ci cache (#9725) 浮梦 2026-01-07 12:34:40 +08:00
f89d9367e5 [assets] update README.md (#9724) Xunpeng Xiao 2026-01-07 12:11:50 +08:00
d22de0d4bf [v1] add renderer ut (#9722) Yaowei Zheng 2026-01-07 02:06:07 +08:00
ea0b4e2466 [v1] add cli sampler (#9721) Yaowei Zheng 2026-01-06 23:31:27 +08:00
e944dc442c [feature] add support for EAFT loss (#9720) yanglele 2026-01-06 23:07:12 +08:00
68119e5522 [misc] Add a PyTorch version warning for Conv3D. (#9715) Xunpeng Xiao 2026-01-05 13:26:29 +08:00
f60a6e3d01 [v1] add init plugin (#9716) Yaowei Zheng 2026-01-04 20:51:46 +08:00
81b8a50aa5 [deps] Update pyproject.toml and requirements (#9714) jiaqiw09 2026-01-04 19:52:16 +08:00
8600530002 [misc] lint (#9710) Yaowei Zheng 2026-01-04 13:47:56 +08:00
9ae62c6fc0 [model] support Youtu-LLM-2B (#9707) Hertz 2026-01-04 13:17:57 +08:00
0087bc253b [misc] Compatible with an empty architectures field in config.json (#9709) Xunpeng Xiao 2026-01-04 12:11:35 +08:00
355d5c5e5a [fix] fp8: add Transformer Engine backend support (#9705) Santosh Bhavani 2025-12-31 18:18:02 -08:00
6fe6bd290b [misc] set dev version (#9703) Yaowei Zheng 2025-12-31 23:41:40 +08:00
95ac3f2373 [release] Bye 2025 (#9702) v0.9.4 Yaowei Zheng 2025-12-31 22:22:40 +08:00
000526908a [core deps] upgrade TRL to be between 0.18 and 0.24 (#9617) Username_Full 2025-12-31 20:54:27 +08:00
c8d7e85b3e [fix] Fix prediction metrics in scripts/vllm_infer.py to match Transformers (#9701) fivehaitao 2025-12-31 18:30:00 +08:00
16735b9e35 [v1] Refactor kernel plugin (#9669) 浮梦 2025-12-31 18:26:48 +08:00
4e1d69579a [data] add DLR-Web dataset for supervised fine-tuning (#9696) Weize Liu 2025-12-30 07:50:38 -05:00
1857fbdd6b [ci] add cuda workflow (#9682) 浮梦 2025-12-29 20:03:00 +08:00
bb1ba31005 [misc] lint mca code (#9692) Kingsley 2025-12-29 11:44:38 +08:00
e97d0474fb [ci] Fix NPU device condition in docker workflow (#9688) Copilot 2025-12-28 20:04:59 +08:00
3f0c3dc84d [assets] fix installation (#9687) Yaowei Zheng 2025-12-28 19:29:28 +08:00
c107cc22d0 [model] support MiniMax-M1&M2 series (#9680) Hertz 2025-12-28 19:02:05 +08:00
7ef1fba34a [version] fix gradio (#9685) Yaowei Zheng 2025-12-28 05:00:51 +08:00
eceec8ab69 [deps] goodbye python 3.9 (#9677) Copilot 2025-12-27 02:50:44 +08:00
b44f651e09 [ci] fix docker (#9678) Yaowei Zheng 2025-12-27 02:43:46 +08:00
55590f5ece [misc] fix ci with uv (#9676) Yaowei Zheng 2025-12-27 01:39:13 +08:00
a1b1931b4a [breaking] migrate from setuptools to uv (#9673) Copilot 2025-12-26 22:47:23 +08:00
3c17f2722c [model] Update ernie_vl to adapt new version (#9665) Xunpeng Xiao 2025-12-26 19:57:49 +08:00
a882e2d5fc [assets] Add GitHub Copilot instructions for repository (#9675) Copilot 2025-12-26 17:32:48 +08:00
a754604c11 [misc] fix accelerator (#9661) Yaowei Zheng 2025-12-25 02:11:04 +08:00
6a2eafbae3 [feat] Models trained and inferred with Mxfp4 are dequantized by default (#9652) Xunpeng Xiao 2025-12-24 00:26:40 +08:00
84485406b7 [ci] disable pip cache for ci (#9654) Yaowei Zheng 2025-12-23 18:37:40 +08:00
1c8a42d2f8 [v1&WIP] dataloader init (#9645) Kingsley 2025-12-23 16:29:47 +08:00
7901b2f32e [model] efficient tuning for gpt-oss (#9354) thulyubh22 2025-12-23 16:28:38 +08:00
1f1f5a7d1b [ci] remove docker cache (#9640) Yaowei Zheng 2025-12-22 01:03:10 +08:00