Xintong Li

Kaylee0501

2

·

https://kaylee0501.github.io/

AI & ML interests

NLP, Multimodal, LLM Reasoning

Recent Activity

updated a model about 2 months ago

Kaylee0501/swe-4B-tree-prm-bch8_2_13-topk4-repeat6-step450

published a model about 2 months ago

Kaylee0501/swe-4B-tree-prm-bch8_2_13-topk4-repeat6-step450

updated a model about 2 months ago

Kaylee0501/swe-4B-tree-prm-bch8_2_13-topk4-repeat6-step380

View all activity

Organizations

Kaylee0501 's models 28

Kaylee0501/swe-4B-tree-prm-bch8_2_13-topk4-repeat6-step450

Kaylee0501/swe-4B-tree-prm-bch8_2_13-topk4-repeat6-step380

Kaylee0501/swe-4B-tree-prm-bch8_2_13-topk2-repeat8-max10-step460

Kaylee0501/qwen2_7b_grpo_150

8B • Updated May 7 • 1

Kaylee0501/qwen2_vl_7b_COT_grpo_LLM-judge_nat_460

8B • Updated May 6 • 4

Kaylee0501/qwen2_vl_7b_COT_grpo_LLM-judge_930

8B • Updated May 6 • 2

Kaylee0501/qwen2_vl_7b_COT_grpo_800

8B • Updated May 6 • 2

Kaylee0501/qwen2_vl_7b_COT_grpo_LLM-judge_nat_690

8B • Updated May 6 • 2

Kaylee0501/qwen3_vl_8b_COT_grpo_LLM-judge_400

9B • Updated May 5 • 1

Kaylee0501/qwen3_vl_8b_wo-COT_grpo_800

9B • Updated May 5 • 2

Kaylee0501/qwen3_vl_8b_COT_grpo_LLM-judge_nat_680

9B • Updated May 5 • 5

Kaylee0501/qwen3_vl_8b_wo-COT_grpo_90

9B • Updated May 5 • 3

Kaylee0501/qwen3_vl_8b_COT_grpo_reward0.3_90

9B • Updated May 5 • 1

Kaylee0501/qwen3_vl_8b_COT_grpo_180

9B • Updated May 5 • 2

Kaylee0501/qwen2_vl_7b_COT_grpo_reward0.3_110

8B • Updated May 5 • 1

Kaylee0501/qwen2_vl_7b_COT_grpo_490

8B • Updated May 5 • 1

Kaylee0501/Qwen2.5-Coder-32B-Instruct-SFT-planning3

33B • Updated Mar 18 • 5

Kaylee0501/Qwen2.5-Coder-32B-Instruct-SFT-planning2

33B • Updated Mar 17 • 2

Kaylee0501/Qwen2.5-Coder-32B-Instruct-SFT-planning1

33B • Updated Mar 17 • 2

Kaylee0501/Qwen2.5-Coder-32B-Instruct-onpolicy

Updated Feb 26 • 3

Kaylee0501/Qwen2.5-Coder-32B-Instruct-llm

Updated Feb 26 • 4

Kaylee0501/Qwen2.5-Coder-32B-Instruct-edit

Updated Feb 26 • 3

Kaylee0501/Qwen3-Coder-30B-A3B-Instruct-DPO-llm

Updated Feb 19 • 7

Kaylee0501/Qwen3-Coder-30B-A3B-Instruct-DPO-Edit

Updated Feb 19 • 7

Kaylee0501/Qwen3-Coder-30B-A3B-Instruct-SFT2

Updated Feb 19 • 7

Kaylee0501/Qwen3-Coder-30B-A3B-Instruct-SFT1

Updated Feb 19 • 7

Kaylee0501/trained_models_llava8b_from_aot

8B • Updated Sep 25, 2025 • 1

Kaylee0501/trained_models_qwen3_shorten

4B • Updated Sep 24, 2025 • 2