10 35 1

Yang Shi

DogNeverSleep

https://FrankYang-17.github.io/

FrankYang-17

AI & ML interests

👨🏻‍🎓PhD student at Peking University

Recent Activity

updated a dataset about 4 hours ago

asdnao21/Qwen3-VL-Eval-Res

published a dataset about 4 hours ago

asdnao21/Qwen3-VL-Eval-Res

updated a dataset about 7 hours ago

asdnao21/Edit-Res-New-2

View all activity

Organizations

updated a dataset about 4 hours ago

asdnao21/Qwen3-VL-Eval-Res

Preview • Updated about 4 hours ago

published a dataset about 4 hours ago

asdnao21/Qwen3-VL-Eval-Res

Preview • Updated about 4 hours ago

updated a dataset about 7 hours ago

asdnao21/Edit-Res-New-2

Viewer • Updated about 3 hours ago • 8.2k

published a dataset about 7 hours ago

asdnao21/Edit-Res-New-2

Viewer • Updated about 3 hours ago • 8.2k

updated a dataset about 15 hours ago

asdnao21/Edit-Res-New

Preview • Updated about 14 hours ago

published a dataset about 16 hours ago

asdnao21/Edit-Res-New

Preview • Updated about 14 hours ago

upvoted 3 papers 3 days ago

Pseudo-Unification: Entropy Probing Reveals Divergent Information Patterns in Unified Multimodal Models

Paper • 2604.10949 • Published 4 days ago • 38

OmniShow: Unifying Multimodal Conditions for Human-Object Interaction Video Generation

Paper • 2604.11804 • Published 4 days ago • 66

Attention Sink in Transformers: A Survey on Utilization, Interpretation, and Mitigation

Paper • 2604.10098 • Published 6 days ago • 72

updated a dataset 3 days ago

asdnao21/Edit-Res-1

Viewer • Updated 2 days ago • 4.2k • 9.59k

published a dataset 4 days ago

asdnao21/Edit-Res-1

Viewer • Updated 2 days ago • 4.2k • 9.59k

upvoted a paper 7 days ago

Act Wisely: Cultivating Meta-Cognitive Tool Use in Agentic Multimodal Models

Paper • 2604.08545 • Published 8 days ago • 41

upvoted a paper 9 days ago

Video-MME-v2: Towards the Next Stage in Benchmarks for Comprehensive Video Understanding

Paper • 2604.05015 • Published 11 days ago • 232

authored 2 papers 10 days ago

Agentic-MME: What Agentic Capability Really Brings to Multimodal Intelligence?

Paper • 2604.03016 • Published 14 days ago • 37

OpenWorldLib: A Unified Codebase and Definition of Advanced World Models

Paper • 2604.04707 • Published 11 days ago • 200

upvoted a paper 10 days ago

OpenWorldLib: A Unified Codebase and Definition of Advanced World Models

Paper • 2604.04707 • Published 11 days ago • 200

upvoted a paper 11 days ago

Agentic-MME: What Agentic Capability Really Brings to Multimodal Intelligence?

Paper • 2604.03016 • Published 14 days ago • 37

updated a dataset 12 days ago

asdnao21/RM_Model_Infer

Viewer • Updated 11 days ago • 5.9k • 14.3k

published a dataset 13 days ago

asdnao21/RM_Model_Infer

Viewer • Updated 11 days ago • 5.9k • 14.3k

authored a paper 24 days ago

VTC-Bench: Evaluating Agentic Multimodal Models via Compositional Visual Tool Chaining

Paper • 2603.15030 • Published Mar 16 • 21

Yang Shi

AI & ML interests

Recent Activity

Organizations

DogNeverSleep's activity