Yuanyu Wan

Zhejiang University

Papers on Lattice

Total citations

Topics

Publication activitypapers/week, last 8 weeks

Research focus

Training Efficiency & Optimization (1)

Frequent co-authors

Dingzhi Yu (1)Hongyi Tao (1)Luo Luo (1)Lijun Zhang (1)

Papers (1)

Jun 22, 2026

3w ago·also Fudan, ZJU

Open Problem: Is AdamW Effective Under Heavy-Tailed Noise?

AdamW's second-moment accumulator may obscure its ability to converge under heavy-tailed noise, raising critical questions about its effectiveness in training large language models.

Dingzhi Yu, Hongyi Tao, Yuanyu Wan +2

Training Efficiency & Optimization

Search

Yuanyu Wan

Publication activitypapers/week, last 8 weeks

Research focus

Frequent co-authors

Papers (1)