Yanhong Li

Papers on Lattice

Total citations

Topics

Publication activitypapers/week, last 8 weeks

Research focus

Architecture Design (Transformers, SSMs, MoE) (2)Training Efficiency & Optimization (2)Distributed Systems & Hardware (1)

Frequent co-authors

William Merrill (1)Hongjian Jiang (1)Ashish Sabharwal (1)Xinghong Fu (1)

Papers (2)

Mar 4, 2026

William Merrill +31w ago

Why Are Linear RNNs More Parallelizable?

Linear RNNs achieve transformer-like parallelization because they're essentially log-depth arithmetic circuits, while nonlinear RNNs are fundamentally limited by their ability to solve computationally harder problems.

William Merrill, Hongjian Jiang, Yanhong Li +1

Architecture Design (Transformers, SSMs, MoE)Distributed Systems & Hardware Training Efficiency & Optimization

Feb 19, 2026

Xinghong Fu +33w ago

Reverso: Efficient Time Series Foundation Models for Zero-shot Forecasting

Forget massive transformers: tiny hybrid models can achieve state-of-the-art zero-shot time series forecasting with 100x fewer parameters.

Xinghong Fu, Yanhong Li, Georgios Papaioannou +1

Architecture Design (Transformers, SSMs, MoE)Training Efficiency & Optimization

Search

Yanhong Li

Publication activitypapers/week, last 8 weeks

Research focus

Frequent co-authors

Papers (2)