Yutao Zeng

Bytedance

Papers on Lattice

Total citations

Topics

h-index

Research focus

Architecture Design (Transformers, SSMs, MoE) (1)Distributed Systems & Hardware (1)Training Efficiency & Optimization (1)

Frequent co-authors

Lianghui Zhu (1)Yuxin Fang (1)Bencheng Liao (1)Tianheng Cheng (1)

Papers (1)

Mar 16, 2026

Tsinghua AIMar 16, 2026·also ByteDance, PKU, SJTU

Mixture-of-Depths Attention

LLMs can now scale depth more effectively: a new attention mechanism recovers diluted features in deeper layers, boosting performance with negligible overhead.

Lianghui Zhu, Yuxin Fang, Bencheng Liao +8

Architecture Design (Transformers, SSMs, MoE)Distributed Systems & Hardware Training Efficiency & Optimization

Search

Yutao Zeng

Research focus

Frequent co-authors

Papers (1)