Latticethe structure behind the noise

Papers Digest Topics Selected Labs Collections FAQ

Created by Flynn Lachendro

Papers Digest Topics Labs Saved

Search

Search papers, labs, and topics across Lattice.

Built by Flynn Lachendro·𝕏 / Twitter·RSS··FAQ·Glossary·Privacy

Vidya Muthukumar | Lattice

Vidya Muthukumar

Papers on Lattice

1

Total citations

0

Topics

2

h-index

15

Publication activitypapers/week, last 8 weeks

Research focus

Architecture Design (Transformers, SSMs, MoE) (1)Training Efficiency & Optimization (1)

Frequent co-authors

Kuo-Wei Lai (1)Guanghui Wang (1)Molei Tao (1)

Papers (1)

Mar 5, 2026

Kuo-Wei Lai +31w ago

How Does the ReLU Activation Affect the Implicit Bias of Gradient Descent on High-dimensional Neural Network Regression?

ReLU networks trained with gradient descent surprisingly converge to near minimum-l2-norm solutions in high dimensions, even without orthogonal data.

Kuo-Wei Lai, Guanghui Wang, Molei Tao +1

Architecture Design (Transformers, SSMs, MoE)Training Efficiency & Optimization