Alper Yildirim

Papers on Lattice

Total citations

Topics

h-index

Research focus

Architecture Design (Transformers, SSMs, MoE) (1)Interpretability & Mechanistic Interp (1)Training Efficiency & Optimization (1)

Frequent co-authors

Alper Yıldırım (1)

Papers (1)

Mar 5, 2026

Alper Yildirim +1Mar 5, 2026

The Geometric Inductive Bias of Grokking: Bypassing Phase Transitions via Architectural Topology

By constraining Transformer architectures to have bounded representations and uniform attention, grokking can be bypassed entirely for modular addition, suggesting task-specific geometric alignment is key.

Alper Yildirim, Alper Yıldırım

Architecture Design (Transformers, SSMs, MoE)Interpretability & Mechanistic Interp Training Efficiency & Optimization

Search

Alper Yildirim

Research focus

Frequent co-authors

Papers (1)