Lattice AI Research

Research focus

Training Efficiency & Optimization (2)Inference & Quantization (1)Open-Source Models & Weights (1)Architecture Design (Transformers, SSMs, MoE) (1)

Frequent co-authors

Marcus Armstrong (2)Navid Ayoobi (1)Arjun Mukherjee (1)

Papers (2)

Apr 16, 2026

M. Armstrong +13d ago·also UH

When Flat Minima Fail: Characterizing INT4 Quantization Collapse After FP32 Convergence

Even after a model appears fully trained in FP32, INT4 quantization can catastrophically degrade, revealing a hidden vulnerability to post-convergence weight updates.

M. Armstrong, Marcus Armstrong

Inference & Quantization Open-Source Models & Weights Training Efficiency & Optimization

Apr 9, 2026

M. Armstrong +31w ago·also UH

Dead Weights, Live Signals: Feedforward Graphs of Frozen Language Models

Forget fine-tuning: unlock surprisingly strong performance by stitching together frozen LLMs with lightweight, trainable projections that route information between models.

M. Armstrong, Marcus Armstrong, Navid Ayoobi +1

Architecture Design (Transformers, SSMs, MoE)Natural Language Processing Training Efficiency & Optimization

Search

M. Armstrong

Publication activitypapers/week, last 8 weeks

Research focus

Frequent co-authors

Papers (2)