CMU Machine Learning

×Training Efficiency & Optimization

15 papers from CMU Machine Learning on Training Efficiency & Optimization

May 6, 2026

Graph-SND: Sparse Aggregation for Behavioral Diversity in Multi-Agent Reinforcement Learning

Scale multi-agent RL diversity metrics to hundreds of agents without sacrificing accuracy: Graph-SND offers a drop-in replacement for quadratic SND calculations, achieving near-identical results with order-of-magnitude speedups.

Shawn Ray

Architecture Design (Transformers, SSMs, MoE)Training Efficiency & Optimization

2w ago·also CMU ML

AGIPC: Adaptive In-Solve Algebraic Coarsening for GPU IPC

Implicit time integration on GPUs gets a 3x speed boost thanks to a novel algebraic coarsening method that avoids costly explicit remeshing.

Xuan Wang, Zhaofeng Luo, Minchen Li +2

Architecture Design (Transformers, SSMs, MoE)Distributed Systems & Hardware Training Efficiency & Optimization

May 3, 2026

Uni- versity of California2w ago·also CMU ML, UMich

Stochastic Sparse Attention for Memory-Bound Inference

Attention bottlenecks in long-context decoding? SANTA slashes memory bandwidth demands by stochastically sampling value vectors, achieving 1.5x speedups without sacrificing accuracy.

Kyle Lee, Corentin Delacour, Kevin Callahan-Coray +5

Architecture Design (Transformers, SSMs, MoE)Inference & Quantization Training Efficiency & Optimization

Apr 21, 2026

CMU MLApr 21, 2026

EmbodiedMidtrain: Bridging the Gap between Vision-Language Models and Vision-Language-Action Models via Mid-training

VLMs can be significantly boosted on embodied tasks by mid-training on a carefully curated subset of VLM data that is highly aligned with the VLA domain, rivaling the performance of much larger models.

Yiyang Du, Zhanqiu Guo, Xin Ye +2

Multimodal Models Robotics & Embodied AI Training Efficiency & Optimization

Apr 16, 2026

Apr 16, 2026·also CMU ML, BIT, PKU, SJTU

Well Begun is Half Done: Training-Free and Model-Agnostic Semantically Guaranteed User Representation Initialization for Multimodal Recommendation

Dramatically improve multimodal recommendation accuracy without any training by initializing user embeddings with item modality features and user cluster information.

Jinfeng Xu, Zheyu Chen, Shuo Yang +6

Multimodal Models Recommendation & Information Retrieval Training Efficiency & Optimization

Apr 9, 2026

CMU MLApr 9, 2026

Efficient Dataset Selection for Continual Adaptation of Generative Recommenders

Forget full retraining: intelligently selecting data subsets using gradient-based representations can keep your generative recommender fresh and robust to drift.

Cathy Jiao, Juan Elenter, Praveen Ravichandran +11

Data Curation & Synthetic Data Recommendation & Information Retrieval Training Efficiency & Optimization

CMU MLApr 9, 2026

Ring Mixing with Auxiliary Signal-to-Consistency-Error Ratio Loss for Unsupervised Denoising in Speech Separation

Training speech separation models on real-world noisy data doesn't have to mean accepting noisy outputs: this method cuts residual noise in half.

Matthew Maciejewski, Matthew Maciejewski, Samuele Cornell +1

Data Curation & Synthetic Data Speech & Audio Training Efficiency & Optimization

CMU MLApr 9, 2026·also JHU, Northeastern, Tencent AI

What do Language Models Learn and When? The Implicit Curriculum Hypothesis

LLMs learn skills in a surprisingly consistent order during pretraining, revealing a hidden curriculum that's predictable across models and readable from their internal representations.

Emmy Liu, Kaiser Sun, Millicent Li +4

Data Curation & Synthetic Data Scaling Laws & Emergent Abilities Training Efficiency & Optimization

Apr 7, 2026

Apr 7, 2026·also CMU ML, BIT, Yale

SonoSelect: Efficient Ultrasound Perception via Active Probe Exploration

Get more from less: SonoSelect intelligently guides ultrasound probes to achieve comparable diagnostic accuracy with far fewer views, slashing scanning time and processing costs.

Yixin Zhang, Yunzhong Hou, Longqi Li +2

Computer Vision Robotics & Embodied AI Training Efficiency & Optimization

Mar 29, 2026

CMU MLMar 29, 2026

Budget-Xfer: Budget-Constrained Source Language Selection for Cross-Lingual Transfer to African Languages

Forget hand-picking your cross-lingual training data: a budget-constrained optimization can automatically allocate resources across multiple source languages, boosting performance on African languages by a large margin.

Tewodros Kederalah Idris

Data Curation & Synthetic Data Natural Language Processing Training Efficiency & Optimization

Mar 17, 2026

CMU MLMar 17, 2026·also Stanford HAI, Department of Computer Science, Department of Data Sciences and Operations, Department of Statistics and Data +1

High-dimensional estimation with missing data: Statistical and computational limits

Expect to pay an exponential sample complexity price for computationally efficient mean and covariance estimation with missing data, but not for linear regression.

Kabir Aladin Verchand, Ankit Pensia, Saminul Haque +1

Data Curation & Synthetic Data Training Efficiency & Optimization

Mar 12, 2026

Mar 12, 2026·also CMU ML

Fractional Rotation, Full Potential? Investigating Performance and Convergence of Partial RoPE

You can slash RoPE memory costs by 10x without sacrificing convergence, just by applying it to a sliver (10%) of hidden dimensions.

Mohammad Aflah Khan, Krishna P. Gummadi, Manish Gupta +1

Architecture Design (Transformers, SSMs, MoE)Inference & Quantization Training Efficiency & Optimization

Mar 4, 2026

CMU MLMar 4, 2026

What Does Flow Matching Bring To TD Learning?

Flow matching's advantage in RL isn't distributional modeling, but rather its ability to correct value estimates iteratively and learn more adaptable features, leading to significant performance gains in challenging online settings.

Bhavya Agrawalla

RLHF & Preference Learning Training Efficiency & Optimization

Feb 16, 2026

CMU MLFeb 16, 2026·also DeepMind

BPP: Long-Context Robot Imitation Learning by Focusing on Key History Frames

Robots can now learn long-horizon tasks far more effectively by distilling complex histories into a few key visual moments, outperforming standard imitation learning by 70% on real-world tasks.

Max Sobol Mark, Jacky Liang, Maria Attarian +2

Robotics & Embodied AI Training Efficiency & Optimization World Models & Planning

Feb 15, 2026

CMU MLFeb 15, 2026·also NYU, Purdue, UCSB, Uni- versity of California

Probabilistic approximate optimization using single-photon avalanche diode arrays

Variational learning can tame the inherent chaos of nanoscale devices, paving the way for practical, larger-scale probabilistic computers.

Ziyad Alsawidan, Abdelrahman S. Abdelrahman, Md Sakibur Sajal +9

Architecture Design (Transformers, SSMs, MoE)Distributed Systems & Hardware Training Efficiency & Optimization

Search

CMU Machine Learning