Microsoft Research

×Training Efficiency & Optimization

4 papers from Microsoft Research on Training Efficiency & Optimization

May 6, 2026

CRAFT: Counterfactual-to-Interactive Reinforcement Fine-Tuning for Driving Policies

Autonomous driving gets a boost: CRAFT cleverly combines the best of both worlds – dense counterfactual supervision and grounded closed-loop feedback – to significantly improve driving policies.

Keyu Chen, Nanfei Ye, Yida Wang +4

Robotics & Embodied AI Training Efficiency & Optimization World Models & Planning

May 3, 2026

2w ago·also Microsoft Research, Forschungszentrum Jülich GmbH, Snowflake

Cross-Layer Energy Analysis of Multimodal Training on Grace Hopper Superchips

Optimizing for runtime in multimodal training can be energy-inefficient, as data movement and overlap on Grace Hopper chips dominate energy consumption, not raw compute.

Mahmoud Ahmed, Sameh Abdulah, Olatunji Ruwase +4

Distributed Systems & Hardware Multimodal Models Training Efficiency & Optimization

Apr 20, 2026

Microsoft ResearchApr 20, 2026·also NC State, UCL

A Note on TurboQuant and the Earlier DRIVE/EDEN Line of Work

TurboQuant's "novel" quantization method is actually a special case of a prior technique (EDEN) with a crucial parameter stuck at a suboptimal value, leading to demonstrably worse performance.

Ran Ben-Basat, Yaniv Ben-Itzhak, Gal Mendelson +3

Inference & Quantization Training Efficiency & Optimization

Feb 7, 2026

Microsoft ResearchFeb 7, 2026

Optimizing Few-Step Generation with Adaptive Matching Distillation

By explicitly detecting and escaping "Forbidden Zones" during training, AMD unlocks significant gains in sample fidelity and training robustness for few-step generative models like SDXL.

Lichen Bai, Zikai Zhou, Shitong Shao +6

Inference & Quantization Training Efficiency & Optimization

Search

Microsoft Research