MBZUAIUC DavisUMDVirginia TechJun 15, 2026arXiv:2606.16700

Multi-Turn Reflective Masking Elicits Reasoning in Mask Diffusion Models

Yanming Zhang, Yihan Bian, Jingyuan Qi, Yuguang Yao, Lifu Huang, Tianyi Zhou

AI Summary

This paper introduces Reflective Masking (RM), a novel approach that enhances Mask Diffusion Models (MDMs) by enabling multi-turn reasoning through iterative local edits rather than complete re-generation. By incorporating a parameter-free History Reference mechanism, RM allows MDMs to leverage previous outputs during denoising, closely mimicking human-like correction processes. Experimental results across various tasks, including text generation and image editing, show that RM significantly outperforms traditional masking methods, establishing it as a crucial advancement for reasoning capabilities in MDMs.

Key Contribution

Iterative local refinement in Mask Diffusion Models can outperform traditional autoregressive methods, transforming how we approach reasoning in AI.

Abstract

While reasoning on autoregressive (AR) models is often performed by chain-of-thought reasoning and reflection, their refinement of previous outputs still relies on fully sequential generation, even when only local edits are needed. In contrast, the masking mechanism in Mask Diffusion Models (MDMs) naturally supports explicit local edits on previous outputs, allowing selective refinement without discarding previous answers and generating another from scratch. While this property more closely aligns with how humans correct mistakes by iterative local refinement, existing MDMs do not support multi-turn masking and denoising. We propose Reflective Masking (RM), which elicits such an intrinsic reasoning capability in MDMs via lightweight post-training. RM provides a native test-time scaling, where an MDM iteratively revisits and revises its prior outputs based on evolving context. To exploit insights from previous turns like AR reasoning, we further introduce History Reference, a parameter-free mechanism that leverages intermediate denoising states during revision. Our approach requires no architectural changes and is easily applicable to existing MDMs. Across diverse tasks and modalities, including text generation, Sudoku, and image editing, Reflective Masking consistently outperforms standard masking-based baselines and demonstrates strong generality, positioning RM as a fundamental primitive for reasoning on MDMs.

Reasoning & Chain-of-Thought

Citation Metrics

Citations0

Influential citations0

References0

Year2026

VenueN/A

Related Papers

Finding related papers...

Search

Multi-Turn Reflective Masking Elicits Reasoning in Mask Diffusion Models

Related Papers