Xinyin Ma

Naively quantizing autoregressive video diffusion models tanks performance due to exponentially increasing error accumulation across frames and heterogeneous outlier patterns, but Q-ARVD solves it.

Siao Tang, Xinyin Ma, Gongfan Fang +2

Architecture Design (Transformers, SSMs, MoE)Computer Vision Inference & Quantization

Apr 9, 2026

Correspoding AuthorApr 9, 2026·also NUS, Corresponding Author

DMax: Aggressive Parallel Decoding for dLLMs

DMax unlocks faster diffusion language model decoding by reframing the process as iterative self-correction in embedding space, achieving up to 2x speedup without sacrificing accuracy.

Zigeng Chen, Gongfan Fang, Xinyin Ma +2

Architecture Design (Transformers, SSMs, MoE)Distributed Systems & Hardware Inference & Quantization

Mar 9, 2026

Guangnian Wan +2Mar 9, 2026·also NUS, Corresponding Author

Invisible Safety Threat: Malicious Finetuning for LLM via Steganography

LLMs can be finetuned to hide malicious prompts and responses in plain sight using steganography, bypassing safety filters and creating an "invisible safety threat."

Guangnian Wan, Xinyin Ma, Gongfan Fang

Constitutional AI & AI Ethics Natural Language Processing Red-Teaming & Adversarial Robustness

Search

Xinyin Ma

Publication activitypapers/week, last 8 weeks

Research focus

Frequent co-authors

Papers (4)