Eng Siong Chng

Papers on Lattice

Total citations

Topics

Publication activitypapers/week, last 8 weeks

Research focus

Speech & Audio (5)Reasoning & Chain-of-Thought (3)Natural Language Processing (3)Multimodal Models (1)

Frequent co-authors

E. Chng (3)Yuxin Li (2)Yuxin Zhang (1)Xiangyu Tony Zhang (1)

Papers (5)

Apr 28, 2026

Yuxin Zhang +215d ago

Step-Audio-R1.5 Technical Report

RLVR, the dominant training paradigm for audio language models, may be turning them into unfeeling "answering machines" that excel on benchmarks but fail the vibe check.

Yuxin Zhang, Xiangyu Tony Zhang, Xiangyu Zhang +19

Multimodal Models Reasoning & Chain-of-Thought RLHF & Preference Learning+1

Mar 18, 2026

Tsinghua AIMar 18, 2026·also Meta AI, Mila, ×4

The Silent Thought: Modeling Internal Cognition in Full-Duplex Spoken Dialogue Models via Latent Reasoning

Mimicking human cognition, FLAIR lets dialogue models "think while listening," boosting performance without adding latency.

Donghang Wu, Tianyu Zhang, Yuxin Li +6

Natural Language Processing Reasoning & Chain-of-Thought Speech & Audio

Mar 9, 2026

N. Kuzmin +10Mar 9, 2026

Privacy-Preserving End-to-End Full-Duplex Speech Dialogue Models

Turns out your always-on speech dialogue model is leaking speaker identity like a sieve, but a simple feature-domain anonymization technique can boost privacy by 3.5x with minimal impact on performance.

N. Kuzmin, Nikita Kuzmin, Tao Zhong +8

Constitutional AI & AI Ethics Natural Language Processing Speech & Audio

Feb 24, 2026

Changsong Liu +2Feb 24, 2026

Training-Free Intelligibility-Guided Observation Addition for Noisy ASR

Ditch the training data: this intelligibility-guided approach fuses noisy and enhanced speech for robust ASR without needing a separate neural predictor.

Changsong Liu, Sakriani Sakti, Eng Siong Chng

Natural Language Processing Speech & Audio

Feb 15, 2026

Ruiyang Xu +5Feb 15, 2026

The Interspeech 2026 Audio Reasoning Challenge: Evaluating Reasoning Process Quality for Audio Reasoning Models and Agents

Agent systems leveraging iterative tool orchestration and cross-modal analysis significantly outperform single models in audio reasoning, highlighting a promising path toward explainable audio intelligence.

Ruiyang Xu, Yinghao Ma, Jaeyeon Kim +3

Eval Frameworks & Benchmarks Reasoning & Chain-of-Thought Speech & Audio

Search

Eng Siong Chng

Publication activitypapers/week, last 8 weeks

Research focus

Frequent co-authors

Papers (5)