Mofei Song

Papers on Lattice

Total citations

Topics

Publication activitypapers/week, last 8 weeks

Research focus

Natural Language Processing (2)RLHF & Preference Learning (1)Training Efficiency & Optimization (1)Data Curation & Synthetic Data (1)

Frequent co-authors

Xizhong Yang (3)Huiming Wang (3)

Papers (3)

Mar 17, 2026

Xizhong Yang +2Mar 17, 2026

From the Inside Out: Progressive Distribution Refinement for Confidence Calibration

By progressively refining the reward signal based on the distribution of model confidence, DistriTTRL achieves significant performance gains in RL by better aligning internal information between training and test time and mitigating reward hacking.

Xizhong Yang, Huiming Wang, Mofei Song

RLHF & Preference Learning Training Efficiency & Optimization

Mar 4, 2026

Xizhong Yang +2Mar 4, 2026

Semantic Bridging Domains: Pseudo-Source as Test-Time Connector

Instead of directly aligning to a flawed pseudo-source domain in test-time adaptation, a semantic bridge approach significantly boosts performance by first rectifying the pseudo-source using universal semantics.

Xizhong Yang, Huiming Wang, Mofei Song

Data Curation & Synthetic Data Natural Language Processing

Xizhong Yang +2Mar 4, 2026

Believe Your Model: Distribution-Guided Confidence Calibration

By modeling the distribution of confidence scores, DistriVoting significantly boosts the accuracy of large reasoning models, outperforming existing confidence-based selection methods across diverse benchmarks.

Xizhong Yang, Huiming Wang, Mofei Song

Eval Frameworks & Benchmarks Natural Language Processing Reasoning & Chain-of-Thought

Search

Mofei Song

Publication activitypapers/week, last 8 weeks

Research focus

Frequent co-authors

Papers (3)