Lattice AI Research

Research focus

Data Curation & Synthetic Data (2)Eval Frameworks & Benchmarks (1)Open-Source Models & Weights (1)RLHF & Preference Learning (1)

Frequent co-authors

Shanda Li (1)Qiuhong Anna Wei (1)Jingwu Tang (1)Valerie Chen (1)

Papers (3)

Jun 16, 2026

CMU ML3w ago

ReproRepo: Scaling Reproducibility Audits with GitHub Repository Issues

LLM agents can identify reproducibility problems in 90% of analyzed machine learning papers, leveraging GitHub issues as a novel supervision source.

Shanda Li, Qiuhong Anna Wei, Jingwu Tang +5

Data Curation & Synthetic Data Eval Frameworks & Benchmarks Open-Source Models & Weights

Feb 25, 2026

CMU MLFeb 25, 2026·also Fudan, UBC

GradAlign: Gradient-Aligned Data Selection for LLM Reinforcement Learning

Forget manual curation—aligning policy gradients with a validation set adaptively selects RL training data, leading to more stable LLM training and improved performance.

Ningyuan Yang, Weihua Du, Weiwei Sun +2

Data Curation & Synthetic Data RLHF & Preference Learning Training Efficiency & Optimization

Feb 17, 2026

Yiming Yang +2Feb 17, 2026

Enroll-on-Wakeup: A First Comparative Study of Target Speech Extraction for Seamless Interaction in Real Noisy Human-Machine Dialogue Scenarios

Ditching pre-recorded enrollment speech, this work shows how wake words can bootstrap target speech extraction, paving the way for more natural human-machine dialogues.

Yiming Yang, Guangyong Wang, Haixin Guan

Natural Language Processing Speech & Audio

Search

Yiming Yang

Publication activitypapers/week, last 8 weeks

Research focus

Frequent co-authors

Papers (3)