Latticethe structure behind the noise

Papers Digest Topics Selected Labs Collections FAQ

Created by Flynn Lachendro

Papers Digest Topics Labs Saved

Search

Search papers, labs, and topics across Lattice.

Built by Flynn Lachendro·𝕏 / Twitter·RSS··FAQ·Glossary·Privacy

Jie Ouyang | Lattice

Jie Ouyang

Corresponding author

Papers on Lattice

4

Total citations

0

Topics

8

Publication activitypapers/week, last 8 weeks

Research focus

Tool Use & Agents (4)RLHF & Preference Learning (2)Eval Frameworks & Benchmarks (1)Recommendation & Information Retrieval (1)

Frequent co-authors

Mingyue Cheng (3)Daoyu Wang (3)Enhong Chen (2)Shuo Yu (2)

Papers (4)

Jun 18, 2026

Corresponding author3w ago·also USTC

ScholarQuest: A Taxonomy-Guided Benchmark for Agentic Academic Paper Search in Open Literature Environments

Agentic search methods only achieve a maximum Recall@100 of 31.4%, revealing a critical gap in current academic paper retrieval capabilities.

Tingyue Pan, Mingyue Cheng, Daoyu Wang +3

Eval Frameworks & Benchmarks Recommendation & Information Retrieval Tool Use & Agents

Jun 8, 2026

Corresponding authorJun 8, 2026·also USTC

Claw-R1: A Step-Level Data Middleware System for Agentic Reinforcement Learning

Claw-R1 transforms agentic RL by treating interaction data as valuable assets, enabling real-time inspection and curation for optimized training.

Daoyu Wang, Mingyue Cheng, Shuo Yu +1

Data Curation & Synthetic Data RLHF & Preference Learning Tool Use & Agents

Apr 20, 2026

Corresponding authorApr 20, 2026·also USTC

StepPO: Step-Aligned Policy Optimization for Agentic Reinforcement Learning

StepPO reveals that aligning policy optimization with agent decision-making steps can lead to superior performance in multi-turn interactions, outperforming traditional RL methods.

Daoyu Wang, Qingchuan Li, Mingyue Cheng +3

RLHF & Preference Learning Tool Use & Agents Training Efficiency & Optimization

Mar 8, 2026

Mar 8, 2026·also Corresponding author

TableMind++: An Uncertainty-Aware Programmatic Agent for Tool-Augmented Table Reasoning

Table reasoning gets a reliability boost: TableMind++ uses uncertainty estimates to prune flawed plans and refine actions, outperforming prior models by synthesizing robust reasoning paths.

Chuang Jiang, Jie Ouyang

Code Generation & Program Synthesis Reasoning & Chain-of-Thought Tool Use & Agents

Data Curation & Synthetic Data (1)

Training Efficiency & Optimization (1)

Tingyue Pan (1)

Yitong Zhou (1)

Qingchuan Li (1)

Chuang Jiang (1)