Junchi Yan

Shanghai Jiao Tong University

Papers on Lattice

Total citations

Topics

h-index

Publication activitypapers/week, last 8 weeks

Research focus

Training Efficiency & Optimization (3)Architecture Design (Transformers, SSMs, MoE) (2)RLHF & Preference Learning (1)Eval Frameworks & Benchmarks (1)

Frequent co-authors

Bowen Ping (1)Zijun Chen (1)Tingfeng Hui (1)Qize Yu (1)

Papers (4)

Apr 16, 2026

2w ago·also PKU, SJTU

LongAct: Harnessing Intrinsic Activation Patterns for Long-Context Reinforcement Learning

Saliency-guided sparse updates, focusing on high-magnitude activations in query and key vectors, unlock significant performance gains in long-context RL, outperforming uniform update strategies.

Bowen Ping, Zijun Chen, Tingfeng Hui +4

Architecture Design (Transformers, SSMs, MoE)RLHF & Preference Learning Training Efficiency & Optimization

Apr 1, 2026

Xiaosong Jia +5Apr 1, 2026·also SJTU

Bench2Drive-VL: Benchmarks for Closed-Loop Autonomous Driving with Vision-Language Models

Closed-loop evaluation reveals how VLMs for autonomous driving handle the messy reality of off-road deviations and out-of-distribution states, something static QA datasets can't capture.

Xiaosong Jia, Yuqian Shao, Zhenjie Yang +3

Eval Frameworks & Benchmarks Multimodal Models Robotics & Embodied AI

Mar 11, 2026

Mar 11, 2026·also SJTU

Towards Cold-Start Drafting and Continual Refining: A Value-Driven Memory Approach with Application to NPU Kernel Synthesis

LLMs can now synthesize high-performance kernels for niche hardware like NPUs, even with limited data, thanks to a self-evolving agent that bootstraps and refines code via value-driven reinforcement learning.

Yujie Zheng, Zhuo Li, Sheng Zhang +8

Code Generation & Program Synthesis Tool Use & Agents Training Efficiency & Optimization

Mar 9, 2026

Ning Liao +3Mar 9, 2026·also SJTU

FineRMoE: Dimension Expansion for Finer-Grained Expert with Its Upcycling Approach

FineRMoE achieves 6x higher parameter efficiency, 281x lower prefill latency, and 136x higher decoding throughput compared to strong baselines, demonstrating a significant leap in MoE performance.

Ning Liao, Xiaoxing Wang, Xiaohan Qin +1

Architecture Design (Transformers, SSMs, MoE)Scaling Laws & Emergent Abilities Training Efficiency & Optimization

Search

Junchi Yan

Publication activitypapers/week, last 8 weeks

Research focus

Frequent co-authors

Papers (4)