Yunta Hsieh

University of Michigan, Ann Arbor

Papers on Lattice

Total citations

Topics

Publication activitypapers/week, last 8 weeks

Research focus

Inference & Quantization (2)Eval Frameworks & Benchmarks (2)Natural Language Processing (1)Scaling Laws & Emergent Abilities (1)

Frequent co-authors

Jing Xiong (2)Qi Han (2)Zhongwei Wan (2)Jingxuan Zhang (2)

Papers (3)

Jun 9, 2026

1w ago·also HKU, LMSYS, UMich

Prefilling-dLLM: Predictive Prefilling for Long-Context Inference in Diffusion Language Models

Sparse prefilling can dramatically accelerate long-context inference in diffusion language models, achieving up to 28x speedup without sacrificing quality.

Jing Xiong, Qi Han, Shansan Gong +5

Inference & Quantization Natural Language Processing Scaling Laws & Emergent Abilities

May 22, 2026

May 22, 2026·also Beihang, ByteDance, Case Western, CUHK +3

SkillEvolBench: Benchmarking the Evolution from Episodic Experience to Procedural Skills

LLM agents struggle to generalize from experience to reusable skills, often performing worse than simply replaying past trajectories, revealing a critical gap in current abstraction methods.

Yingtie Lei, Zhongwei Wan, Jiankun Zhang +10

Eval Frameworks & Benchmarks Robotics & Embodied AI Tool Use & Agents

Mar 16, 2026

Mar 16, 2026·also B. Topic Samples Data source(s), HKU, Ohio State, PKU +1

MMSpec: Benchmarking Speculative Decoding for Vision-Language Models

Text-based speculative decoding falls flat for vision-language models, but ViSkip dynamically adapts to vision tokens for state-of-the-art acceleration.

Yunta Hsieh, Qi Han, Zhongwei Wan +4

Eval Frameworks & Benchmarks Inference & Quantization Multimodal Models

Search

Yunta Hsieh

Publication activitypapers/week, last 8 weeks

Research focus

Frequent co-authors

Papers (3)