Zhiheng Liu

Papers on Lattice

Total citations

Topics

Publication activitypapers/week, last 8 weeks

Research focus

Architecture Design (Transformers, SSMs, MoE) (2)Multimodal Models (2)Eval Frameworks & Benchmarks (1)Tool Use & Agents (1)

Frequent co-authors

Shoufa Chen (1)Luyuan Wang (1)Xuan Yang (1)Yuren Cong (1)

Papers (3)

Jun 26, 2026

Stanford HAI2w ago·also Duke

TUA-Bench: A Benchmark for General-Purpose Terminal-Use Agents

Terminal-use agents are still far from achieving reliable general-purpose performance, with top models only scoring 65.8% on a new benchmark that spans diverse real-world tasks.

Shoufa Chen, Luyuan Wang, Xuan Yang +5

Eval Frameworks & Benchmarks Tool Use & Agents

Apr 27, 2026

Zhiheng Liu +14Apr 27, 2026·also UCSC

Tuna-2: Pixel Embeddings Beat Vision Encoders for Multimodal Understanding and Generation

Ditching the vision encoder actually *improves* multimodal understanding at scale, proving that pixel embeddings alone can achieve state-of-the-art results in unified multimodal models.

Zhiheng Liu, Weiming Ren, Xiaoke Huang +12

Architecture Design (Transformers, SSMs, MoE)Computer Vision Multimodal Models

Mar 29, 2026

University of CaliforniaMar 29, 2026

EvA: An Evidence-First Audio Understanding Paradigm for LALMs

LALMs struggle more with *hearing* the evidence than *reasoning* about it, and EvA's evidence-first fusion architecture proves it.

Xinyuan Xie, Zhiheng Liu, Zhiqiang Lv +1

Architecture Design (Transformers, SSMs, MoE)Multimodal Models Speech & Audio

Search

Zhiheng Liu

Publication activitypapers/week, last 8 weeks

Research focus

Frequent co-authors

Papers (3)