Maoliang Li

Papers on Lattice

Total citations

Topics

h-index

Publication activitypapers/week, last 8 weeks

Research focus

Multimodal Models (4)Inference & Quantization (3)Robotics & Embodied AI (3)Computer Vision (2)

Frequent co-authors

Jiayu Chen (6)Zihao Zheng (6)Zhihao Mao (2)Z. Mao (2)

Papers (6)

Apr 6, 2026

Ke Li +102w ago

DIRECT: Video Mashup Creation via Hierarchical Multi-Agent Planning and Intent-Guided Editing

Achieve professional-grade video mashups by mimicking a human production pipeline, using hierarchical agents to handle global structure, editing intent, and fine-grained shot selection.

Ke Li, Maoliang Li, Maoliang Li +8

Computer Vision Multimodal Models World Models & Planning

Mar 18, 2026

Zihao Zheng +11Mar 18, 2026·also Corresponding Author

HeiSD: Hybrid Speculative Decoding for Embodied Vision-Language-Action Models with Kinematic Awareness

Robots can think (and act) twice as fast: HeiSD's hybrid speculative decoding turbocharges embodied agents by intelligently switching between draft and retrieval strategies.

Zihao Zheng, Zhihao Mao, Z. Mao +9

Inference & Quantization Multimodal Models Robotics & Embodied AI

Mar 9, 2026

Mar 9, 2026·also Corresponding Author

RAPID: Redundancy-Aware and Compatibility-Optimal Edge-Cloud Partitioned Inference for Diverse VLA models

VLA models get a 1.73x speedup with only 5-7% overhead thanks to RAPID, a new edge-cloud collaborative inference framework that smartly handles visual noise and motion continuity.

Zihao Zheng, Sicheng Tian, Hangyu Cao +9

Inference & Quantization Multimodal Models Robotics & Embodied AI

Mar 2, 2026

KERV: Kinematic-Rectified Speculative Decoding for Embodied VLA Models

By integrating kinematic prediction with speculative decoding, KERV enables VLA models to achieve a 27-37% speedup in robot control tasks without sacrificing success rate.

Zihao Zheng, Z. Mao, Zhihao Mao +4

Inference & Quantization Multimodal Models Robotics & Embodied AI

Mar 2, 2026·also Cohere, Northwestern

HeRo: Adaptive Orchestration of Agentic RAG on Heterogeneous Mobile SoC

Achieve up to 10.94x speedup in end-to-end latency for on-device agentic RAG by intelligently scheduling tasks across heterogeneous mobile SoC hardware.

Maoliang Li, Jiayu Chen, Zihao Zheng +5

Distributed Systems & Hardware Recommendation & Information Retrieval Tool Use & Agents

Feb 26, 2026

ToProVAR: Efficient Visual Autoregressive Modeling via Tri-Dimensional Entropy-Aware Semantic Analysis and Sparsity Optimization

Attention entropy reveals exploitable sparsity in VAR models, enabling 3.4x faster image generation without sacrificing quality.

Jiayu Chen, Ruoyu Lin, Zihao Zheng +4

Architecture Design (Transformers, SSMs, MoE)Computer Vision Training Efficiency & Optimization

Search

Maoliang Li

Publication activitypapers/week, last 8 weeks

Research focus

Frequent co-authors

Papers (6)