Jie Zou

University of Electronic Science and Technology of China

Papers on Lattice

Total citations

Topics

Publication activitypapers/week, last 8 weeks

Research focus

Inference & Quantization (2)Multimodal Models (1)Recommendation & Information Retrieval (1)Architecture Design (Transformers, SSMs, MoE) (1)

Frequent co-authors

Yibiao Wei (1)Pengfei Zhang (1)X. Ao (1)Xiao Ao (1)

Papers (3)

Apr 29, 2026

2d ago·also Southwestern University of Finance and Economics

CARD: Non-Uniform Quantization of Visual Semantic Unit for Generative Recommendation

Skewed item distributions in recommendation systems can be tamed with a learnable non-uniform quantization, leading to better codebook utilization and more accurate generative recommendations.

Yibiao Wei, Jie Zou, Pengfei Zhang +5

Inference & Quantization Multimodal Models Recommendation & Information Retrieval

Apr 21, 2026

1w ago·also BUET, Kyung Hee University, PolyU

DASH-KV: Accelerating Long-Context LLM Inference via Asymmetric KV Cache Hashing

Attention's quadratic complexity is no longer a bottleneck: DASH-KV achieves linear O(N) inference without sacrificing accuracy by reformulating attention as an approximate nearest-neighbor search.

Yutong Li, Jiehui Xie, Md. Tamim Iqbal +5

Architecture Design (Transformers, SSMs, MoE)Distributed Systems & Hardware Inference & Quantization

Mar 2, 2026

Xun Chen +11Mar 2, 2026·also UESTC

ALTER: Asymmetric LoRA for Token-Entropy-Guided Unlearning of LLMs

Achieve >95% forget quality in LLMs with minimal side effects by isolating and unlearning tokens within target subdomains using asymmetric LoRA.

Xun Chen, Xunlei Chen, Jinyu Guo +9

Natural Language Processing Training Efficiency & Optimization

Search

Jie Zou

Publication activitypapers/week, last 8 weeks

Research focus

Frequent co-authors

Papers (3)