Latticethe structure behind the noise

Papers Digest Topics Selected Labs Collections FAQ

Created by Flynn Lachendro

Papers Digest Topics Labs Saved

Search

Search papers, labs, and topics across Lattice.

Built by Flynn Lachendro·𝕏 / Twitter·RSS··FAQ·Glossary·Privacy

Zhaoyang Wang | Lattice

Zhaoyang Wang

Chinese Academy of Sciences,Institute of Information Engineering,Beijing,China

Papers on Lattice

1

Total citations

0

Topics

3

h-index

2

Research focus

Architecture Design (Transformers, SSMs, MoE) (1)Inference & Quantization (1)Natural Language Processing (1)

Frequent co-authors

Wenbo Wang (1)Huiying Wang (1)Shuailou Li (1)Yu Wen (1)

Papers (1)

Apr 6, 2025

Apr 6, 2025

Dual Decoder for Fast Inference in Natural Language Generation

Autoregressive generation bottlenecks be gone: a dual-decoder architecture achieves up to 1.6x faster inference without sacrificing quality.

Wenbo Wang, Huiying Wang, Zhaoyang Wang +2

Architecture Design (Transformers, SSMs, MoE)Inference & Quantization Natural Language Processing