Jianxin Wu

W^{*}=(Y-Y_{Z})X_{Z}^{T}(X_{Z}X_{Z}^{T}+\lambda I)^{-1}\,,italic_W start_POSTSUPERSCRIPT ∗ end_POSTSUPERSCRIPT = ( italic_Y - italic_Y start_POSTSUBSCRIPT italic_Z end_POSTSUBSCRIPT ) italic_X start_POSTSUBSCRIPT italic_Z end_POSTSUBSCRIPT start_POSTSUPERSCRIPT italic_T end_POSTSUPERSCRIPT ( italic_X start_POSTSUBSCRIPT italic_Z end_POSTSUBSCRIPT italic_X start_POSTSUBSCRIPT italic_Z end_POSTSUBSCRIPT start_POSTSUPERSCRIPT italic_T end_POSTSUPERSCRIPT + italic_λ italic_I ) start_POSTSUPERSCRIPT - 1 end_POSTSUPERSCRIPT , (3) which includes a regularization term λ⁢I𝜆𝐼\lambda Iitalic_λ italic_I for stability. In our W, School of Artificial Intelligence, Nanjing University, China

Papers on Lattice

Total citations

Topics

h-index

Research focus

Computer Vision (1)Inference & Quantization (1)Training Efficiency & Optimization (1)

Frequent co-authors

Guang Liang (1)Xinyao Liu (1)

Papers (1)

Jun 13, 2025

GPLQ: A General, Practical, and Lightning QAT Method for Vision Transformers

Quantizing Vision Transformers to 4-bit precision no longer requires a painful trade-off between accuracy, speed, and memory, thanks to a new activation-first training method that's 100x faster.

Guang Liang, Xinyao Liu, Jianxin Wu

Computer Vision Inference & Quantization Training Efficiency & Optimization

Search

Jianxin Wu

Research focus

Frequent co-authors

Papers (1)