Or Ordentlich

Papers on Lattice

Total citations

Topics

h-index

Research focus

Inference & Quantization (2)Training Efficiency & Optimization (1)Architecture Design (Transformers, SSMs, MoE) (1)

Frequent co-authors

Yury Polyanskiy (2)Egor Lifar (1)Semyon Savkin (1)

Papers (2)

Mar 5, 2026

MIT CSAILMar 5, 2026

WaterSIC: information-theoretically (near) optimal linear layer quantization

GPTQ's quantization of LLMs is leaving performance on the table: WaterSIC closes the gap with an information-theoretically near-optimal approach that beats the state-of-the-art on Llama and Qwen.

Egor Lifar, Semyon Savkin, Or Ordentlich +1

Inference & Quantization Training Efficiency & Optimization

Jan 23, 2026

MIT CSAILJan 23, 2026

High-Rate Quantized Matrix Multiplication: Theory and Practice

Waterfilling-inspired quantization ("WaterSIC") slashes the quantization error in LLMs by intelligently allocating bits based on weight covariance, outperforming standard techniques like GPTQ.

Or Ordentlich, Yury Polyanskiy

Architecture Design (Transformers, SSMs, MoE)Inference & Quantization

Search

Or Ordentlich

Research focus

Frequent co-authors

Papers (2)