Vincent Sitzmann

Papers on Lattice

Total citations

Topics

Publication activitypapers/week, last 8 weeks

Research focus

Computer Vision (3)Multimodal Models (1)Robotics & Embodied AI (1)World Models & Planning (1)

Frequent co-authors

Evan Kim (2)Ishaan Preetam Chandratreya (1)David Charatan (1)Basile Van Hoorick (1)

Papers (3)

Jun 8, 2026

MIT CSAIL1w ago

MilliVid: Hierarchical Latents for Long-Range Consistency in Video Generation

Achieving long-range consistency in video generation is now feasible with a hierarchical token approach that balances detail and computational efficiency.

Ishaan Preetam Chandratreya, David Charatan, Basile Van Hoorick +4

Computer Vision Multimodal Models

May 27, 2026

Sizhe Lester Li +103w ago·also CMU ML, UPenn

Turning Video Models into Generalist Robot Policies

Forget finetuning video models for each robot: a single, action-free video world model can drive diverse robots when paired with a carefully designed inverse dynamics model.

Sizhe Lester Li, Evan Kim, Xingjian Bai +8

Computer Vision Robotics & Embodied AI World Models & Planning

Feb 24, 2026

Evan Kim +3Feb 24, 2026

Scaling View Synthesis Transformers

Encoder-decoder architectures can beat decoder-only transformers in novel view synthesis, overturning conventional wisdom with a compute-optimal design (SVSM) that slashes training costs.

Evan Kim, Hyunwoo Ryu, Thomas W. Mitchel +1

Architecture Design (Transformers, SSMs, MoE)Computer Vision Scaling Laws & Emergent Abilities

Search

Vincent Sitzmann

Publication activitypapers/week, last 8 weeks

Research focus

Frequent co-authors

Papers (3)