Parth Mannan

Papers on Lattice

Total citations

Topics

h-index

Publication activitypapers/week, last 8 weeks

Research focus

Multimodal Models (2)Distributed Systems & Hardware (1)Training Efficiency & Optimization (1)Architecture Design (Transformers, SSMs, MoE) (1)

Frequent co-authors

A. R. Ghias (2)Nima Tajbakhsh (2)Yashaswi Karnati (1)Kamran Jafari (1)

Papers (2)

May 26, 2026

Yashaswi Karnati +113w ago

Heterogeneous Parallelism for Multimodal Large Language Model Training

Stop forcing your multimodal encoders to inherit suboptimal LLM parallelism strategies: heterogeneous parallelism unlocks up to 49% higher TFLOPS/GPU.

Yashaswi Karnati, Kamran Jafari, Akash Mehra +9

Distributed Systems & Hardware Multimodal Models Training Efficiency & Optimization

Apr 27, 2026

NVIDIAApr 27, 2026·also Amazon Science, Microsoft Research, UW, Music X Lab +1

Nemotron 3 Nano Omni: Efficient and Open Multimodal Intelligence

Multimodal models can now achieve state-of-the-art performance in real-world tasks like document understanding and audio-video comprehension with significantly reduced inference latency thanks to novel token-reduction techniques.

Nvidia Amala Sanjay Deshmukh, K. Chumachenko, Tuomas Rintamaki +209

Architecture Design (Transformers, SSMs, MoE)Multimodal Models Speech & Audio

Search

Parth Mannan

Publication activitypapers/week, last 8 weeks

Research focus

Frequent co-authors

Papers (2)