Sowmya Vajrala

Papers on Lattice

Total citations

Topics

Publication activitypapers/week, last 8 weeks

Research focus

Computer Vision (2)Inference & Quantization (2)Multimodal Models (1)Architecture Design (Transformers, SSMs, MoE) (1)

Frequent co-authors

Sravanth Kodavanti (2)Manjunath Arveti (2)Aakash Parmar (1)Prasanna R (1)

Papers (2)

Mar 31, 2026

Sowmya Vajrala +61d ago

Quantization with Unified Adaptive Distillation to enable multi-LoRA based one-for-all Generative Vision Models on edge

Run multiple LoRA-tuned GenAI models on your phone without blowing up storage or latency: just swap weights at runtime.

Sowmya Vajrala, Aakash Parmar, Prasanna R +4

Computer Vision Inference & Quantization Multimodal Models

Mar 30, 2026

Sravanth Kodavanti +42d ago

EdgeDiT: Hardware-Aware Diffusion Transformers for Efficient On-Device Image Generation

Runaway compute costs for diffusion models on GPUs? EdgeDiT slashes parameters by 30% and latency by 40% while maintaining image quality, all on your phone.

Sravanth Kodavanti, Manjunath Arveti, Sowmya Vajrala +2

Architecture Design (Transformers, SSMs, MoE)Computer Vision Inference & Quantization

Search

Sowmya Vajrala

Publication activitypapers/week, last 8 weeks

Research focus

Frequent co-authors

Papers (2)