Kaijian Wang

Papers on Lattice

Total citations

Topics

h-index

Research focus

Distributed Systems & Hardware (2)Training Efficiency & Optimization (2)

Frequent co-authors

Rixin Liu (1)Xingqi Cui (1)Xinheng Ding (1)Zirui Liu (1)

Papers (2)

May 26, 2026

Rixin Liu +6May 26, 2026·also Rice

Characterization-Guided GPU Fault Resilience in NVIDIA MPS

A fault in one GPU process no longer needs to crash them all: this paper introduces mechanisms for fault-resilient NVIDIA MPS, enabling more robust multi-tenant GPU clusters.

Rixin Liu, Xingqi Cui, Kaijian Wang +4

Distributed Systems & Hardware Training Efficiency & Optimization

Apr 7, 2026

Jingwei Zuo +7Apr 7, 2026

ALTO: Adaptive LoRA Tuning and Orchestration for Heterogeneous LoRA Training Workloads

Forget independent LoRA tuning jobs: ALTO co-optimizes them for a 13.8x speedup without sacrificing adapter quality.

Jingwei Zuo, Xinze Feng, Zien Liu +5

Distributed Systems & Hardware Training Efficiency & Optimization

Search

Kaijian Wang

Research focus

Frequent co-authors

Papers (2)