Changick Kim

Text dominance in Audio LLMs can be mitigated through a novel back-patching technique that enhances audio representations, challenging the status quo of multimodal processing.

Hyebin Cho, Suho Yoo, Jaehyuk Jang +2

Interpretability & Mechanistic Interp Multimodal Models Speech & Audio

Jun 14, 2026

Acoustic Prompting via Stage-wise Modulation for Few-Shot Learning in Audio Language Models

Integrating trainable prompts into the audio encoder can significantly boost few-shot learning performance in Audio-Language Models, outperforming traditional text-only approaches.

Hyebin Cho, Jaehyuk Jang, Changick Kim +1

Multimodal Models Speech & Audio

Mar 11, 2026

Multimodal Self-Attention Network with Temporal Alignment for Audio-Visual Emotion Recognition

Explicitly aligning audio and video streams in a multimodal Transformer boosts emotion recognition, showing that ignoring frame-rate differences hurts performance.

Inyong Koo, Yeeun Seong, Minseok Son +2

Architecture Design (Transformers, SSMs, MoE)Multimodal Models Speech & Audio

Mar 2, 2026

Efficient Test-Time Optimization for Depth Completion via Low-Rank Decoder Adaptation

Forget full-network finetuning: adapting only a low-dimensional decoder subspace unlocks state-of-the-art zero-shot depth completion with significantly improved efficiency.

Minseok Seo, Wonjun Lee, Jaehyuk Jang +1

Computer Vision Inference & Quantization Training Efficiency & Optimization

Search

Changick Kim

Publication activitypapers/week, last 8 weeks

Research focus

Frequent co-authors

Papers (6)