Jiajun Sun

Papers on Lattice

Total citations

Topics

h-index

Research focus

Speech & Audio (2)Computer Vision (1)Multimodal Models (1)Data Curation & Synthetic Data (1)Open-Source Models & Weights (1)

Frequent co-authors

Zhen Gao (1)Zhe Gao (1)Changhao Jiang (1)Jiahao Chen (1)

Papers (2)

Mar 12, 2026

Jiajun Sun +2Mar 12, 2026

A Two-Stage Dual-Modality Model for Facial Emotional Expression Recognition

DINOv2 visual features and Wav2Vec 2.0 audio features can be effectively fused in a two-stage model to achieve state-of-the-art facial expression recognition in challenging, unconstrained video conditions.

Jiajun Sun, Zhen Gao, Zhe Gao

Computer Vision Multimodal Models Speech & Audio

Jan 7, 2026

Google ResearchJan 7, 2026·also Fudan, HuggingFace

Muse: Towards Reproducible Long-Form Song Generation with Fine-Grained Style Control

Finally, a fully open-source, reproducible system for long-form song generation is here, complete with licensed data, code, and a Qwen-based model that rivals closed-source systems.

Changhao Jiang, Jiahao Chen, Zhenghao Xiang +14

Data Curation & Synthetic Data Open-Source Models & Weights Speech & Audio

Search

Jiajun Sun

Research focus

Frequent co-authors

Papers (2)