Pengfei Wan

Kling Team

Papers on Lattice

Total citations

Topics

h-index

Publication activitypapers/week, last 8 weeks

Research focus

Multimodal Models (7)Computer Vision (6)Architecture Design (Transformers, SSMs, MoE) (4)World Models & Planning (2)

Frequent co-authors

Xinlong Chen (2)Xiaoqiang Liu (2)Kun Gai (2)Yongjie Zhu (2)

Papers (9)

Jul 16, 2026

1w ago·also Kling Team

ReBind: Multi-Reference Video Editing via Structured Instructions with Explicit Reference Relationships

Embedding reference tokens at semantic positions allows for unprecedented precision in multi-reference video editing, setting a new benchmark for instruction quality.

Xinyu Liu, Shihao Li, Weihong Lin +11

Computer Vision Multimodal Models

Apr 6, 2026

D. Team +43Apr 6, 2026·also Kling Team, PKU, SYSU

OpenWorldLib: A Unified Codebase and Definition of Advanced World Models

Stop reinventing the wheel: OpenWorldLib offers a unified framework and codebase for advanced world models, finally bringing standardization to a fragmented field.

D. Team, DataFlow Team, Bohan Zeng +41

Open-Source Models & Weights World Models & Planning

Mar 29, 2026

Zhongyuan Liu +4Mar 29, 2026·also Kling Team

S3KF: Spherical State-Space Kalman Filtering for Panoramic 3D Multi-Object Tracking

Achieve robust, real-time 3D multi-object tracking in panoramic views by representing object states on a sphere, sidestepping the limitations of image-plane trackers and redundant Euclidean formulations.

Zhongyuan Liu, Shaonan Yu, Pengfei Wan +2

Architecture Design (Transformers, SSMs, MoE)Computer Vision Robotics & Embodied AI

Mar 26, 2026

Kai Chen +6Mar 26, 2026·also Kling Team

Out of Sight but Not Out of Mind: Hybrid Memory for Dynamic Video World Models

World models can now remember and realistically regenerate dynamic objects that temporarily disappear from view, thanks to a novel hybrid memory architecture.

Kai Chen, Dingkang Liang, Xin Zhou +4

Computer Vision Multimodal Models World Models & Planning

Mar 26, 2026·also Kling Team, Kuaishou

ShotStream: Streaming Multi-Shot Video Generation for Interactive Storytelling

Generate multi-shot videos at 16 FPS with a single GPU and interactively steer the narrative in real-time, thanks to a novel causal architecture that overcomes the limitations of bidirectional models.

Yawen Luo, Xiaoyu Shi, Junhao Zhuang +5

Architecture Design (Transformers, SSMs, MoE)Computer Vision Multimodal Models

Mar 3, 2026

Mar 3, 2026·also CAS, Kling Team, Michigan State, Queen's

Kling-MotionControl Technical Report

Achieve lifelike character animation with 10x faster inference using Kling-MotionControl, a DiT-based framework that intelligently handles body, face, and hand motions.

Kling Team Jialu Chen, Yi-Tao Ding, Zhixue Fang +16

Architecture Design (Transformers, SSMs, MoE)Computer Vision Multimodal Models

Feb 18, 2026

Feb 18, 2026·also Kling Team

Analytic Score Optimization for Multi Dimension Video Quality Assessment

Forget single-number video quality scores: UltraVQA and Analytic Score Optimization (ASO) unlock richer, multi-faceted evaluations that better align with human preferences.

Boda Lin, Yongjie Zhu, Wenyu Qin +1

Computer Vision Eval Frameworks & Benchmarks Multimodal Models

Feb 14, 2026

Feb 14, 2026·also HIT, Kling Team, Kuaishou

Embed-RL: Reinforcement Learning for Reasoning-Driven Multimodal Embeddings

Forget generic CoT: Embed-RL uses reinforcement learning to generate reasoning traces that are explicitly optimized for multimodal embedding tasks, leading to significant performance gains.

Haonan Jiang, Yongjie Zhu, Xin Lu +2

Multimodal Models Reasoning & Chain-of-Thought RLHF & Preference Learning

Jan 5, 2026

Jan 5, 2026·also Kling Team, Kuaishou, Nanyang Technology University

VINO: A Unified Visual Generator with Interleaved OmniModal Context

Forget separate image and video models: VINO's single diffusion backbone handles both, opening the door to truly unified visual creation and editing.

Junyi Chen, Tong He, Zhoujie Fu +3

Architecture Design (Transformers, SSMs, MoE)Multimodal Models

Search

Pengfei Wan

Publication activitypapers/week, last 8 weeks

Research focus

Frequent co-authors

Papers (9)