Jiafeng Guo

State Key Laboratory of AI Safety, Institute of Computing Technology, Chinese Academy of Sciences

Papers on Lattice

Total citations

Topics

h-index

Publication activitypapers/week, last 8 weeks

Research focus

Natural Language Processing (3)Recommendation & Information Retrieval (3)Data Curation & Synthetic Data (2)Constitutional AI & AI Ethics (1)

Frequent co-authors

Xueqi Cheng (4)Keping Bi (2)Wei Shao (1)Yihang Wang (1)

Papers (5)

Apr 21, 2026

State Key Laboratory of AI Safety1w ago·also CAS, JD.com

Detoxification for LLM: From Dataset Itself

Training LLMs on data detoxified with HSPD slashes toxicity by more than half, outperforming existing methods that only address toxicity during or after training.

Wei Shao, Yihang Wang, Gaoyu Zhu +4

Constitutional AI & AI Ethics Data Curation & Synthetic Data Natural Language Processing

Apr 14, 2026

2w ago·also CAS, State Key Laboratory of AI Safety

AdversarialCoT: Single-Document Retrieval Poisoning for LLM Reasoning

Just one carefully crafted poisoned document can cripple an LLM's reasoning abilities in retrieval-augmented generation.

Hongru Song, Yuan Liu, Ruqing Zhang +5

Reasoning & Chain-of-Thought Recommendation & Information Retrieval Red-Teaming & Adversarial Robustness

Apr 7, 2026

3w ago·also State Key Laboratory of AI Safety

Data, Not Model: Explaining Bias toward LLM Texts in Neural Retrievers

Neural retrievers' preference for LLM-generated text isn't an inherent flaw, but rather a learned bias from artifacts present in training data, offering a path to debiasing without architectural changes.

Wei Huang, Keping Bi, Yinqiong Cai +2

Data Curation & Synthetic Data Natural Language Processing Recommendation & Information Retrieval

Mar 11, 2026

Mar 11, 2026·also CAS, State Key Laboratory of AI Safety, University of California

Prism-$\Delta$: Differential Subspace Steering for Prompt Highlighting in Large Language Models

Prompt highlighting in LLMs gets a serious upgrade: PRISM-$\Delta$ steers models to focus on relevant text spans with better accuracy and fluency, even in long contexts.

Yuyao Ge, Shenghua Liu, Yiwei Wang +6

Interpretability & Mechanistic Interp Natural Language Processing

Mar 2, 2026

Mar 2, 2026·also CAS, HKU, State Key Laboratory of AI Safety

Reconstructing Content via Collaborative Attention to Improve Multimodal Embedding Quality

Multimodal embeddings get a serious upgrade with CoCoA, a new pre-training method that forces models to compress all input information into a single token for reconstruction, leading to substantial quality gains.

Jiahan Chen, Jiahan Chen, Da Li +9

Architecture Design (Transformers, SSMs, MoE)Multimodal Models Recommendation & Information Retrieval

Search

Jiafeng Guo

Publication activitypapers/week, last 8 weeks

Research focus

Frequent co-authors

Papers (5)