Lattice AI Research

Research focus

Natural Language Processing (3)Recommendation & Information Retrieval (2)Training Efficiency & Optimization (2)Data Curation & Synthetic Data (1)Inference & Quantization (1)

Frequent co-authors

Youngjoon Jang (3)Heuiseok Lim (3)Heuiseok Lim (2)Hyeonseok Moon (2)

Papers (4)

Apr 9, 2026

REVISE: A Framework for Revising OCRed text in Practical Information Systems with Data Contamination Strategy

Synthetically corrupting data with a taxonomy of OCR errors lets you train LLMs to fix real-world OCR mistakes and dramatically improve document understanding.

Gyuho Shim, Seongtae Hong, Heu-Jeoung Lim +1

Data Curation & Synthetic Data Natural Language Processing

Apr 7, 2026

Seongtae Hong +4Apr 7, 2026·also Corresponding author

Improving Semantic Proximity in Information Retrieval through Cross-Lingual Alignment

Multilingual retrievers often prioritize irrelevant English documents over relevant foreign-language documents, even when the query is in that foreign language.

Seongtae Hong, Youngjoon Jang, Jungseob Lee +2

Natural Language Processing Recommendation & Information Retrieval

Seungyoon Lee +5Apr 7, 2026

CLEAR: Cross-Lingual Enhancement in Alignment via Reverse-training

Low-resource languages can get a 15% boost in cross-lingual retrieval accuracy by using English as a Rosetta Stone during training.

Seungyoon Lee, Minhyuk Kim, Seongtae Hong +3

Natural Language Processing Training Efficiency & Optimization

Apr 6, 2026

Beyond Hard Negatives: The Importance of Score Distribution in Knowledge Distillation for Dense Retrieval

Forget just mining hard negatives: the secret to better knowledge distillation for retrieval lies in matching the *entire* score distribution of your teacher model.

Youngjoon Jang, Seongtae Hong, Hyeonseok Moon +2

Inference & Quantization Recommendation & Information Retrieval Training Efficiency & Optimization

Search

Seongtae Hong

Research focus

Frequent co-authors

Papers (4)