LLM Engineer, Data Generation

42dot

LLM Engineer (Data Generation) enhancing model performance by designing and generating quality training data. Collaborating with AI teams to analyze model bottlenecks and define data requirements.

Posted 7/3/2026full-timePangyo • 🇰🇷 South KoreaMid-LevelSeniorWebsite

Tech Stack

Tools & technologies

Python

About the role

Key responsibilities & impact

모델 성능 개선을 위한 데이터 설계 및 생성
Research 및 Model Training 팀과 협업하여 모델의 성능 병목, Failure Case, 학습 목표를 분석하고 데이터 요구사항을 정의합니다.
Instruction Data, Preference Data, Reasoning Data, Domain-specific Data 등 목적에 맞는 학습 데이터를 설계·생성·정제합니다.
생성된 데이터가 모델 성능에 미치는 영향을 실험적으로 분석하고, 결과를 바탕으로 데이터 생성 전략을 반복적으로 개선합니다.
Data Generation Pipeline 구축
Synthetic Data를 포함한 학습 데이터 생성 자동화 파이프라인을 설계하고 운영합니다.
대규모 데이터 생성 Workflow를 구축하여 안정적이고 효율적인 데이터 생산 환경을 제공합니다.
생성 비용, 처리 속도 및 품질을 고려한 Pipeline을 지속적으로 최적화합니다.
Data Quality 및 Evaluation
데이터의 품질과 학습 효과를 정량적·정성적으로 평가하는 기준을 정의합니다.
LLM-as-a-Judge, Rule-based Validation, Human Feedback 등을 활용하여 데이터 품질을 검증합니다.
데이터 품질 개선을 위한 Iterative Generation 및 Filtering 전략을 개발합니다.

Requirements

What you’ll need

LLM, Machine Learning 또는 Data Generation 관련 업무 경력 3년 이상
딥러닝, 머신러닝 및 자연어처리에 대한 전반적인 이해
모델 학습 데이터의 구성, 전처리, 품질 평가 및 학습 반영 과정에 대한 이해
Python 기반 데이터 처리 및 자동화 개발 역량
대규모 학습 데이터셋의 처리, 정제, 필터링 및 품질 관리 경험 또는 이에 준하는 역량
LLM을 활용한 Synthetic Data 생성, Data Evaluation 또는 Data Curation 경험
LLM API 및 Prompting/Generation Strategy에 대한 이해 또는 활용 경험
뛰어난 문제 해결 능력과 협업 및 커뮤니케이션 역량.

Benefits

Comp & perks

국가보훈대상자 및 취업보호 대상자는 관계법령에 따라 우대합니다.
장애인 고용 촉진 및 직업재활법에 따라 장애인 등록증 소지자를 우대합니다.

ATS Keywords

✓ Tailor your resume

Applicant Tracking System Keywords

Tip: use these terms in your resume and cover letter to boost ATS matches.

Hard Skills & Tools

Data GenerationModel TrainingData ProcessingData Quality AssessmentSynthetic Data CreationDeep LearningNatural Language ProcessingData FilteringData CurationAutomation Development

Soft Skills

Problem SolvingCollaborationCommunication