Apply

Ready to go for it?

AI Apply speeds things up—apply directly if you prefer.

FREE ACCESS
5,000–10,000 jobs/day
JobTailor Logo

See all jobs on JobTailor

Search thousands of fresh jobs every day.

Discover
  • Fresh listings
  • Fast filters
  • No subscription required
Create a free account and start exploring right away.
42dot

LLM Engineer, Data Generation

42dot

LLM Engineer (Data Generation) enhancing model performance by designing and generating quality training data. Collaborating with AI teams to analyze model bottlenecks and define data requirements.

Posted 7/3/2026full-timePangyo • 🇰🇷 South KoreaMid-LevelSeniorWebsite

Tech Stack

Tools & technologies
Python

About the role

Key responsibilities & impact
  • 모델 성능 개선을 위한 데이터 설계 및 생성
  • Research 및 Model Training 팀과 협업하여 모델의 성능 병목, Failure Case, 학습 목표를 분석하고 데이터 요구사항을 정의합니다.
  • Instruction Data, Preference Data, Reasoning Data, Domain-specific Data 등 목적에 맞는 학습 데이터를 설계·생성·정제합니다.
  • 생성된 데이터가 모델 성능에 미치는 영향을 실험적으로 분석하고, 결과를 바탕으로 데이터 생성 전략을 반복적으로 개선합니다.
  • Data Generation Pipeline 구축
  • Synthetic Data를 포함한 학습 데이터 생성 자동화 파이프라인을 설계하고 운영합니다.
  • 대규모 데이터 생성 Workflow를 구축하여 안정적이고 효율적인 데이터 생산 환경을 제공합니다.
  • 생성 비용, 처리 속도 및 품질을 고려한 Pipeline을 지속적으로 최적화합니다.
  • Data Quality 및 Evaluation
  • 데이터의 품질과 학습 효과를 정량적·정성적으로 평가하는 기준을 정의합니다.
  • LLM-as-a-Judge, Rule-based Validation, Human Feedback 등을 활용하여 데이터 품질을 검증합니다.
  • 데이터 품질 개선을 위한 Iterative Generation 및 Filtering 전략을 개발합니다.

Requirements

What you’ll need
  • LLM, Machine Learning 또는 Data Generation 관련 업무 경력 3년 이상
  • 딥러닝, 머신러닝 및 자연어처리에 대한 전반적인 이해
  • 모델 학습 데이터의 구성, 전처리, 품질 평가 및 학습 반영 과정에 대한 이해
  • Python 기반 데이터 처리 및 자동화 개발 역량
  • 대규모 학습 데이터셋의 처리, 정제, 필터링 및 품질 관리 경험 또는 이에 준하는 역량
  • LLM을 활용한 Synthetic Data 생성, Data Evaluation 또는 Data Curation 경험
  • LLM API 및 Prompting/Generation Strategy에 대한 이해 또는 활용 경험
  • 뛰어난 문제 해결 능력과 협업 및 커뮤니케이션 역량.

Benefits

Comp & perks
  • 국가보훈대상자 및 취업보호 대상자는 관계법령에 따라 우대합니다.
  • 장애인 고용 촉진 및 직업재활법에 따라 장애인 등록증 소지자를 우대합니다.

ATS Keywords

✓ Tailor your resume
Applicant Tracking System Keywords

Tip: use these terms in your resume and cover letter to boost ATS matches.

Hard Skills & Tools
Data GenerationModel TrainingData ProcessingData Quality AssessmentSynthetic Data CreationDeep LearningNatural Language ProcessingData FilteringData CurationAutomation Development
Soft Skills
Problem SolvingCollaborationCommunication