Data Engineer

INVID

contract

Posted on: 2/7/2026

Location Type: Hybrid

Location: San Juan • United States

✨ AI Apply

About the role

Build labeling pipelines that join behavioral events to outcome data (sanctions designations, flag changes, detentions)
Implement proxy labeling strategies that create training signal from observable outcomes
Build weak supervision infrastructure to combine multiple noisy labeling rules
Create and maintain ML training datasets at scale
Build data validation and quality monitoring systems
Implement versioning for reproducible model training
Integrate LRIT position data for prediction validation
Build pipelines that compare predicted locations against actual LRIT reports
Create feedback loops that improve model accuracy over time
Scale data infrastructure as models and data sources grow

Benefits

Applicant Tracking System Keywords

Tip: use these terms in your resume and cover letter to boost ATS matches.

Hard Skills & Tools

SQLSparkAirflowPythonML training data requirementsdata validationquality monitoringversioningdata processingpipeline orchestration