Yes. Health AI training and evaluation work is carried out remotely, in your own time, at times of your choosing.

Do I need technical or coding skills?

No. Clinical judgement and real-world experience are what is required. Most tasks involve reading, reasoning, and writing assessing AI outputs, defining reference answers, and quality checking responses.

Is patient data involved?

No identifiable patient data is used.

Is this a job or freelance contract work?

This is contract project work, not employment. Most arrangements are flexible and task-based rather than salaried. You will be contracting directly with Mercor or Micro1, not with this site.

Can I do this alongside NHS or locum work?

In many cases yes subject to your employer's policy on secondary work and any conflicts of interest.

Model Evaluation & Comparison | AI Training Jobs

Live, remote AI-training roles relevant to Model Evaluation Comparison, updated daily. Applied Clinical Judgement is a UK-based referral intermediary: we point you to genuine openings on the major training platforms and are paid only when a referral succeeds. Pay rates are shown on each role; we never display our referral fee.

212 live Model Evaluation Comparison roles · updated daily

Mercor$80.0-$120.0 / hourly

Personal finance / consumer planning Evaluator

Master's

Global · remote

Mercor is recruiting personal finance and consumer planning evaluators at $80–$120 per hour on a remote, hourly basis. You'll assess AI-generated documents, spreadsheets and presentations for accuracy and quality, applying structured feedback against domain rubrics. The role requires five years' relevant professional experience and fluency in Microsoft Office and Google Workspace.

personal financeconsumer planningMicrosoft OfficeGoogle WorkspaceGoogle Slides+2

Model Evaluation Comparison AI Jobs

Personal finance / consumer planning Evaluator

Process improvement / SOPs Evaluator

Public-sector procurement / RFI response Evaluator

Finance operations / audit support Evaluator

Document/deck production QA Evaluator

BI dashboards / performance reporting Evaluator

Investment analysis / valuation / credit Evaluator

IP / trademark / copyright law Evaluator

Data quality / CRM operations Evaluator

Procurement / vendor management Evaluator

Cybersecurity / IT GRC Evaluator

Operations / inventory / capacity planning Evaluator

Data analysis / quantitative readouts Evaluator

FP&A / corporate finance Evaluator

General finance / accounting Evaluator

Program management / implementation planning Evaluator

General business strategy / management Evaluator

Software / AI / IT / data Evaluator

Product management / roadmap / PRD Evaluator

Spreadsheet QA / workbook maintenance Evaluator

Education / school Evaluator

Healthcare operations Evaluator

Market research / competitive intelligence Evaluator

People ops / recruiting Evaluator

Product launch / experiment readiness Evaluator

Public health communications Evaluator

User/customer research and feedback synthesis Evaluator

Investor materials / fundraising / pitchbook Evaluator

Special education / IEP Evaluator

Privacy / regulatory compliance Evaluator

Customer success / support operations Evaluator

Legal contracts / diligence / redlines Evaluator

General Sales / GTM Evaluator

Compliance / regulatory response with financial-services AI Evaluator

Humanities / arts / culture Evaluator

Training / onboarding / L&D Evaluator

Brand / creative direction / marketing collateral Evaluator

Incident management / reliability / SRE Evaluator

Media / journalism / communications Evaluator

Nonprofit / philanthropy / community programs Evaluator

Government / public administration Evaluator

Clinical / biomedical / pharma Evaluator

Real estate / hospitality / events Evaluator

Biology / environmental science Evaluator

Legal / compliance Evaluator

Healthcare / clinical Evaluator

Pricing / ROI / revenue economics Evaluator

Generalist Expert

Japanese Audio Generalist Evaluator Expert

AI Safety Experts — English & Urdu

Telecommunications Expert

Generalist - English & Assamese

Generalist - English & Odia

Generalist - English & Gujarati

Generalist - English & Malayalam

Generalist - English & Kannada

Generalist - English & Punjabi

Generalist - English & Marathi

Generalist - English & Tamil

Generalist - English & Telugu

Generalist - English & Urdu

Generalist - English & Bengali

Legal Expert — Specialist (Real Estate, Tax, Bankruptcy, Estates)

Investment Banking Expert

Building Code & Permitting Specialists (ONLY Cal & FL)

Compliance & Risk Specialist Talent Network

Management Consultant Talent Network

Physical Scientist Talent Network

Marketing Specialist Talent Network

HR & Administration Specialist Talent Network

Financial Analyst Talent Network

Chemist Talent Network

Biologist Talent Network

Mathematician Talent Network

Lawyer Talent Network

Nursing Talent Network

Physician Talent Network

Business Intelligence Analyst Talent Network

Frontend Engineer Talent Network