Technické AI pojmy technické

RLHF (Reinforcement Learning from Human Feedback)

RLHF (Reinforcement Learning from Human Feedback)

Hugovo vysvětlení: Učení na základě lidské zpětné vazby. Lidé hodnotí odpovědi AI a ta se podle toho učí, co se nám líbí.

Příklad z praxe: Když v ChatGPT klikneš na palec nahoru, pomáháš v procesu RLHF.

Jdi hlouběji

  • [[fine-tuning]] — Fine-tuning
  • [[reinforcement-learning-posilovane-uceni]] — Reinforcement Learning (Posilované učení)
  • [[supervised-learning-uceni-s-dohledem]] — Supervised learning (Učení s dohledem)
  • [[unsupervised-learning-uceni-bez-dohledu]] — Unsupervised learning (Učení bez dohledu)

Poznámky

Súvisející pojmy

Fine-tuning
Technické AI pojmy
Reinforcement Learning (Posilované učení)
Technické AI pojmy
Supervised learning (Učení s dohledem)
Technické AI pojmy
Unsupervised learning (Učení bez dohledu)
Technické AI pojmy
← Zpět na slovník