Technické AI pojmy technické

Reinforcement Learning (Posilované učení)

Reinforcement Learning (Posilované učení)

Hugovo vysvětlení: Učení metodou pokus-omyl, kde AI dostává „odměnu“ za správné chování a „trest“ za špatné. Jako když cvičíš psa.

Příklad z praxe: AI, která se učí hrát šachy tím, že odehraje miliony partií sama proti sobě.

Jdi hlouběji

  • [[fine-tuning]] — Fine-tuning
  • [[rlhf-reinforcement-learning-from-human-feedback]] — RLHF (Reinforcement Learning from Human Feedback)
  • [[supervised-learning-uceni-s-dohledem]] — Supervised learning (Učení s dohledem)
  • [[unsupervised-learning-uceni-bez-dohledu]] — Unsupervised learning (Učení bez dohledu)

Poznámky

Súvisející pojmy

Fine-tuning
Technické AI pojmy
RLHF (Reinforcement Learning from Human Feedback)
Technické AI pojmy
Supervised learning (Učení s dohledem)
Technické AI pojmy
Unsupervised learning (Učení bez dohledu)
Technické AI pojmy
← Zpět na slovník