Was ist Verstärkendes Lernen
Training eines Agenten durch Umgebungsinteraktion und Belohnungen
Verstärkendes Lernen (Reinforcement Learning) ist ein Machine-Learning-Paradigma, bei dem ein Agent durch Interaktion mit einer Umgebung und den Erhalt von Belohnungen oder Strafen lernt, Entscheidungen zu treffen.
Kernkomponenten
- Agent — trifft Entscheidungen und führt Aktionen aus
- Umgebung — die Welt, mit der der Agent interagiert
- Zustand — aktuelle Situation in der Umgebung
- Aktion — Wahl des Agenten in jedem Moment
- Belohnung — Feedback von der Umgebung
Wichtige Algorithmen
- Q-Learning — Lernen der Aktionswertfunktion
- SARSA — On-Policy-Lernen
- Policy Gradient — direkte Politikoptimierung
- Actor-Critic — Hybridansatz
- Deep Q-Network (DQN) — Q-Learning mit neuronalen Netzen
Geschäftsanwendungen
- Preisoptimierung
- Personalisierung von Empfehlungen
- Bestandsmanagement
- Handelsautomatisierung
- Werbekampagnenoptimierung
Vorteile
- Lernen ohne gelabelte Daten
- Anpassung an Umgebungsänderungen
- Optimierung langfristiger Ergebnisse
- Lösung komplexer sequenzieller Aufgaben