Bestärkendes Lernen
Fouad Sabry
* Affiliatelinks/Werbelinks
Links auf reinlesen.de sind sogenannte Affiliate-Links. Wenn du auf so einen Affiliate-Link klickst und über diesen Link einkaufst, bekommt reinlesen.de von dem betreffenden Online-Shop oder Anbieter eine Provision. Für dich verändert sich der Preis nicht.
Eine Milliarde Sachkundig [German]
Naturwissenschaften, Medizin, Informatik, Technik / Technik
Beschreibung
Im sich rasch entwickelnden Bereich der Robotik gilt Reinforcement Learning als eine der vielversprechendsten Methoden zum Aufbau autonomer Systeme. Dieses Buch, Reinforcement Learning, bietet eine eingehende Untersuchung dieser leistungsstarken Technik und führt die Leser von ihren Grundprinzipien bis hin zu ihren neuesten Fortschritten. Dieses Buch ist perfekt für Fachleute, Doktoranden und Enthusiasten gleichermaßen und bietet einen detaillierten und dennoch zugänglichen Ansatz zum Verständnis von Reinforcement Learning im Kontext der Robotik
Reinforcement Learning-Stellt das Kernkonzept von Reinforcement Learning vor und betont seine Rolle in autonomen Systemen
Markov-Entscheidungsprozess-Erklärt den mathematischen Rahmen für Entscheidungsfindung unter Unsicherheit, eine wichtige Grundlage für Reinforcement Learning
Zeitdifferenzlernen-Erforscht Methoden zum Lernen aus Erfahrung ohne ein Modell der Umgebung zu benötigen
Bellman-Gleichung-Erörtert die kritische rekursive Beziehung, die vielen Reinforcement-Learning-Algorithmen zugrunde liegt
Qlearning-Konzentriert sich auf einen Off-Policy-Reinforcement-Learning-Algorithmus, der optimale Aktionen ohne ein Modell der Umgebung lernt
Mehrarmiger Bandit-Behandelt ein einfacheres Problem des bestärkenden Lernens, das Entscheidungsfindung in unsicheren Umgebungen modelliert
Teilweise beobachtbarer Markow-Entscheidungsprozess-Erweitert traditionelle Markow-Entscheidungsprozesse durch die Einbeziehung verborgener Zustände
Gittins-Index-Führt eine Strategie zum Ausgleich von Exploration und Ausbeutung bei Problemen mit mehrarmigen Banditen ein
Zustand–Aktion–Belohnung–Zustand–Aktion-Befasst sich mit den zeitlichen Mustern des bestärkenden Lernens, die Entscheidungsfindungsstrategien beeinflussen
Protowertfunktion-Erforscht Methoden zur Annäherung von Wertfunktionen, die die Effizienz des Lernens unterstützen
Automatische Basisfunktionskonstruktion-Konzentriert sich auf automatische Methoden zur Konstruktion von Merkmalen zur Verbesserung der Lerneffizienz
Meanfield-Spieltheorie-Bespricht ein Framework zur Modellierung von Interaktionen in groß angelegten Multiagentensystemen
Multiagenten-Pfadfindung-Führt Algorithmen zur Koordination mehrerer Agenten ein, damit diese ihre Ziele effizient erreichen
Modellfrei (Verstärkendes Lernen)-Bespricht Methoden, die beim Lernen nicht auf ein Modell der Umgebung angewiesen sind
Tiefes verstärkendes Lernen-Kombiniert tiefes Lernen und verstärkendes Lernen, um komplexe, hochdimensionale Umgebungen zu handhaben
Multiagenten-verstärkendes Lernen-Konzentriert sich auf Strategien zum Lernen in Umgebungen mit mehreren interagierenden Agenten
Selbstspiel-Erforscht das Konzept von Agenten, die durch Wettbewerb mit sich selbst lernen, eine entscheidende Komponente fortgeschrittener Lernstrategien
Proximale Richtlinienoptimierung-Führt einen Algorithmus zur Optimierung von Richtlinien beim verstärkenden Lernen mit verbesserter Stabilität und Leistung ein
Explorations-/Ausbeutungsdilemma-Bespricht die grundlegende Herausforderung, die Erforschung neuer Strategien mit der Ausnutzung bekannter Strategien in Einklang zu bringen
Verstärkendes Lernen aus menschlichem Feedback-Untersucht Methoden zur Verbesserung des verstärkenden Lernens durch menschliche Eingaben
Imitationslernen-Konzentriert sich auf Techniken, bei denen Agenten lernen, indem sie die Aktionen menschlicher Experten nachahmen
Kundenbewertungen
Mehrarmiger Bandit, Bestärkendes Lernen, Markow-Entscheidungsprozess, Teilweise beobachtbarer Markow-Entscheidungsprozes, Zeitliches Differenzlernen, Bellman-Gleichung, Q-Lernen