54 |
Titel |
TI |
[DE] TRAINIEREN EINES REINFORCEMENT LEARNING AGENTEN ZUR STEUERUNG EINES AUTONOMEN SYSTEMS [EN] TRAINING A REINFORCEMENT LEARNING AGENT TO CONTROL AN AUTONOMOUS SYSTEM [FR] ENTRAÎNEMENT D'UN AGENT D'APPRENTISSAGE PAR RENFORCEMENT POUR COMMANDER UN SYSTÈME AUTONOME |
71/73 |
Anmelder/Inhaber |
PA |
BAYERISCHE MOTOREN WERKE AG, DE
|
72 |
Erfinder |
IN |
BÖDECKER JOSCHKA, DE
;
HÜGLE MARIA, DE
;
KALWEIT GABRIEL, DE
;
WERLING MORITZ, DE
|
22/96 |
Anmeldedatum |
AD |
14.06.2021 |
21 |
Anmeldenummer |
AN |
2021065919 |
|
Anmeldeland |
AC |
EP |
|
Veröffentlichungsdatum |
PUB |
17.02.2022 |
33 31 32 |
Priorität |
PRC PRN PRD |
DE
102020121150
20200811
|
51 |
IPC-Hauptklasse |
ICM |
G06N 3/00
(2006.01)
|
51 |
IPC-Nebenklasse |
ICS |
B60W 30/18
(2012.01)
G06N 3/08
(2006.01)
|
|
IPC-Zusatzklasse |
ICA |
|
|
IPC-Indexklasse |
ICI |
|
|
Gemeinsame Patentklassifikation |
CPC |
B60W 60/001
G06N 20/00
G06N 3/008
G06N 3/08
|
|
MCD-Hauptklasse |
MCM |
G06N 3/00
(2006.01)
|
|
MCD-Nebenklasse |
MCS |
B60W 30/18
(2012.01)
G06N 3/08
(2006.01)
|
|
MCD-Zusatzklasse |
MCA |
|
57 |
Zusammenfassung |
AB |
[DE] Ein Aspekt der Erfindung betrifft eine Vorrichtung zum Trainieren eines Reinforcement Learning Agenten zur Steuerung eines autonomen Systems, wobei die Vorrichtung eingerichtet ist, das Umfeld des autonomen Systems zu erfassen, zumindest ein zu dem autonomen System vergleichbares Objekt im Umfeld des autonomen Systems zu erkennen, ein Verhalten des zumindest einen zu dem autonomen System vergleichbaren Objekts zu erfassen, und den Reinforcement Learning Agenten in Abhängigkeit von dem erfassten Verhalten des zumindest einen zu dem autonomen System vergleichbaren Objekts zu trainieren. [EN] One aspect of the invention relates to a device for training a reinforcement learning agent to control an autonomous system, wherein the device is designed to detect the environment of the autonomous system, to detect at least one object in the environment of the autonomous system that can be compared to the autonomous system, to detect a behaviour of the at least one object that can be compared to the autonomous system, and to train the reinforcement learning agent in accordance with the detected behaviour of the at least one object that can be compared to the autonomous system. [FR] Selon un aspect, l'invention concerne un dispositif pour entraîner un agent d'apprentissage par renforcement pour commander un système autonome, le dispositif étant conçu pour détecter l'environnement du système autonome, pour détecter au moins un objet comparable au système autonome dans l'environnement du système autonome, pour détecter un comportement de l'objet ou des objets comparable(s) au système autonome, et pour entraîner l'agent d'apprentissage par renforcement en fonction du comportement détecté de l'objet ou des objets comparable(s) au système autonome. |
56 |
Entgegengehaltene Patentdokumente/Zitate, in Recherche ermittelt |
CT |
US000010627823B1 US020200189597A1
|
56 |
Entgegengehaltene Patentdokumente/Zitate, vom Anmelder genannt |
CT |
|
56 |
Entgegengehaltene Nichtpatentliteratur/Zitate, in Recherche ermittelt |
CTNP |
MICHEL DEUDON ET AL: "HighRes-net: Recursive Fusion for Multi-Frame Super-Resolution of Satellite Imagery", ARXIV.ORG, CORNELL UNIVERSITY LIBRARY, 201 OLIN LIBRARY CORNELL UNIVERSITY ITHACA, NY 14853, 15 February 2020 (2020-02-15), XP081600852 7; WANG PIN ET AL: "A Reinforcement Learning Based Approach for Automated Lane Change Maneuvers", 2018 IEEE INTELLIGENT VEHICLES SYMPOSIUM (IV), IEEE, 26 June 2018 (2018-06-26), pages 1379 - 1384, XP033423455, DOI: 10.1109/IVS.2018.8500556 7
|
56 |
Entgegengehaltene Nichtpatentliteratur/Zitate, vom Anmelder genannt |
CTNP |
|
|
Zitierende Dokumente |
|
Dokumente ermitteln
|
|
Sequenzprotokoll |
|
|
|
Prüfstoff-IPC |
ICP |
B60W 30/18
G06N 3/00
|