Bibliografische Daten

Dokument WO002022033746A1 (Seiten: 26)

Bibliografische Daten Dokument WO002022033746A1 (Seiten: 26)
INID Kriterium Feld Inhalt
54 Titel TI [DE] TRAINIEREN EINES REINFORCEMENT LEARNING AGENTEN ZUR STEUERUNG EINES AUTONOMEN SYSTEMS
[EN] TRAINING A REINFORCEMENT LEARNING AGENT TO CONTROL AN AUTONOMOUS SYSTEM
[FR] ENTRANEMENT D'UN AGENT D'APPRENTISSAGE PAR RENFORCEMENT POUR COMMANDER UN SYSTME AUTONOME
71/73 Anmelder/Inhaber PA BAYERISCHE MOTOREN WERKE AG, DE
72 Erfinder IN BDECKER JOSCHKA, DE ; HGLE MARIA, DE ; KALWEIT GABRIEL, DE ; WERLING MORITZ, DE
22/96 Anmeldedatum AD 14.06.2021
21 Anmeldenummer AN 2021065919
Anmeldeland AC EP
Veröffentlichungsdatum PUB 17.02.2022
33
31
32
Priorität PRC
PRN
PRD
DE
102020121150
20200811
51 IPC-Hauptklasse ICM G06N 3/00 (2006.01)
51 IPC-Nebenklasse ICS B60W 30/18 (2012.01)
G06N 3/08 (2006.01)
IPC-Zusatzklasse ICA
IPC-Indexklasse ICI
Gemeinsame Patentklassifikation CPC Neues Fenster: Externer Link Gemeinsame Patentklassifikation B60W 60/001 B60W 60/001
Neues Fenster: Externer Link Gemeinsame Patentklassifikation G06N 3/008 G06N 3/008
Neues Fenster: Externer Link Gemeinsame Patentklassifikation G06N 3/08 G06N 3/08
MCD-Hauptklasse MCM G06N 3/00 (2006.01)
MCD-Nebenklasse MCS B60W 30/18 (2012.01)
G06N 3/08 (2006.01)
MCD-Zusatzklasse MCA
57 Zusammenfassung AB [DE] Ein Aspekt der Erfindung betrifft eine Vorrichtung zum Trainieren eines Reinforcement Learning Agenten zur Steuerung eines autonomen Systems, wobei die Vorrichtung eingerichtet ist, das Umfeld des autonomen Systems zu erfassen, zumindest ein zu dem autonomen System vergleichbares Objekt im Umfeld des autonomen Systems zu erkennen, ein Verhalten des zumindest einen zu dem autonomen System vergleichbaren Objekts zu erfassen, und den Reinforcement Learning Agenten in Abhngigkeit von dem erfassten Verhalten des zumindest einen zu dem autonomen System vergleichbaren Objekts zu trainieren.
[EN] One aspect of the invention relates to a device for training a reinforcement learning agent to control an autonomous system, wherein the device is designed to detect the environment of the autonomous system, to detect at least one object in the environment of the autonomous system that can be compared to the autonomous system, to detect a behaviour of the at least one object that can be compared to the autonomous system, and to train the reinforcement learning agent in accordance with the detected behaviour of the at least one object that can be compared to the autonomous system.
[FR] Selon un aspect, l'invention concerne un dispositif pour entraner un agent d'apprentissage par renforcement pour commander un systme autonome, le dispositif tant conu pour dtecter l'environnement du systme autonome, pour dtecter au moins un objet comparable au systme autonome dans l'environnement du systme autonome, pour dtecter un comportement de l'objet ou des objets comparable(s) au systme autonome, et pour entraner l'agent d'apprentissage par renforcement en fonction du comportement dtect de l'objet ou des objets comparable(s) au systme autonome.
Korrekturinformation KORRINF
56 Entgegengehaltene Patentdokumente/Zitate,
in Recherche ermittelt
CT
US000010627823B1
US020200189597A1
56 Entgegengehaltene Patentdokumente/Zitate,
vom Anmelder genannt
CT
56 Entgegengehaltene Nichtpatentliteratur/Zitate,
in Recherche ermittelt
CTNP MICHEL DEUDON ET AL: "HighRes-net: Recursive Fusion for Multi-Frame Super-Resolution of Satellite Imagery", ARXIV.ORG, CORNELL UNIVERSITY LIBRARY, 201 OLIN LIBRARY CORNELL UNIVERSITY ITHACA, NY 14853, 15 February 2020 (2020-02-15), XP081600852 7;
WANG PIN ET AL: "A Reinforcement Learning Based Approach for Automated Lane Change Maneuvers", 2018 IEEE INTELLIGENT VEHICLES SYMPOSIUM (IV), IEEE, 26 June 2018 (2018-06-26), pages 1379 - 1384, XP033423455, DOI: 10.1109/IVS.2018.8500556 7
56 Entgegengehaltene Nichtpatentliteratur/Zitate,
vom Anmelder genannt
CTNP
Zitierende Dokumente Dokumente ermitteln
Sequenzprotokoll
Prüfstoff-IPC ICP B60W 30/18