(19)
(11)EP 3 725 633 A1

(12)EUROPÄISCHE PATENTANMELDUNG

(43)Veröffentlichungstag:
21.10.2020  Patentblatt  2020/43

(21)Anmeldenummer: 20168768.8

(22)Anmeldetag:  08.04.2020
(51)Internationale Patentklassifikation (IPC): 
B60W 50/00(2006.01)
G06N 3/04(2006.01)
G06N 3/08(2006.01)
(84)Benannte Vertragsstaaten:
AL AT BE BG CH CY CZ DE DK EE ES FI FR GB GR HR HU IE IS IT LI LT LU LV MC MK MT NL NO PL PT RO RS SE SI SK SM TR
Benannte Erstreckungsstaaten:
BA ME
Benannte Validierungsstaaten:
KH MA MD TN

(30)Priorität: 16.04.2019 DE 102019205519

(71)Anmelder: Robert Bosch GmbH
70442 Stuttgart (DE)

(72)Erfinder:
  • Schiegg, Martin
    70825 Korntal-Muenchingen (DE)
  • Angermaier, Stefan
    70327 Stuttgart (DE)
  • Zafar, Muhammad Bilal
    71272 Renningen (DE)

  


(54)VERFAHREN ZUM ERMITTELN VON FAHRVERLÄUFEN


(57) Vorgestellt wird ein computerimplementiertes Verfahren zum Trainieren eines maschinellen Lernsystems zum Generieren von Fahrverläufen eines Fahrzeugs mit den Schritten:
- aus einer ersten Datenbank mit Fahrtrouten werden erste Fahrtrouten ausgewählt,
- ein Generator des maschinellen Lernsystems erhält die ersten Fahrtrouten als Eingangsgrößen und generiert zu den ersten Fahrtrouten jeweils zugehörige erste Fahrverläufe,
- in einer zweiten Datenbank sind Fahrtrouten und jeweils zugehörige, im Fahrbetrieb erfasste Fahrverläufe abgespeichert,
- aus der zweiten Datenbank werden zweite Fahrtrouten sowie jeweils zugehörige zweite, im Fahrbetrieb erfasste Fahrverläufe ausgewählt,
- ein Diskriminator des maschinellen Lernsystems erhält als Eingangsgrößen Paare aus einer der ersten Fahrtrouten mit jeweils zugehörigem ersten, generierten Fahrverlauf und Paare aus zweiten Fahrtrouten mit jeweils zugehörigem zweiten, im Fahrbetrieb erfassten Fahrverlauf,
- der Diskriminator berechnet abhängig von den Eingangsgrößen Ausgaben, welche für jedes als Eingangsgrößen erhaltene Paar charakterisieren, ob es sich um ein Paar mit einem ersten, generierten Fahrverlauf oder um ein Paar mit einem zweiten, im Fahrbetrieb erfassten Fahrverlauf handelt,
- abhängig von den Ausgaben des Diskriminators wird eine Zielfunktion optimiert, welche eine Distanz zwischen der Verteilung der Paare mit ersten, generierten Fahrverläufen und der Verteilung der Paare mit zweiten, im Fahrbetrieb erfassten Fahrverläufen darstellt.




Beschreibung


[0001] Die Erfindung betrifft computerimplementierte Verfahren zum Generieren oder Bewerten von Fahrverläufen eines Fahrzeugs mittels eines maschinellen Lernsystems, ein computerimplementiertes Verfahren zum Anlernen eines solchen maschinellen Lernsystems sowie hierzu eingerichtete Computerprogramme und Lernsysteme.

Stand der Technik



[0002] Die DE 10 2017 107 271 A1 offenbart ein Verfahren zur Ermittlung eines Leitfahrzyklus für Fahrversuche zur Ermittlung von Abgasemissionen von Kraftfahrzeugen. Dabei werden Geschwindigkeitsprofile für die verschiedenen Fahrzyklen auf Basis der Parametersätze abgeleitet. Ziel ist das Ermitteln eines Leitzyklus, der möglichst den "Maximal"-Emissionsfall innerhalb gegebener Randbedingungen widerspiegelt.

Offenbarung der Erfindung



[0003] In einigen Ländern sieht die Gesetzgebung vor, die Zulassung neuer Kraftfahrzeuge, die mittels einer Brennkraftmaschine angetrieben werden, abhängig von den Emissionen zu machen, die sich im praktischen Fahrbetrieb ergeben. Hierfür ist auch die englische Bezeichnung real driving emissions gebräuchlich. Solche Kraftfahrzeuge umfassen beispielsweise solche, die ausschließlich von einem Verbrennungsmotor angetrieben werden, aber auch solche mit einem hybridisierten Antriebsstrang.

[0004] Hierzu ist vorgesehen, dass ein Prüfer mit dem Kraftfahrzeug einen Fahrzyklus oder mehrere Fahrzyklen bestreitet und die dabei entstehenden Emissionen gemessen werden. Die Zulassung des Kraftfahrzeugs ist dann abhängig von diesen gemessenen Emissionen. Der Fahrzyklus kann hierbei innerhalb weiter Grenzen vom Prüfer frei gewählt werden. Eine typische Dauer eines Fahrzyklus kann hierbei beispielsweise 90-120min betragen.

[0005] Für Hersteller von Kraftfahrzeugen stellt sich damit in der Entwicklung von Kraftfahrzeugen die Herausforderung, bereits frühzeitig im Entwicklungsprozess eines neuen Kraftfahrzeugs absehen zu müssen, ob die Emissionen dieses Kraftfahrzeugs in jedem zulässigen Fahrzyklus innerhalb der gesetzlich vorgeschriebenen Grenzen bleibt, oder nicht.

[0006] Es ist daher wesentlich, Verfahren und Vorrichtungen bereitzustellen, die bereits im Entwicklungsstadium eines Kraftfahrzeugs die voraussichtlichen Emissionen des Kraftfahrzeugs sicher vorhersagen kann, um im Falle eines voraussichtlichen Überschreitens von Grenzwerten Änderungen am Kraftfahrzeug durchführen zu können. Eine derartige Abschätzung allein auf Basis von Messungen auf einem Prüfstand bzw. in einem fahrenden Kraftfahrzeug ist wegen der großen Vielfalt denkbarer Fahrzyklen überaus aufwändig.

[0007] Im Stand der Technik wird daher zum Beispiel vorgeschlagen, sogenannte Leitzyklen zu bestimmen, für die eine Erfüllung von Emissionsvorgaben besonders herausfordernd ist. Dabei wird davon ausgegangen, dass mutmaßlich für alle denkbaren Fahrzyklen die Emissionsvorgaben erfüllt sein werden, wenn dies für die herausforderndsten Zyklen der Fall ist.

[0008] Neben der Anforderung, in jedem denkbaren bzw. zulässigen Fahrzyklus Abgasvorschriften erfüllen zu müssen, ist es allerdings ein bedeutendes Ziel einer Fahrzeug- bzw. Antriebsentwicklung, die Gesamtemissionen eines Fahrzeug-Antrieb-Systems im Realbetrieb zu minimieren. Bei einer Anpassung bzw. Optimierung eines Fahrzeug-Antrieb-Systems auf die kritischsten bzw. besonders kritische Fahrzyklen kann zwar möglicherweise eine Erfüllung von Normen in allen Zyklen gewährleistet werden, es besteht dadurch aber die Gefahr einer deutlichen Verschlechterung der Emissionen in weniger kritischen Zyklen. Sind dann noch die weniger kritischen Zyklen im realen Fahrbetrieb die häufigeren Zyklen, was häufig der Fall ist, verschlechtert sich durch eine solche Optimierung das Gesamtsystem bezüglich Emissionen im Realbetrieb. Beispielsweise kann eine Optimierung der Emissionen auf einen kritischen, aber in der Realität sehr seltenen Fahrzyklus mit einem extremen Geschwindigkeitsprofil (z.B. extreme Bergfahrt mit starken Beschleunigungen) dazu führen, dass diese sich für weniger kritische, aber dafür viel häufigere Fahrzyklen mit gewöhnlichem Geschwindigkeitsprofil (z.B. kurze Stadtfahrt mit Ampeln) verschlechtern, was insgesamt zu höheren Emissionen in Realbetrieb führen kann.

[0009] Es ist daher für die Entwicklung emissionsoptimierter Fahrzeuge mit Verbrennungsmotoren von großem Vorteil, eine große Anzahl realistischer Geschwindigkeitsprofile automatisch generieren zu können, deren Verteilung der generierten Geschwindigkeitsprofile einer real zu erwartenden Verteilung entspricht oder diese approximiert. Ziel sind somit generierte Geschwindigkeitsprofile mit einer für den Realbetrieb repräsentativen Verteilung.

[0010] Neben der Entwicklung von emissionsarmen Antriebssystemen bzw. einer emissionsoptimierten Applikation solcher Antriebssysteme können solche generierten Geschwindigkeitsprofile vorteilhafterweise auch bei einem prädiktiven Fahren verwendet werden, z.B. im Batteriemanagement eines Elektrofahrzeugs oder E-Bikes, dem Antriebsmanagement eines Hybridfahrzeugs, dem Regenerationsmanagement von Abgaskomponenten eines Fahrzeugs mit Verbrennungsmotors. Auch für die Ermittlung von Lastkollektiven und Belastungsszenarien zur Spezifikation von Bauteilen können derart generierte Geschwindigkeitsprofile einen wertvollen Beitrag leisten, z.B. welche Belastung erfährt ein bestimmtes Bauteil, wie bspw. eine Pumpe über seine Lebenszeit.

[0011] Somit stellt die computergestützte Generierung von Geschwindigkeitsprofilen in für den Realbetrieb repräsentativer Verteilung eine wichtige technische Aufgabe dar, welche in verschiedenen Szenarien die Entwicklung oder Optimierung eines Fahrzeugs entscheidend verbessern kann und damit zu emissionsärmeren und effizienteren Fahrzeugen, insbesondere zu emissionsärmeren und effizienteren Antriebssystemen von Fahrzeugen beitragen.

[0012] Vorgestellt wird somit in einem ersten Aspekt ein computerimplementiertes Verfahren zum Trainieren eines maschinellen Lernsystems zum Generieren von Fahrverläufen eines Fahrzeugs.

[0013] Fahrverläufe bezeichnen dabei Verläufe von Fahreigenschaften eines Fahrzeugs, wobei die Fahreigenschaften mit Sensoren messbare, insbesondere physikalische oder technische Eigenschaften des Antriebsstrangs des Fahrzeugs sind, welche die Fortbewegung eines Fahrzeugs charakterisieren. Als bedeutendste Variante fallen unter die Fahrverläufe Geschwindigkeitsverläufe des Fahrzeugs. Der Geschwindigkeitsverlauf eines Fahrzeugs ist für eine bestimmte Fahrt eine oder die Leitgröße zur Bestimmung von Emissionen, Verbrauch, Verschleiß und vergleichbaren Größen. Ein Geschwindigkeitsverlauf kann dabei durch Geschwindigkeitswerte, aber auch durch daraus ableitbare Größen wie Beschleunigungswerte bestimmt sein. Andere wesentliche Fahreigenschaften, deren Verläufe für Anwendungen wie der Bestimmung von Emissionen, Verbrauch oder Verschleiß wesentlich sind, umfassen insbesondere eine Stellung des Fahrpedals oder eine Getriebeübersetzung.

[0014] Das Trainingsverfahren hat dabei die Schritte:
  • aus einer ersten Datenbank mit Fahrtrouten werden erste Fahrtrouten ausgewählt,
  • ein Generator des maschinellen Lernsystems erhält die ersten Fahrtrouten als Eingangsgrößen und generiert zu den ersten Fahrtrouten jeweils zugehörige erste Fahrverläufe,
  • in einer zweiten Datenbank sind Fahrtrouten und jeweils zugehörige, im Fahrbetrieb erfasste Fahrverläufe abgespeichert,
  • aus der zweiten Datenbank werden zweite Fahrtrouten sowie jeweils zugehörige zweite, im Fahrbetrieb erfasste Fahrverläufe ausgewählt,
  • ein Diskriminator des maschinellen Lernsystems erhält als Eingangsgrößen Paare aus einer der ersten Fahrtrouten mit jeweils zugehörigem ersten, generierten Fahrverlauf und Paare aus zweiten Fahrtrouten mit jeweils zugehörigem zweiten, im Fahrbetrieb erfassten Fahrverlauf,
  • der Diskriminator berechnet abhängig von den Eingangsgrößen Ausgaben, welche für jedes als Eingangsgrößen erhaltene Paar charakterisieren bzw. abbilden oder quantifizieren, ob es sich um ein Paar mit einem ersten, generierten Fahrverlauf oder um ein Paar mit einem zweiten, im Fahrbetrieb erfassten Fahrverlauf handelt,
  • abhängig von den Ausgaben des Diskriminators wird eine Zielfunktion berechnet, insbesondere optimiert, welche eine Distanz oder eine Divergenz zwischen der Verteilung der Paare mit ersten, generierten Fahrverläufen und der Verteilung der Paare mit zweiten, im Fahrbetrieb erfassten Fahrverläufen darstellt bzw. abbildet oder quantifiziert.


[0015] Die erste Datenbank und die zweite Datenbank können dabei als eine (gemeinsame) Datenbank realisiert sein.

[0016] Vorzugsweise werden abhängig von der Optimierung der Zielfunktion Parameter des maschinellen Lernsystems derart angepasst, dass
  1. a. der Diskriminator darauf optimiert wird, zwischen den ersten, generierten Fahrverläufen und den zweiten, im Fahrbetrieb erfassten Fahrverläufen zu unterscheiden,
  2. b. der Generator darauf optimiert wird, erste, generierte Fahrverläufe in einer ersten Verteilung zu generieren, welche durch den Diskriminator möglichst schwer von zweiten, im Fahrbetrieb erfassten Fahrverläufen zu unterscheiden sind, welche in einer zweiten Verteilung vorliegen.
In einer bevorzugten Ausgestaltung werden die Parameter des maschinellen Lernsystems abhängig von einem Gradienten der Zielfunktion angepasst.

[0017] Die vorgestellten Trainingsverfahren stellen ein computerimplementiertes maschinelles Lernsystem zur Verfügung, mit welchem repräsentative Fahrverläufe generiert werden können, wodurch wiederum Maßnahmen wie eine Emissionsoptimierung bzw. eine Validierung eines Systems bezüglich Emissionen unter Berücksichtigung der tatsächlichen, repräsentativen Auswirkungen erfolgen können.

[0018] Die Zielfunktion ist vorzugsweise als eine statische Distanz wie z.B. eine Jenson-Shannon-Distanz implementiert. Bevorzugt wird die Zielfunktion als Wasserstein-Metrik implementiert, insbesondere eine Wasserstein-Distanz zwischen einer ersten Verteilung der ersten Fahrverläufe und einer zweiten Verteilung der zweiten Fahrverläufe. Vorteilhafterweise spiegelt somit die Verteilung der generierten Daten die volle Varianz der Verteilung der gemessenen Daten wider, ein sogenannter Mode Collapse wird verhindert. Zudem werden ein stabileres und effizienteres Training und bessere Konvergenz ermöglicht, da diese Zielfunktion verschwindende Gradienten (vanishing gradients) verhindert. Die Zielfunktion ist robust gegenüber zu vielen Optimierungsschritten beim Diskriminator. Um den Einsatz einer Wassersteinmetrik als Zielfunktion zu optimieren, wird in bevorzugten Ausgestaltungen vorgeschlagen, die Zielfunktion um einen Reglementierer zu erweitern oder ein weight clipping durchzuführen.

[0019] In einer bevorzugten Ausgestaltung sind Routeneigenschaften der ersten Fahrtrouten zumindest in Teilen von einem maschinellen Lernsystem, insbesondere einem Neuronalen Netz, generiert. Hierdurch wird es möglich eine sehr große Anzahl an Fahrverläufen zu einer Vielzahl von automatisch generierten Routen bzw. Routeneigenschaften zu generieren. Die derart generierten Routen bzw. Routeneigenschaften unterliegen weniger Beschränkungen als tatsächlich gemessene Routen. Zudem ist es aufwendig und technisch herausfordernd Routendaten mit einer Vielzahl vollständiger Routeneigenschaften zu erfassen.

[0020] Ergänzend zu den ersten Fahrtrouten und den zweiten Fahrtrouten können die Eingangsgrößen des Generators und des Diskriminators jeweils zusätzliche Informationen umfassen, insbesondere Fahrereigenschaften und / oder Fahrzeugeigenschaften. Durch solche, insbesondere auch nicht diskretisierte, Zusatzinformationen können die Fahrverläufe auch auf weitere Größen konditioniert werden, beispielsweise eine Motorisierung des Fahrzeugs oder eine Erfahrung des Fahrers, was genauere Anpassungen und Schlussfolgerungen abhängig von den generierten Fahrverläufen ermöglicht.

[0021] In einer vorteilhaften Ausgestaltung erhält der Generator als weitere Eingangsgrößen Zufallsgrößen von einem Zufallsgenerator und generiert die zu den ersten Fahrtrouten jeweils zugehörigen ersten Fahrverläufe abhängig von den ersten Fahrtrouten und den Zufallsgrößen. Dies verbessert die Effizienz des Trainingsverfahrens. Die Zufallsgrößen können dabei zum einen entweder als globale Zufallsvektoren oder als temporäre oder lokale Zufallsvektoren implementiert werden. Alternativ können die Zufallsgrößen auch als eine Kombination von globalen und von temporären oder lokalen Zufallsvektoren implementiert werden. Die Kombination von globalem und temporärem / lokalem Zufallsvektor stellt sich als besonders vorteilhaft heraus, da somit Varianzen in den Daten sowohl auf Grund von globalen, wie auch von lokalen bzw. temporären Einflüssen abgebildet werden können.

[0022] In bevorzugten Ausgestaltungen sind der Generator und / oder der Diskriminator jeweils als neuronales Netz, insbesondere als rekurrentes neuronales Netz implementiert. Hierdurch können auch Fahrverläufe beliebiger Länge generiert oder bewertet werden, wobei die Übergänge zwischen Abschnitten der Fahrverläufe stets konsistent mit dem gelernten Übergangsmodell sind. Das rekurrente neuronales Netz kann dabei insbesondere als long short-term memory (LSTM) neural network oder gated recurrent units (GRU) implementiert werden.

[0023] In bevorzugten Ausgestaltungen wird es vorteilhafterweise auch möglich, sogenannte vorausschauendes Fahren zu berücksichtigen. Dabei wird berücksichtigt, dass sich die Geschwindigkeit eines Fahrzeugs durch Fahrerverhalten oder auch durch automatische Fahrzeugeingriffe bereits auf zukünftige bzw. nachfolgende Routeneigenschaften anpassen kann, beispielsweise durch eine bereits sichtbare Ampel, eine bekannte folgende Geschwindigkeitsbegrenzung etc. Hierzu kann der Generator in einer bevorzugten Ausgestaltung als bidirektionales rekurrentes neuronales Netz implementiert werden. Auch können zur Generierung der Fahrverläufe durch den Generator Routeneigenschaften der ersten Fahrtrouten in einem bestimmten Diskretisierungsschritt, insbesondere einem bestimmten Zeitpunkt oder einer bestimmten Streckendistanz, durch Routeneigenschaften eines folgenden Diskretisierungsschritts, insbesondere eines folgenden Zeitpunkts oder einer folgenden Streckendistanz, oder mehrerer folgenden Schritte ergänzt oder erweitert werden.

[0024] In weiteren vorgestellten Aspekten können die mit den vorgestellten Trainingsverfahren angelernten Elemente des maschinellen Lernsystems als computerimplementierte Systeme eingesetzt werden, um Fahrverläufe zu generieren (Generator) oder zu bewerten (Diskriminator).

[0025] Insbesondere kann abhängig von derart generierten Fahrverläufen eine Ermittlung von routenspezifischen Emissionen eines Antriebssystems eines Fahrzeugs erfolgen, beispielsweise in einer Simulation, in welcher ein Modell des Antriebssystems berechnet wird. Ein solches Modell kann dabei Teilmodelle umfassen, welche einen Motor und ein Abgasnachbehandlungssystem des Antriebssystems beschreiben.

[0026] Mit abhängig von derart generierten Fahrverläufen ermittelten routenspezifischen Emissionen eines Antriebssystems eines Fahrzeugs kann dann wiederum eine Validierung oder Anpassung des Antriebssystems erfolgen, insbesondere eine emissionsminimierende Anpassung.

[0027] Wie bereits beschrieben kann hierbei durch die repräsentative Verteilung der generierten Fahrverläufe eine Anpassung erfolgen, welche das Antriebssystem bezüglich Emissionen nicht auf einzelne oder besonders kritische Fahrverläufe optimiert. Vielmehr wird eine Optimierung des Antriebssystems derart ermöglicht, dass die im Realbetrieb zu erwartenden Emissionen insgesamt minimiert werden.

[0028] Die Optimierung kann dabei durch eine Anpassung von Komponenten oder Parametern in der Entwicklung des Antriebssystems, durch eine Anpassung von Daten in einer Applikation des Antriebssystems oder durch eine Anpassung von Steuergrößen im Betrieb des Antriebssystems im Fahrzeug erfolgen.

[0029] Zur Durchführung der beschriebenen, computerimplementierten Verfahren können Computerprogramme eingerichtet sein und auf maschinenlesbaren Speichern abgelegt werden. Ein computerimplementiertes Lernsystem umfassend einen solchen maschinenlesbaren Speicher kann dazu eingerichtet sein, die Verfahren durchzuführen, wobei die durchzuführenden Berechnungen durch einen oder mehrere Prozessoren des computerimplementierten Lernsystems ausgeführt werden.

Beschreibung der Ausführungsbeispiele



[0030] Figur 1 zeigt beispielhaft ein computerimplementiertes Trainingsverfahren für ein maschinelles Lernsystem.

[0031] In einer Datenbank 1 sind Fahrtrouten bzw. Routen von Fahrzeugen abgelegt. Eine beispielhafte Route in Datenbank 1 ist in Fig. 1 mit 11 bezeichnet. In einer Datenbank 2 sind Fahrtrouten bzw. Routen von Fahrzeugen gemeinsam mit jeweils einem zugehörigen Fahrverlauf abgelegt. Eine beispielhaftes Paar aus Route und zugehörigem Fahrverlauf in der Datenbank 2 ist in Fig. 1 mit 21 bezeichnet. Die Fahrverläufe in Datenbank 2 entsprechen dabei im Fahrbetrieb des Fahrzeugs ermittelten oder gemessenen Fahrverläufen. D.h. die Fahrverläufe wurden vorzugsweise beim tatsächlichen Abfahren der zugehörigen Route mit einem Fahrzeug von Sensoren des Fahrzeugs erfasst und abgespeichert. Die Datenbanken 1 und 2 sind im Gesamtsystem insbesondere auf maschinenlesbaren Speichern implementiert. Dabei werden mit Datenbank lediglich auf einem maschinenlesbaren Speicher systematisch abgelegte Daten bezeichnet.

[0032] Im maschinellen Lernsystem 4 soll nun ein Generator 41 darauf trainiert werden, zu Routen der Datenbank 1 Fahrverläufe generieren. Diese Fahrverläufe sollen vorzugsweise abhängig von zufälligen Eingangsgrößen bestimmt werden, wozu in Block 3 Zufallsgrößen wie Zufallsvektoren bereitgestellt werden können. In Block 3 kann insbesondere ein Zufallsgenerator implementiert sein, wobei es sich dabei auch um einen Pseudozufallsgenerator handeln kann.

[0033] Die durch den Generator 41 generierten Fahrverläufe sollen vorzugsweise von den im Fahrbetrieb ermittelten Fahrverläufen aus der Datenbank 2 möglichst nicht oder kaum unterscheidbar sein. Hierzu wird ein Diskriminator 42 darauf trainiert, möglichst gut zwischen durch Generator 41 generierten Fahrverläufen und von Datenbank 2 gezogenen Fahrverläufen, bzw. zwischen den jeweiligen Paaren aus Fahrverläufen und Routeneigenschaften unterscheiden zu können. Das Lernsystem soll dabei nicht nur einzelne Fahrverläufe generieren, die möglichst nicht oder kaum von einzelnen im Fahrbetrieb ermittelten Fahrverläufen unterschieden werden können. Vielmehr soll auch die Verteilung der generierten Fahrverläufe im Parameterraum der Eingangsgrößen möglichst nahe an der Verteilung der im Fahrbetrieb ermittelten Fahrverläufe im Parameterraum der Eingangsgrößen liegen, also eine repräsentative Verteilung von Fahrverläufen erreicht werden.

[0034] Das Training des maschinellen Lernsystems 4 umfasst hierzu die Optimierung einer Zielfunktion 5, abhängig von welcher Parameter des Generators 41 und des Diskriminators 42 angepasst werden.

[0035] Im Folgenden soll das vorgeschlagene Training des maschinellen Lernsystems 4 anhand von Fig. 1 detaillierter beschrieben werden.

[0036] Eine Route in der Datenbank 1 ist insbesondere als Abfolge diskreter Datenpunkte gespeichert, wobei für jeden Datenpunkt bzw. jeden Diskretisierungsschritt Routeneigenschaften in diesem Diskretisierungsschritt gespeichert sind.

[0037] Eine Route r in der Datenbank 1 weist beispielsweise eine Länge N auf: r = (r1, ..., rN). Jeder Datenpunkt rt entspricht einem Diskretisierungsschritt. Besonders bevorzugt sind Realisierungen, in denen die Diskretisierungsschritte einer zeitlichen oder räumlichen Diskretisierung entsprechen. Bei der zeitlichen Diskretisierung entsprechen die Datenpunkte jeweils einer verstrichenen Zeit seit Beginn der Route und damit die Abfolge der Datenpunkt einem zeitlichen Verlauf. Bei der räumlichen Diskretisierung entsprechen die Datenpunkte jeweils einer zurückgelegten Strecke entlang der Route.

[0038] Die Abtastrate ist in der Regel konstant. In einer zeitlichen Diskretisierung kann die Abtastrate z.B. als x Sekunden definiert werden, in einer räumlichen Diskretisierung z.B. als x Meter.

[0039] Jeder Datenpunkt rt der Route beschreibt die Routeneigenschaften an dem entsprechenden Diskretisierungsschritt, d.h. rtRD. D ist die Anzahl der Routeneigenschaften, wobei hierbei jede Dimension von mehrdimensionale Routeneigenschaften als eine Dimension einer eindimensionalen Routeneigenschaft gezählt wird.

[0040] Solche Routeneigenschaften können z.B. sein, jeweils bezogen auf den Diskretisierungsschritt, insbesondere den Zeitpunkt bzw. Zeitabstand oder den Ort bzw. die Strecke oder Entfernung:
  • Geografische Eigenschaften wie absolute Höhe oder Steigung
  • Eigenschaften des Verkehrsflusses wie zeitabhängige Durchschnittsgeschwindigkeit des Verkehrs
  • Fahrbahneigenschaften wie Anzahl der Fahrspuren, Fahrbahntyp oder Fahrbahnkrümmung
  • Eigenschaften der Verkehrsführung wie Geschwindigkeitsbeschränkungen, Anzahl der Ampeln oder Anzahl bestimmter Verkehrsschilder, insbesondere Stopp oder Vorfahrt gewähren oder Fußgängerüberwege
  • Wettereigenschaften wie Regenmenge zum vorgegebenen Zeitpunkt, Windgeschwindigkeit, Existenz von Nebel


[0041] Eine Route aus Datenbank 1 wird ausgewählt und in Schritt 13 an Generator 41 übermittelt.

[0042] Zusätzlich wird vorzugsweise in Block 3 ein Zufallsvektor ermittelt und dieser in Schritt 31 an den Generator 41 übermittelt. Ein Zufallsvektor z wird gezogen, das heißt zufällig ermittelt. Dabei gilt insbesondere zRL, wobei L optional von der Länge der Route N abhängen kann. Die Verteilung, aus der z gezogen wird, ist vorzugsweise festgesetzt auf eine einfache Verteilungsfamilie, z.B. Gauß-Verteilung oder Gleichverteilung.

[0043] Die Eingangsgrößen des Generators 41 setzt sich nunmehr vorzugsweise aus den Variablen Zufallsvektor z und Route r zusammen. Anders als durch einen rein zufällig generierten Eingang in den Generator 41 können somit die generierten Fahrverläufe auf bestimmte Routeneigenschaften konditioniert werden. Beispielsweise können durch Sampeln verschiedener z unterschiedliche Fahrverläufe für dieselbe vorgegebene Route r generiert werden. Die Routeneigenschaften der Routen r in Datenbank 1 können dabei tatsächlich gemessene Routeneigenschaften sein, von Experten definierte Routeneigenschaften oder von einem maschinellen Lernsystem, z.B. ein neuronales Netz, gelernte Routeneigenschaften. Es können auch Routen mit aus zwei oder drei dieser Varianten erstellten Routeneigenschaften in Datenbank 1 bereitgestellt werden.

[0044] In einem beispielhaften Anwendungsfall, in welchem die generierten Fahrverläufe zum Bestimmen von Emissionseigenschaften eines Antriebssystems eines Fahrzeugs eingesetzt werden, kann beispielsweise durch gezieltes Ändern einiger Routeneigenschaften, Generierung passender Fahrverläufe und Simulation der Emissionen für diese Profile gezielt untersucht werden, in welchem Maße bestimmte Routeneigenschaften Einfluss auf die Emissionsentstehung im Verbrennungsprozess haben. Dies erlaubt beispielsweise eine gezielte Optimierung der Parameter des Antriebssystems für bestimmte, z.B. für besonders fordernde Routenprofile, insbesondere von Parametern einer Steuerung des Antriebssystems, z.B. in einem Steuergerät.

[0045] Generator 41 generiert nun abhängig von den Eingangsgrößen Zufallsvektor (Schritt 31) und ausgewählter Route (Schritt 13) einen Fahrverlauf. Der Generator 42 verfügt hierzu über einen computerimplementierten Algorithmus, mit welchem ein generatives Modell umgesetzt ist und den Fahrverlauf ausgibt (Schritt 43).

[0046] Ein solcher durch den Generator 41 generierter Fahrverlauf kann beispielsweise als x =(x1,...,xN) ausgegeben werden und somit die gleiche Länge N wie die Route aufweisen, auf die er konditioniert wurde. Alternativ können aber beispielsweise auch die Routeneigenschaften diskretisiert über den Ort vorliegen, die generierten Geschwindigkeiten allerdings diskretisiert über die Zeit. Hierzu können nach jedem einzelnen Schritt vom vorherigen Ort über die generierte Geschwindigkeit der nächste Diskretisierungszeitpunkt berechnet werden und dann die Routeneigenschaften an diesem Ort als input für x{t+1} verwendet werden.

[0047] Konditioniert ist der Fahrverlauf auf die ausgewählte und dem Generator übermittelte Route aus Datenbank 1. Die Varianz der möglichen Fahrverläufe für ein und dieselbe Route wird über die Zufallsverteilung von z abgebildet. Das generative Modell ist parametrisiert über die Parameter θG. Die Architektur des Generativen Modells kann beispielsweise ein rekurrentes Neuronales Netz sein. Die Computerimplementierung des Generators erfolgt durch Ablage des Algorithmus, welcher das generative Modell umsetzt, sowie der Parameter des Modells in einem maschinenlesbaren Speicher, durch ein Abarbeiten der Berechnungsschritte des Algorithmus durch einen Prozessor sowie ein Speichern der generierten Fahrverläufe in einem maschinenlesbaren Speicher.

[0048] In einer möglichen Ausgestaltung können die Fahrverläufe mit
einer fixen Länge generiert werden, d.h. mit einer festgelegten Zahl an Diskretisierungsschritten bzw. Datenpunkten. Bei Generierung längerer Fahrverläufe müssten dann mehrere generierte, kurze Zeitreihen aneinander gehängt werden. Die Übergänge wären dabei jedoch in der Regel nicht konsistent. In einer alternativen Ausgestaltung kann das Verfahren derart erweitert werden, dass auch Fahrverläufe beliebiger Länge generiert oder bewertet werden können und die Übergänge stets konsistent mit dem gelernten Übergangsmodell sind. Hierzu werden vorzugsweise sowohl das der Generator, als auch der Diskriminator als rekurrentes neuronales Netz implementiert, beispielsweise als long short-term memory (LSTM) neural network oder gated recurrent units (GRU). Architektonisch ist der Generator vorzugsweise als Sequenz-zu-Sequenz-Modell ausgeführt, kann aber auch als ein Vektor-zu-Sequenz-Modell implementiert werden. Der Diskriminator ist vorzugsweise als Sequenz-zu-Skalar-Modell ausgeführt, kann aber auch als ein Sequenz-zu-Sequenz Modell implementiert werden.

[0049] Für die Architektur des generativen Modells als rekurrentes neuronales Netz ergeben sich verschiedene Optionen.

[0050] Beispielsweise kann ein globaler Zufallsvektors z für den kompletten Fahrverlauf gesampelt werden, wobei sich die Bezeichnung global wiederum auf eine zeitliche oder räumliche Diskretisierung beziehen kann. In dieser Ausgestaltung werden im latenten Raum Eigenschaften berücksichtigt bzw. gelernt, welche den Fahrverlauf global verändern, beispielsweise über die Route konstante Eigenschaften wie konstante Fahrereigenschaften (z.B. Alter oder Erfahrung), konstante Wettereigenschaften (z.B. Dauerregen) oder konstante Fahrzeugeigenschaften (z.B. Motorisierung). Dieser Zufallsvektor kann nun entweder zur Initialisierung des versteckten Zustands (hidden states) im ersten Zeitschritt verwendet werden oder/und dem rekurrenten neuronalen Netz in jedem Zeitschritt zugeführt werden.

[0051] Es können auch lokale bzw. temporäre Zufallsvektoren z gesampelt werden, d.h. im latenten Raum werden Eigenschaften berücksichtigt bzw. gelernt, welche den Fahrverlauf lokal bzw. temporär verändern, beispielsweise kurzfristige Eigenschaften wie kurzfristige Verkehrsführungs- oder Verkehrsflusseigenschaften (Zustände von Ampeln, Rückstau Kreuzung, Fußgänger auf der Fahrbahn). Ein Zufallsvektor wird dabei im Abstand von M Zeitschritten neu generiert und dem rekurrenten neuronalen Netz zugeführt, wobei M>0. M kann auch stochastisch sein, d.h. der Zufallsvektor kann auch in zufälligen Abständen geändert werden.

[0052] In einer bevorzugten Ausgestaltung kann auch eine Kombination von globalem und lokalen bzw. temporären Zufallsvektoren implementiert werden. Einige Dimensionen des Zufallsvektors werden dabei nur einmal pro Fahrverlauf gesampelt, die restlichen Dimensionen ändern sich alle M Zeitschritte. Alternativ kann hierzu auch ein globaler Zufallsvektor dem rekurrenten neuronalen Netz grundsätzlich in jedem Zeitschritt zugeführt werden, wobei er alle M Zeitschritte durch einen lokalen (d.h. neu gesampelten) Zufallsvektor ersetzt wird.

[0053] Die Kombination von globalem und lokalem Zufallsvektor stellt sich als besonders vorteilhaft heraus, da somit Varianzen in den Daten sowohl auf Grund von globalen, wie auch von lokalen bzw. temporären Einflüssen abgebildet werden können.

[0054] Vorzugsweise kann in dem generativen Modell auch vorausschauendes bzw. prädiktives Fahren berücksichtigt werden.

[0055] So können in einer möglichen Ausgestaltung bei der Berechnung durch den Generator 41 die Routeneigenschaften rt zum Zeitpunkt t wahlweise durch Routeneigenschaften rt+1, ..., rt+m erweitert bzw. ergänzt werden. Dieser Ausgestaltung ist besonders vorteilhaft bei Online-Berechnungen, d.h. bei limitierten Rechenressourcen, oder falls der Einfluss späterer Routeneigenschaften auf wenige Diskretisierungsschritte beschränkt werden kann oder soll.

[0056] Alternativ kann ein bidirektionales rekurrentes Neuronales Netz als generatives Modell eingesetzt werden, in welchem ein versteckter Zustand (hidden state) zukünftiger Zellen des rekurrenten Neuronalen Netzes zusätzlich berücksichtigt wird. Hierdurch können explizit alle möglichen zukünftigen Zeitschritte mit einbezogen werden.

[0057] Statt also die Generierung einer Geschwindigkeit zum Zeitpunkt t lediglich auf die Routeneigenschaften zum aktuellen Zeitpunkt t (sowie gegebenenfalls auf einen hidden state von Zeitpunkt t-1) zu konditionieren, können auch zukünftige Routeneigenschaften für die Generierung der Geschwindigkeit zum Zeitpunkt t mit einbezogen werden. Die Generierung der Geschwindigkeit zum Zeitpunkt t wird somit neben den Routeneigenschaften zum Zeitpunkt t auch auf Routeneigenschaften der Zeitpunkte t+1, t+2, ..., t+m (oder ein Subset davon) konditioniert. Hiermit wird ermöglicht, sogenanntes "vorausschauendes Fahren" zu simulieren, beispielsweise die vorzeitige Reaktion eines Fahrers, vor allem im Sinne einer Geschwindigkeitsanpassung, auf eine in der Distanz bereits sichtbare Routeneigenschaft (z.B. Ampel, Geschwindigkeitslimitierung, Autobahnausfahrt etc.). Zudem wird ermöglicht, dass der Algorithmus lernen kann, am Ende einer Route zu Geschwindigkeit 0 zurückzukehren, beispielsweise indem am Ende einer Route nur noch Default-Werte wie z.B. 0 für zukünftige Routeneigenschaften vorliegen.

[0058] Eine Route in der Datenbank 2 ist insbesondere als Abfolge diskreter Datenpunkte gespeichert, wobei für jeden Datenpunkt bzw. jeden Diskretisierungsschritt Routeneigenschaften in diesem Diskretisierungsschritt gespeichert sind.

[0059] Eine Route r in der Datenbank 2 weist beispielsweise eine Länge S auf: r = (r1,...,rS). Jeder Datenpunkt rt entspricht einem Diskretisierungsschritt. Besonders bevorzugt sind Realisierungen, in denen die Diskretisierungsschritte einer zeitlichen oder räumlichen Diskretisierung entsprechen. Bei der zeitlichen Diskretisierung entsprechen die Datenpunkte jeweils einer verstrichenen Zeit seit Beginn der Route und damit die Abfolge der Datenpunkt einem zeitlichen Verlauf. Bei der räumlichen Diskretisierung entsprechen die Datenpunkte jeweils einer zurückgelegten Strecke entlang der Route.

[0060] Die Abtastrate ist in der Regel konstant. In einer zeitlichen Diskretisierung kann die Abtastrate z.B. als x Sekunden definiert werden, in einer räumlichen Diskretisierung z.B. als x Meter.

[0061] Jeder Datenpunkt rt der Route beschreibt die Routeneigenschaften an dem entsprechenden Diskretisierungsschritt, d.h. rtRD. D ist die Anzahl der Routeneigenschaften, wobei hierbei jede Dimension von mehrdimensionale Routeneigenschaften als eine Dimension einer eindimensionalen Routeneigenschaft gezählt wird.

[0062] Solche Routeneigenschaften können z.B. sein, jeweils bezogen auf den Diskretisierungsschritt, insbesondere den Zeitpunkt bzw. Zeitabstand oder den Ort bzw. die Strecke oder Entfernung:
  • Geografische Eigenschaften wie absolute Höhe oder Steigung
  • Eigenschaften des Verkehrsflusses wie Verkehrsdichte oder zeitabhängige Durchschnittsgeschwindigkeit des Verkehrs
  • Fahrbahneigenschaften wie Anzahl der Fahrspuren, Fahrbahntyp oder Fahrbahnkrümmung
  • Eigenschaften der Verkehrsführung wie Geschwindigkeitsbeschränkungen, Anzahl der Ampeln oder Anzahl bestimmter Verkehrsschilder, insbesondere Stopp oder Vorfahrt gewähren oder Fußgängerübergänge
  • Wettereigenschaften wie Regenmenge zum vorgegebenen Zeitpunkt, Windgeschwindigkeit, Existenz von Nebel


[0063] Dabei handelt es sich vorzugsweise um die gleichen Arten von Routeneigenschaften, welche zu den Routen in der ersten Datenbank gespeichert sind.

[0064] In der Datenbank 2 sind die derart bestimmten Routen jeweils gemeinsam mit einem der Route zugehörigen, im Fahrbetrieb tatsächlich gemessenen Fahrverlauf abgelegt. Diese Paare aus Route und zugehörigem Fahrverlauf dienen dem maschinellen Lernsystem als Trainingsdaten. Zu diesem Training werden insbesondere Paare aus Route und zugehörigem Fahrverlauf ausgewählt und in den Schritten 23 und 24 dem Diskriminator 42 übermittelt. Zudem werden dem Diskriminator 42 in den Schritten 14 bzw. 43 auch Paare bestehend aus einer Route der Datenbank 1 und einem abhängig von dieser Route durch Generator 41 generierten Fahrverlauf übermittelt.

[0065] Der Diskriminator 42 verfügt über einen computerimplementierten Algorithmus, mit welchem ein diskriminatives Modell umgesetzt wird. Als Eingangsgrößen erhält der Diskriminator 42 ein Paar bestehend aus Route und zugehörigem Fahrverlauf und entscheidet, ob das gesehene Paar einen (durch Generator 41) generierten oder einen (aus Datenbank 2 erhaltenes) tatsächlich gemessenen Fahrverlauf beinhaltet. Das Ergebnis dieser Entscheidung wird in Schritt 44 ausgegeben. Z.B. kann der Diskriminator 42 einen Wert >0 für die Entscheidung "echter Fahrverlauf" und <0 für die Entscheidung "generierter Fahrverlauf" ausgeben. Alternativ können beispielsweise auch vorher festgelegte Werte wie Klassenlabels ausgegeben werden. Das diskriminative Modell ist parametrisiert über die Parameter θD. Die Ausgabe 44 der Entscheidung beinhaltet insbesondere eine Wertung über die binäre Entscheidung "ja"/"nein" hinaus.

[0066] Die Computerimplementierung des Diskriminators erfolgt durch Ablage des Algorithmus, welcher das diskriminative Modell umsetzt, sowie der Parameter des Modells in einem maschinenlesbaren Speicher, durch ein Abarbeiten der Berechnungsschritte des Algorithmus durch einen Prozessor sowie ein Speichern der Ausgabe in einem maschinenlesbaren Speicher.

[0067] Der Diskriminator 42 kann beispielsweise als rekurrentes Neuronales Netz implementiert sein. Damit können insbesondere Fahrverläufe beliebiger Länge bewertet werden.

[0068] Für die Bewertung (Entscheidung generierte Fahrverläufe versus im Fahrbetrieb ermittelte Fahrverläufe Trajektorie) gibt es mehrere Ausgestaltungen. Die Bewertung kann insbesondere nach jedem einzelnen Zeitschritt neu abgegeben werden. Die globale Bewertung des Fahrverlaufs ist dann z.B. der Durchschnitt der Einzelbewertungen oder die Mehrheitsentscheidung. Alternativ kann die Bewertung des gesamten Fahrverlaufs auch nur zum letzten Zeitschritt abgegeben werden. Letztere Ausgestaltung spart insbesondere zusätzliche Berechnungsschritte und hat den weiteren Vorteil, dass der komplette Fahrverlauf gleichermaßen in die Bewertung einfließt.

[0069] Abhängig von der Ausgabe 44 des Diskriminators 42, wird in Block 5 eine Zielfunktion optimiert, insbesondere eine Verlustfunktion minimiert. Hierzu sind die Eingangsgrößen des Diskriminators insbesondere als echte Samples (d.h. Paare mit im Fahrbetrieb bestimmten Fahrverläufen) bzw. als generierte Samples (d.h. Paare mit durch den Generator 41 generierten Fahrverläufen) gelabelt. Die Zielfunktion charakterisiert dabei, inwieweit die generierten Fahrverläufe tatsächlich gemessenen Fahrverläufen entsprechen bzw. inwieweit die Verteilung der generierten Fahrverläufe im Parameterraum der Verteilung der gemessenen Fahrverläufe im Parameterraum entspricht. Abhängig von der Anpassung der Zielfunktion werden die Parameter θG des Generators 41 bzw. des dort umgesetzten generativen Modells sowie die Parameter θD des Diskriminators 42 bzw. des dort umgesetzten diskriminativen Modells angepasst. Die Parameter werden dabei insbesondere bezüglich des Gradienten der Zielfunktion angepasst.

[0070] Die Zielfunktion ist derart gewählt, dass sie einen Unterschied bzw. eine Distanz zwischen der Verteilung der generierten Fahrverläufe und der Verteilung der im Fahrbetrieb ermittelten Fahrverläufe bzw. einen Unterschied bzw. eine Distanz zwischen der Verteilung der Routen-Fahrverlauf-Paare mit generierten Fahrverläufen und der Verteilung der Routen-Fahrverlauf-Paare mit im Fahrbetrieb ermittelten Fahrverläufen charakterisiert bzw. darstellt. Durch die Wahl einer derartigen Zielfunktion kann das maschinelle Lernsystem derart trainiert werden, dass die Verteilung der generierten Daten die volle Varianz der Verteilung der gemessenen Daten widerspiegelt. Ein sogenannter Mode Collapse wird verhindert. Das heißt, es wird eine repräsentative Verteilung der Fahrverläufe bereitgestellt. Die Zielfunktion berücksichtigt dabei insbesondere auch die Varianz der unbeobachtbaren Einflüsse.

[0071] Vorzugsweise wird hierzu als Zielfunktion eine Verlustfunktion (loss) gewählt, welche als Wasserstein-Metrik bzw. Wasserstein-Distanz zwischen den Verteilungen implementiert ist.

[0072] In dieser Ausgestaltung des computerimplementierten Trainings sollte der Diskriminator vorzugsweise auf Lipschitzbeschränkte Funktionen beschränkt werden. In einer bevorzugten Ausgestaltung wird die Zielfunktion hierzu um Regularisiererterme erweitert, beispielsweise eine Gradientenbestrafung (Gradient penalty) oder eine Zentrierung (i) der Gradienten der echten Samples (das heißt der Paare mit im Fahrbetrieb bestimmten Fahrverläufen) auf 0 oder (ii) der Gradienten von generierten Samples (das heißt der Paare mit generierten Fahrverläufen) auf 0 oder (iii) der Gradienten von
Samples, die das Mittel aus echten und generierten Samples darstellen, auf 1. Besonders bevorzugt wird dabei die Option "Gradient von echten Samples auf 0 zentrieren", da diese sich als die schnellste der Optionen herausgestellt hat und zu einer besonders schnellen Konvergenz des Optimierungsproblems führt. Alternativ kann ein weight clipping nach jedem Gradientenschritt erfolgen.

[0073] Die vorstehend beschriebenen Verfahren zum computerimplementierten Training des gesamten Lernsystems inklusive Generator 41 und Diskriminator 42 können als ein Min-Max-Trainingsziel beschrieben werden. Dabei maximiert der Diskriminator 42 seine korrekte Klassifikationsrate, während der Generator 41 die korrekte Klassifikationsrate minimiert, indem er möglichst Fahrverläufe generiert, welche den Diskriminator 41 fehlleiten.

[0074] Zusätzlich zu den beschriebenen Eingangsgrößen des Generators 41 können diesem auch weitere Eingangsgrößen bereitgestellt werden, beispielsweise indem sie jeweils zu jeder Fahrtroute in Datenbank 1 abgelegt sind. Beispielsweise können zu jeder Fahrtroute neben den diskretisierten Routeninformationen auch zugehörige Informationen über Fahrereigenschaften (wie Erfahrung, Alter, Aggressivität bzw. Fahrstil etc.) oder Fahrzeuginformationen (wie Leistung, Motorisierung, Art des Antriebssystems etc.) gespeichert sein. Die generierten Fahrverläufe können somit auch auf diese zusätzlichen Informationen konditioniert werden. In diesem Fall sind vorteilhafterweise für das Training des maschinellen Lernsystems 4 auch entsprechende Informationen jeweils zu den in Datenbank 2 abgelegten Fahrtrouten abgelegt. Dem Diskriminator werden sowohl zu den Routeninformationen aus Datenbank 1 (Schritt 14), als auch zu den Routeninformationen aus Datenbank 2 (Schritt 23) als Eingangsgrößen diese zusätzlichen Informationen bereitgestellt.

[0075] Ein computerimplementiertes maschinelles Lernsystem, welches mit den beschriebenen Trainingsverfahren angelernt wird, ist in der Lage, repräsentative Fahrverläufe zu Routen zu generieren. Hierzu können dem Generator des so angelernten maschinellen Lernsystems Eingangsgrößen dergleichen Art wie im Training, also insbesondere Routen, gegebenenfalls auch Zufallsgrößen und weitere Informationen, zugeführt werden und dieser generiert zugehörige Fahrverläufe. Derart generierte Fahrverläufe können zur Simulation von Emissionen eines Fahrzeugs und damit beispielsweise zur probabilistischen Beurteilung zur Einhaltung von Abgasnormen und zur Emissionsoptimierung eingesetzt werden. Die Emissionsoptimierung kann beispielsweise durch eine Anpassung des Antriebssystems in der Entwicklung, durch eine Optimierung in der Datenapplikation des Antriebssystems, beispielsweise eines Steuergeräts zur Antriebssystemsteuerung, oder durch eine Anpassung von Steuergrößen des Antriebssystems im Fahrzeug zur Emissionsoptimierung erfolgen. In letzterem Fall kann die Generierung der Fahrverläufe insbesondere im Fahrzeug erfolgen.

[0076] Die Fahrverläufe können auch für eine Optimierung prädiktiven Fahrens eingesetzt werden, z.B. im Batteriemanagement eines Elektrofahrzeugs oder E-Bikes, dem Antriebsmanagement eines Hybridfahrzeugs, dem Regenerationsmanagement von Abgaskomponenten eines Fahrzeugs mit Verbrennungsmotors. Die Optimierung kann wiederum in der Entwicklung, durch Optimierung einer entsprechenden Steuergeräteapplikation oder durch Anpassung von Steuergrößen der entsprechenden Systeme im Fahrzeug erfolgen.

[0077] Auch für die Ermittlung von Lastkollektiven und Belastungsszenarien zur Spezifikation von Bauteilen können derart generierte Fahrverläufe einen wertvollen Beitrag leisten, z.B. welche Belastung erfährt ein bestimmtes Bauteil, wie bspw. eine Pumpe über seine Lebenszeit.


Ansprüche

1. Computerimplementiertes Verfahren zum Trainieren eines maschinellen Lernsystems (4) zum Generieren von Fahrverläufen, insbesondere von Geschwindigkeitsverläufen, von Verläufen von Fahrpedalstellungen oder von Verläufen einer Getriebeübersetzung, eines Fahrzeugs, gekennzeichnet durch die Schritte:

- aus einer ersten Datenbank (1) mit Fahrtrouten werden erste Fahrtrouten ausgewählt,

- ein Generator (41) des maschinellen Lernsystems (4) erhält die ersten Fahrtrouten als Eingangsgrößen und generiert zu den ersten Fahrtrouten jeweils zugehörige erste Fahrverläufe,

- in einer zweiten Datenbank (2) sind Fahrtrouten und jeweils zugehörige, im Fahrbetrieb erfasste Fahrverläufe abgespeichert,

- aus der zweiten Datenbank (2) werden zweite Fahrtrouten sowie jeweils zugehörige zweite, im Fahrbetrieb erfasste Fahrverläufe ausgewählt,

- ein Diskriminator (42) des maschinellen Lernsystems (4) erhält als Eingangsgrößen Paare aus einer der ersten Fahrtrouten mit jeweils zugehörigem ersten, generierten Fahrverlauf und Paare aus zweiten Fahrtrouten mit jeweils zugehörigem zweiten, im Fahrbetrieb erfassten Fahrverlauf,

- der Diskriminator (42) berechnet abhängig von den Eingangsgrößen Ausgaben, welche für jedes als Eingangsgrößen erhaltene Paar charakterisieren, ob es sich um ein Paar mit einem ersten, generierten Fahrverlauf oder um ein Paar mit einem zweiten, im Fahrbetrieb erfassten Fahrverlauf handelt,

- abhängig von den Ausgaben des Diskriminators (42) wird eine Zielfunktion (5) optimiert, welche eine Distanz zwischen der Verteilung der Paare mit ersten, generierten Fahrverläufen und der Verteilung der Paare mit zweiten, im Fahrbetrieb erfassten Fahrverläufen darstellt.


 
2. Verfahren nach Anspruch 1, dadurch gekennzeichnet, dass abhängig von der Optimierung der Zielfunktion (5) Parameter des maschinellen Lernsystems (4) derart angepasst werden, dass

- der Diskriminator (42) darauf optimiert wird, zwischen den ersten, generierten Fahrverläufen und den zweiten, im Fahrbetrieb erfassten Fahrverläufen zu unterscheiden,

- der Generator (41) darauf optimiert wird, erste, generierte Fahrverläufe in einer ersten Verteilung zu generieren, welche durch den Diskriminator (42) möglichst schwer von zweiten, im Fahrbetrieb erfassten Fahrverläufen zu unterscheiden sind, welche in einer zweiten Verteilung vorliegen.


 
3. Verfahren nach Anspruch 2, dadurch gekennzeichnet, dass die Parameter des maschinellen Lernsystems (4) abhängig von einem Gradienten der Zielfunktion (5) angepasst werden.
 
4. Verfahren nach einem der vorangegangenen Ansprüche, dadurch gekennzeichnet, dass als die Zielfunktion (5) eine statistische Distanz zwischen einer ersten Verteilung der ersten Fahrverläufe und einer zweiten Verteilung der zweiten Fahrverläufe, implementiert ist.
 
5. Verfahren nach Anspruch 4, dadurch gekennzeichnet, dass die Zielfunktion (5) als eine Jenson-Shannon-Distanz oder als Wasserstein-Metrik, insbesondere als eine Wasserstein-Distanz zwischen einer ersten Verteilung der ersten Fahrverläufe und einer zweiten Verteilung der zweiten Fahrverläufe, implementiert ist.
 
6. Verfahren nach Anspruch 5, dadurch gekennzeichnet, dass die Zielfunktion (5) um einen Reglementierer erweitert wird oder ein weight clipping erfolgt.
 
7. Verfahren nach einem der vorangegangenen Ansprüche, dadurch gekennzeichnet, dass die ersten und die zweiten Fahrtrouten in zeitlichen oder räumlichen Diskretisierungsschritten gespeicherte Daten sind, wobei zu jeder Route in jedem Diskretisierungsschritt Routeneigenschaften gespeichert sind.
 
8. Verfahren nach Anspruch 7, dadurch gekennzeichnet, dass die Routeneigenschaften geografische Eigenschaften, Eigenschaften des Verkehrsflusses, Fahrbahneigenschaften, Eigenschaften der Verkehrsführung und / oder Wettereigenschaften der Route umfassen.
 
9. Verfahren nach einem der Ansprüche 7 oder 8, dadurch gekennzeichnet, dass die Routeneigenschaften der ersten Fahrtrouten zumindest in Teilen von einem maschinellen Lernsystem, insbesondere einem Neuronalen Netz, generiert sind.
 
10. Verfahren nach einem der vorangegangenen Ansprüche, dadurch gekennzeichnet, dass die Eingangsgrößen des Generators (41) und des Diskriminators (42) ergänzend zu den ersten Fahrtrouten und den zweiten Fahrtrouten jeweils zusätzliche Informationen umfassen, insbesondere Fahrereigenschaften und / oder Fahrzeugeigenschaften.
 
11. Verfahren nach einem der vorangegangenen Ansprüche, dadurch gekennzeichnet, dass der Generator (41) als weitere Eingangsgrößen Zufallsgrößen von einem Zufallsgenerator (3) erhält und die zu den ersten Fahrtrouten jeweils zugehörigen ersten Fahrverläufe abhängig von den ersten Fahrtrouten und den Zufallsgrößen generiert.
 
12. Verfahren nach Anspruch 11, dadurch gekennzeichnet, dass die Zufallsgrößen entweder als globale Zufallsvektoren oder als temporäre oder lokale Zufallsvektoren implementiert werden.
 
13. Verfahren nach Anspruch 11, dadurch gekennzeichnet, dass die Zufallsgrö-ßen als eine Kombination von globalen und von temporären oder lokalen Zufallsvektoren implementiert werden.
 
14. Verfahren nach einem der vorangegangenen Ansprüche, dadurch gekennzeichnet, dass der Generator (41) und / oder der Diskriminator (42) jeweils als neuronales Netz, insbesondere als rekurrentes neuronales Netz implementiert sind.
 
15. Verfahren nach Anspruch 14, dadurch gekennzeichnet, dass der Generator (41) als bidirektionales rekurrentes neuronales Netz implementiert ist.
 
16. Verfahren nach einem der vorangegangenen Ansprüche, dadurch gekennzeichnet, dass zur Generierung der Fahrverläufe durch den Generator (41) Routeneigenschaften der ersten Fahrtrouten in einem bestimmten Diskretisierungsschritt, insbesondere einem bestimmten Zeitpunkt oder einer bestimmten Streckendistanz, durch Routeneigenschaften eines folgenden Diskretisierungsschritts, insbesondere eines folgenden Zeitpunkts oder einer folgenden Streckendistanz, ergänzt oder erweitert wird.
 
17. Verfahren zum Generieren von Fahrverläufen eines Fahrzeugs, wobei die Fahrverläufe von einem computerimplementierten Generator (41) eines maschinellen Lernsystems (4) generiert werden, welcher mit einem Verfahren nach einem der Ansprüche 1 bis 16 angelernt wurde.
 
18. Verfahren zum Bewerten von Fahrverläufen eines Fahrzeugs, wobei die Fahrverläufe von einem computerimplementierten Diskriminator (42) eines maschinellen Lernsystems (4) beurteilt werden, welcher mit einem Verfahren nach einem der Ansprüche 1 bis 16 angelernt wurde.
 
19. Verfahren zur Ermittlung von routenspezifischen Emissionen eines Antriebssystems eines Fahrzeugs, wobei die routenspezifischen Emissionen abhängig von Fahrverläufen ermittelt werden, welche mit einem Verfahren nach Anspruch 17 generiert wurden.
 
20. Verfahren nach Anspruch 19, dadurch gekennzeichnet, dass die Emissionen in einer Simulation ermittelt werden, in welcher ein Modell des Antriebssystems berechnet wird.
 
21. Verfahren nach Anspruch 20, dadurch gekennzeichnet, dass das Modell des Antriebssystems Teilmodelle umfasst, welche einen Motor und ein Abgasnachbehandlungssystem des Antriebssystems beschreiben.
 
22. Verfahren zur Anpassung eines Antriebssystems eines Fahrzeugs, dadurch gekennzeichnet, dass das Antriebssystem des Fahrzeugs abhängig von routenspezifischen Emissionen angepasst wird, welche mit einem Verfahren nach einem der Ansprüche 19 bis 21 ermittelt wurden.
 
23. Verfahren nach Anspruch 22, dadurch gekennzeichnet, dass die Anpassung durch die Anpassung von Komponenten oder Parametern in der Entwicklung des Antriebssystems, durch eine Anpassung von Daten in einer Applikation des Antriebssystems oder durch eine Anpassung von Steuergrößen im Betrieb des Antriebssystems im Fahrzeug erfolgt.
 
24. Computerprogramm, welches dazu eingerichtet ist, ein Verfahren nach einem der vorangegangenen Ansprüche durchzuführen.
 
25. Maschinenlesbares Speichermedium, auf welchem ein Computerprogramm nach Anspruch 24 abgelegt ist.
 
26. Computerimplementiertes maschinelles Lernsystem (4) mit einem maschinenlesbaren Speichermedium nach Anspruch 25.
 




Zeichnung







Recherchenbericht









Recherchenbericht




Angeführte Verweise

IN DER BESCHREIBUNG AUFGEFÜHRTE DOKUMENTE



Diese Liste der vom Anmelder aufgeführten Dokumente wurde ausschließlich zur Information des Lesers aufgenommen und ist nicht Bestandteil des europäischen Patentdokumentes. Sie wurde mit größter Sorgfalt zusammengestellt; das EPA übernimmt jedoch keinerlei Haftung für etwaige Fehler oder Auslassungen.

In der Beschreibung aufgeführte Patentdokumente