(19)
(11) EP 4 082 869 A1

(12) EUROPÄISCHE PATENTANMELDUNG

(43) Veröffentlichungstag:
02.11.2022  Patentblatt  2022/44

(21) Anmeldenummer: 21170890.4

(22) Anmeldetag:  28.04.2021
(51) Internationale Patentklassifikation (IPC): 
B61L 27/00(2022.01)
(52) Gemeinsame Patentklassifikation (CPC) :
B61L 27/14; B61L 27/12; B61L 27/16
(84) Benannte Vertragsstaaten:
AL AT BE BG CH CY CZ DE DK EE ES FI FR GB GR HR HU IE IS IT LI LT LU LV MC MK MT NL NO PL PT RO RS SE SI SK SM TR
Benannte Erstreckungsstaaten:
BA ME
Benannte Validierungsstaaten:
KH MA MD TN

(71) Anmelder: Siemens Mobility GmbH
81739 München (DE)

(72) Erfinder:
  • Campbell-Smith, Caroline
    38100 Braunschweig (DE)
  • Erhard, Karl-Heinz
    38126 Braunschweig (DE)
  • Hein, Daniel
    81549 München (DE)
  • Limmer, Steffen
    80687 München (DE)

   


(54) VERFAHREN ZUM STEUERN EINES SCHIENENVERKEHRS EINER MEHRZAHL VON SCHIENENFAHRZEUGEN


(57) Die Erfindung betrifft ein Verfahren (100) zum Steuern eines Schienenverkehrs einer Mehrzahl von Schienenfahrzeugen (215), umfassend:
- Empfangen (101) von Zustandsdaten des Schienenverkehrs;
- Empfangen (103) eines Steuerungsziels (KPI1, KPI2, KPIN) zum Steuern des Schienenverkehrs der Mehrzahl von Schienenfahrzeugen (215);
- Auswählen (105) wenigstens einer Aktionsauswahlregel (Π1, Π2, ΠN) aus einer Mehrzahl von Aktionsauswahlregeln (Π1, Π2, ΠN) basierend auf dem Steuerungsziel (KPI1, KPI2, KPIN), wobei die Aktionsauswahlregeln (Π1, Π2, ΠN) eingerichtet sind, basierend auf Zustandsdaten des Schienenverkehrs Steuerungsaktionen des Schienenverkehrs zu ermitteln, wobei durch Ausführung der Steuerungsaktionen durch die Schienenfahrzeuge (215) der Schienenverkehr in einen bezüglich eines Steuerungsziels (KPI1, KPI2, KPIN) optimierten Zustand überführbar ist;
- Ausführen (107) der wenigstens einen ausgewählten Aktionsauswahlregel (Π1, Π2, ΠN) auf die empfangenen Zustandsdaten und Ermitteln von Steuerungsaktionen; und
- Bereitstellen (109) der Steuerungsaktionen zum Ansteuern der Mehrzahl von Schienenfahrzeugen (215).







Beschreibung


[0001] Die Erfindung betrifft ein Verfahren zum Steuern eines Schienenverkehrs einer Mehrzahl von Schienenfahrzeugen.

[0002] Eine Steuerung eines Schienenverkehrs einer Mehrzahl von Schienenfahrzeugen, wie beispielsweise in einem U-Bahn- oder Straßenbahnnetz, kann auf verschiedene Steuerungsziele optimiert sein, beispielsweise auf einen vorteilhaften Energieverbrauch oder möglichst geringe Verspätungszeiten. Hierzu lassen sich entsprechend optimierte Fahrpläne generieren, gemäß denen der Schienenverkehr und insbesondere die Mehrzahl von Schienenfahrzeugen gesteuert werden können. Diese optimierten Fahrpläne werden für gewöhnlich in einem Offline-Zustand, sprich nicht während des Betriebs des Schienenverkehrs, ermittelt beziehungsweise berechnet. Treten nun jedoch während des Betriebs des Schienenverkehrs Situationen auf, in denen vom vordefinierten und optimierten Fahrplan abgewichen werden muss, ergibt sich die Problematik, wie im Online-Zustand, also während des Betriebs, eine möglichst optimale Steuerung des Schienenverkehrs erreicht werden kann.

[0003] Der Erfindung liegt die Aufgabe zugrunde, ein verbessertes Verfahren zum Steuern eines Schienenverkehrs einer Mehrzahl von Schienenfahrzeugen bereitzustellen.

[0004] Diese Aufgabe wird durch ein Verfahren zum Steuern eines Schienenverkehrs einer Mehrzahl von Schienenfahrzeugen gemäß dem unabhängigen Anspruch 1 gelöst. Vorteilhafte Ausgestaltungen sind Gegenstand der untergeordneten Ansprüche.

[0005] Nach einem Aspekt der Erfindung wird ein Verfahren zum Steuern eines Schienenverkehrs einer Mehrzahl von Schienenfahrzeugen bereitgestellt, wobei das Verfahren umfasst:
  • Empfangen von Zustandsdaten der Mehrzahl von Schienenfahrzeugen des Schienenverkehrs, wobei die Zustandsdaten Steuerungszustände der Mehrzahl von Schienenfahrzeugen beschreiben und wenigstens Positionsdaten der Schienenfahrzeuge innerhalb eines Schienenverkehrsnetzes umfassen;
  • Empfangen eines Steuerungsziels zum Steuern des Schienenverkehrs der Mehrzahl von Schienenfahrzeugen;
  • Auswählen wenigstens einer Aktionsauswahlregel aus einer Mehrzahl von Aktionsauswahlregeln basierend auf dem Steuerungsziel, wobei die Aktionsauswahlregeln eingerichtet sind, basierend auf Zustandsdaten des Schienenverkehrs Steuerungsaktionen des Schienenverkehrs zu ermitteln, wobei durch Ausführung der Steuerungsaktionen durch die Schienenfahrzeuge der Schienenverkehr in einen bezüglich eines Steuerungsziels optimierten Zustand überführbar ist, wobei jede Aktionsauswahlregel für die Optimierung bezüglich eines individuellen Steuerungsziels eingerichtet ist, und wobei die wenigstens eine ausgewählte Aktionsauswahlregel für eine Optimierung bezüglich des empfangenen Steuerungsziels eingerichtet ist;
  • Ausführen der wenigstens einen ausgewählten Aktionsauswahlregel auf die empfangenen Zustandsdaten und Ermitteln von Steuerungsaktionen; und
  • Bereitstellen der Steuerungsaktionen zum Ansteuern der Mehrzahl von Schienenfahrzeugen.


[0006] Hierdurch kann der technische Vorteil erreicht werden, dass ein verbessertes Verfahren zum Steuern eines Schienenverkehrs einer Mehrzahl von Schienenfahrzeugen bereitgestellt werden kann, bei dem während des Betriebs des Schienenverkehrs und dem Verfahren der Schienenfahrzeuge innerhalb eines Schienenverkehrsnetzes eine Änderung eines Steuerungsziels, gemäß dem der Schienenverkehr zu steuern bzw. zu optimieren ist, vorgenommen werden kann. Hierzu steht eine Mehrzahl verschiedener Aktionsauswahlregeln bereit, mittels denen basierend auf Zustandsdaten des Schienenverkehrs Steueraktionen ermittelt werden können, die bei Ausführung durch die Mehrzahl von Schienenfahrzeugen des Schienenverkehrs eine Optimierung des Schienenverkehrs bzgl. eines vorbestimmten Steuerungsziels ermöglichen. Bei Empfang eines entsprechend zu ändernden Steuerungsziels kann somit eine Aktionsauswahlregel ausgewählt werden, die für das jeweilige Steuerungsziel optimiert ist bzw. eingerichtet ist, entsprechende Steueraktionen zu ermitteln, die eingerichtet sind, bei Ausführung durch die jeweiligen Schienenfahrzeuge zum Erreichen des entsprechenden Steuerungsziels zu führen. Hierdurch kann erreicht werden, dass während des Betriebs des Schienenverkehrs beliebig eine Änderung des Steuerungsziels vorgenommen werden kann, und problemlos durch Ausführung der jeweiligen Aktionsauswahlregel Steuerungsaktionen zum Optimieren des Schienenverkehrs bzgl. des ausgewählten Steuerungsziels ermittelt werden können. Eine komplexe Anpassung der Steuerung des Schienenverkehrs entfällt hiermit.

[0007] Eine Aktionsauswahlregel ist im Sinne der Anmeldung eine aus dem Bereich des bestärkenden Lernens (reinforcement learning) bekannten Policy, die eingerichtet ist, bei einem beliebigen Zustand des Schienenverkehrs entsprechende Steuerungsaktionen zu ermitteln, die geeignet sind, den Schienenverkehr in einen bzgl. eines vorbestimmten Steuerungsziels optimierten Zustand zu überführen.

[0008] Ein Steuerungsziel ist im Sinne der Anmeldung eine Zielvorgabe, gemäß der der Schienenverkehr der Mehrzahl von Schienenfahrzeugen zu optimieren bzw. zu verbessern ist. Ein Steuerungsziel bzw. ein entsprechendes Optimierungskriterium des Schienenverkehrs kann beispielsweise einen Energieverbrauch, eine Gesamtverspätung der Schienenfahrzeuge, oder ähnliche für den Betrieb einer Mehrzahl von Schienenfahrzeugen relevante Faktoren umfassen.

[0009] Ein Schienenverkehr ist im Sinne der Anmeldung eine Gesamtheit einer Mehrzahl von Schienenfahrzeugen innerhalb eines Schienenverkehrsnetztes und ist durch Zustände gekennzeichnet, in denen Steuerungszustände der einzelnen Schienenfahrzeuge, die wenigstens Positionsangaben der Schienenfahrzeuge innerhalb des Schienenverkehrsnetzes sowie Zeitangaben, beispielsweise Verspätungszeiten der Mehrzahl von Schienenfahrzeugen relativ zu einem vorbestimmten Fahrplan, Energieverbräuche oder weitere Steuerungsparameter der Gesamtheit der Mehrzahl von Schienenfahrzeugen umfassen. Eine Änderung des Schienenverkehrs im Zuge der Ansteuerung der Schienenfahrzeuge innerhalb des Schienenverkehrsnetzes wird durch Zustandsänderungen des Schienenverkehrs beschrieben, in denen die Steuerungszustände der Mehrzahl von Schienenfahrzeugen wie auch die Steuerungsparameter, wie Energieverbrauch oder Gesamtverspätung, eine zeitliche Änderung erfahren.

[0010] Steuerungsaktionen sind im Sinne der Anmeldung Aktionen bzw. Steuerungsmaßgaben, gemäß denen die Mehrzahl von Schienenfahrzeugen anzusteuern ist. Steuerungsaktionen können im Sinne der Anmeldung neben expliziten Ansteuerungsbefehlen an die einzelnen Schienenfahrzeuge Zeitangaben umfassen, die beispielsweise Ankunftszeiten, Abfahrtszeiten oder Standzeiten der einzelnen Schienenfahrzeuge an Haltestellen innerhalb des Schienenverkehrsnetzes beschreiben. Die Schienenfahrzeuge sind hierbei derart anzusteuern, dass diese die entsprechenden Zeitangaben der Vorgaben erfüllen beziehungsweise einhalten.

[0011] Eine Optimierung des Schienenverkehrs bzgl. eines ausgewählten oder vorbestimmten Steuerungsziels umfasst im Sinne der Anmeldung eine Verbesserung eines derzeitigen Zustands des Schienenverkehrs in Bezug auf das jeweilige Steuerungsziel. Eine Optimierung des Schienenverkehrs muss somit im Sinne der Anmeldung nicht zwangsläufig zu einem optimalen Zustand des Schienenverkehrs bzgl. des jeweiligen Steuerungsziels führen, sondern kann lediglich durch eine Verbesserung in Bezug auf das Steuerungsziel und im Vergleich zeitlich vorangegangene Zustände des Schienenverkehrs beschränkt sein.

[0012] Das erfindungsgemäße Verfahren zum Steuern eines Schienenverkehrs kann somit während des Betriebs des Schienenverkehrs ausgeführt werden, während dem ein Verfahren der einzelnen Schienenfahrzeuge innerhalb des Schienenverkehrsnetzes vorgenommen wird. Die Optimierung des Schienenverkehrs kann hierbei bzgl. eines vorbestimmten Fahrplans, gemäß dem die Mehrzahl der Schienenfahrzeuge innerhalb des Schienenverkehrsnetzes anzusteuern sind, vorgenommen werden.

[0013] Nach einer Ausführungsform ist das empfangene Steuerungsziel ein kombiniertes Steuerungsziel und umfasst eine Mehrzahl von Steuerungszielen, wobei die Steuerungsziele mit individuellen Gewichtungen in das kombinierte Steuerungsziel eingeht; umfassend:
  • Auswählen einer Mehrzahl von Aktionsauswahlregeln, wobei jede Aktionsauswahlregel jeweils auf eine Optimierung bezüglich eines der Mehrzahl von Steuerungszielen des kombinierten Steuerungsziels eingerichtet ist; und
  • Ausführen der Mehrzahl der ausgewählten Aktionsauswahlregeln gemäß einem Ausführungsverhältnis, wobei das Ausführungsverhältnis für jede ausgewählte Auswahlregel einen zeitlichen Anteil an einer Gesamtausführungsdauer der Mehrzahl von ausgewählten Aktionsauswahlregeln bestimmt, und wobei eine Ausführung der Mehrzahl von Aktionsauswahlregeln gemäß dem Ausführungsverhältnis das kombinierte Steuerungsziel erfüllt.


[0014] Hierdurch kann der technische Vorteil erreicht werden, dass eine weitere Verbesserung des Steuerns des Schienenverkehrs bewirkt werden kann, in dem eine Berücksichtigung von kombinierten Steuerungszielen und eine entsprechende Optimierung des Schienenverkehrs bzgl. derartiger Steuerungsziele ermöglicht ist. Ein kombiniertes Steuerungsziel umfasst hierbei eine Mehrzahl von vorbestimmten Steuerungszielen, die jeweils mit einer entsprechenden Gewichtung in das kombinierte Steuerungsziel eingehen. Hiermit ist eine Steuerung des Schienenverkehrs bzgl. einer Mehrzahl von Steuerungszielen ermöglicht.

[0015] Ein kombiniertes Steuerungsziel ist im Sinne der Anmeldung durch eine Mehrzahl von wenigstens zwei vorbestimmten Steuerungszielen gegeben, die mit einer entsprechenden Gewichtung in das kombinierte Steuerungsziel eingehen. Ein Schienenverkehr kann somit beispielsweise simultan bzgl. der Steuerungsziele Energieverbrauch und Verspätungsreduzierung, beispielsweise in einem Verhältnis von 60 zu 40, angesteuert werden. Hierzu wird eine Mehrzahl von entsprechenden Aktionsauswahlregeln ausgewählt, die jeweils auf die einzelnen vorbestimmten Steuerungsziele des kombinierten Steuerungsziels optimiert sind, und gemäß eines Ausführungsverhältnisses ausgeführt. Das Ausführungsverhältnis ist hierbei derart ausgestaltet, dass die Ausführung der ausgewählten Aktionsauswahlregeln gemäß des Ausführungsverhältnisses zur Erfüllung des kombinierten Steuerungsziels führen.

[0016] Ein Ausführen einer Mehrzahl von Aktionsauswahlregeln gemäß einem Ausführungsverhältnis entspricht im Sinne der Anmeldung einer Ausführung der jeweils durch die einzelnen Aktionsauswahlregeln ermittelten Steuerungsaktionen gemäß des jeweiligen Ausführungsverhältnisses. Ein Ausführungsverhältnis beschreibt hierbei im Sinne der Anmeldung für jede entsprechend zu berücksichtigende Aktionsauswahlregel einen zeitlichen Anteil der jeweiligen Ausführung der Aktionsauswahlregel innerhalb eines vorbestimmten Ausführungszeitraums. Die Ausführung der einzelnen Steuerungsaktionen der verschiedenen Aktionsauswahlregeln gemäß des Ausführungsverhältnisses bedeutet im Sinne der Anmeldung, dass gemäß dem jeweiligen Ausführungsverhältnis der Schienenverkehr gemäß den jeweiligen Aktionsauswahlregeln angesteuert wird.

[0017] Nach einer Ausführungsform ist durch das Ausführungsverhältnis für jede Aktionsauswahlregel eine Ausführungsdauer und/oder eine zeitliche Abfolge der Mehrzahl von Aktionsauswahlregeln bestimmt.

[0018] Hierdurch kann der technische Vorteil erreicht werden, dass ein präzises und einfach zu bestimmendes Ausführungsverhältnis ermöglicht ist, in dem für jede Aktionsauswahlregel eine Ausführungsdauer innerhalb des jeweiligen Ausführungszeitraums und/oder für die Mehrzahl von beteiligten Aktionsauswahlregeln eine Ausführungsreihenfolge bestimmt wird.

[0019] Nach einer Ausführungsform ist durch das Ausführungsverhältnis für jede ausgewählte Aktionsauswahlregel eine Ausführungswahrscheinlichkeit bestimmt, gemäß der die Aktionsauswahlregel in einem Ausführungszeitraum auszuführen ist.

[0020] Hierdurch kann der technische Vorteil erreicht werden, dass ein präzises und einfach zu bestimmendes Ausführungsverhältnis bereitgestellt werden kann. Hierzu wird für jede beteiligte Aktionsauswahlregel eine Ausführungswahrscheinlichkeit einer Ausführung der jeweiligen Aktionsauswahlregel innerhalb eines entsprechenden Ausführungszeitraums bestimmt. Die Ausführungswahrscheinlichkeit beschreibt hierbei die Wahrscheinlichkeit, dass der Schienenverkehr gemäß den durch die jeweilige Aktionsauswahlregel bestimmten Steuerungsaktionen während eines vorbestimmten Zeitraums angesteuert wird.

[0021] Nach einer Ausführungsform werden die ausgewählten Aktionsauswahlregeln zyklisch ausgeführt, wobei der Schienenverkehr gemäß der durch die Aktionsauswahlregeln bestimmten Steuerungsaktionen zyklisch gesteuert wird.

[0022] Hierdurch kann der technische Vorteil erreicht werden, dass eine präzise Steuerung des Schienenverkehrs ermöglicht ist.

[0023] Nach einer Ausführungsform wird das Auswählen und/oder das Ausführen der Aktionsauswahlregeln durch eine Zeitaufteilungsfunktion ausgeführt, wobei die Zeitaufteilungsfunktion durch maschinelles Lernen trainiert ist, für kombinierte Steuerungsziele entsprechende Ausführungsverhältnisse zu bestimmen.

[0024] Hierdurch kann der technische Vorteil erreicht werden, dass eine präzise Auswahl der jeweiligen auszuführenden Steuerungsaktionen und eine präzise Bestimmung der jeweiligen Ausführungsverhältnisse ermöglicht ist. Durch die Zeitaufteilungsfunktion, die durch Techniken des maschinellen Lernens darauf trainiert ist, für beliebige kombinierte Steuerungsziele entsprechende Ausführungsverhältnisse der jeweiligen Aktionsauswahlregeln zu bestimmen, kann eine hochkomplexe Steuerung eines eine Vielzahl von Schienenfahrzeugen umfassenden Schienenverkehrs und eine Optimierung eines solchen in Bezug auf kombinierte Steuerungsziele präzise und zuverlässig erreicht werden. Die Verwendung der Techniken des maschinellen Lernens ermöglicht hierbei eine präzisere Bestimmung der entsprechenden Ausführungsverhältnisse und damit verbunden eine effektiviere und effizientere Steuerung des Schienenverkehrs.

[0025] Nach einer Ausführungsform sind die Zeitaufteilungsfunktion und/oder die Aktionsauswahlregeln durch bestärkendes Lernen trainiert.

[0026] Hierdurch kann der technische Vorteil erreicht werden, dass ein präzises und effizientes Training der zur Zeitaufteilungsfunktion bzw. der Aktionsauswahlregeln bereitgestellt werden kann.

[0027] Nach einer Ausführungsform wird das Training der Aktionsauswahlregeln und/oder der Zeitaufteilungsfunktion basierend auf Simulationsdaten ausgeführt, wobei die Simulationsdaten auf einer Simulation eines Schienenverkehrs einer Mehrzahl von Schienenfahrzeugen basieren.

[0028] Hierdurch kann der technische Vorteil erreicht werden, dass ein effektives und effizientes Training der Aktionsauswahlregeln bzw. der Zeitaufteilungsfunktion ermöglicht ist. Darüber hinaus kann auf ein Generieren entsprechender Trainingsdaten durch tatsächlich durchgeführte Fahrten der Mehrzahl von Schienenfahrzeugen verzichtet werden.

[0029] Nach einer Ausführungsform umfasst das Training der Aktionsauswahlregeln und/oder der Zeitaufteilungsfunktion ein Maximieren von Belohnungsfunktionen, wobei die Belohnungsfunktionen Steuerungsziele und/oder kombinierte Steuerungsziele definieren.

[0030] Hierdurch kann der technische Vorteil erreicht werden, dass ein effektives und effizientes Training der Aktionsauswahlregeln bzw. der Zeitaufteilungsfunktion erreicht werden kann.

[0031] Nach einer Ausführungsform werden die Aktionsauswahlregeln und die Zeitaufteilungsfunktionen simultan trainiert.

[0032] Hierdurch kann der technische Vorteil erreicht werden, dass eine verbesserte Steuerung des Schienenverkehrs ermöglicht ist. Durch das simultane Training der Zeitaufteilungsfunktion und der Mehrzahl von Aktionsauswahlregeln in Bezug auf kombinierte Steuerungsziele kann erreicht werden, dass die einzelnen Steuerungsaktionen der verschiedenen Aktionsauswahlregeln auf das Zusammenspiel mit den jeweils anderen Steuerungsauswahlregeln angepasst werden können. Durch das Anpassen kann eine bessere Performance der Aktionsauswahlregeln erreicht werden, als dies bei einem individuellen Training der einzelnen Aktionsauswahlregeln auf individuelle Steuerungsziele und lediglich einer Kombination der individuell trainierten Aktionsauswahlregeln durch die Zeitaufteilungsfunktion zur Erfüllung eines kombinierten Steuerungsziels möglich wäre.

[0033] Nach einer Ausführungsform sind die Aktionsauswahlregeln und/oder die Zeitaufteilungsfunktion als neuronale Netze ausgebildet.

[0034] Hierdurch kann der technische Vorteil erreicht werden, dass eine leistungsfähige und robuste Ausgestaltung der Aktionsauswahlregeln bzw. Zeitaufteilungsfunktionen bereitgestellt werden kann.

[0035] Nach einer Ausführungsform umfassen Steuerungsziele: Minimierung eines Energieverbrauchs der Mehrzahl von Schienenfahrzeugen und/oder Minimierung von Energieverbräuchen einzelner Schienenfahrzeuge und/oder Minimierung einer Gesamtverspätung der Mehrzahl von Schienenfahrzeugen und/oder Minimierung einer Maximalverspätung einzelner Schienenfahrzeuge und/oder Minimierung einer quadratischen oder absoluten Abweichungssumme der Verspätungen bezüglich eines mittleren oder medianen Verspätungswerts der Mehrzahl von Schienenfahrzeugen.

[0036] Hierdurch kann der technische Vorteil erreicht werden, dass eine präzise Steuerung des Schienenverkehrs ermöglicht ist, bei dem der Schienenverkehr bzgl. relevanter Steuerungsziele optimierbar ist.

[0037] Nach einer Ausführungsform umfassen die Steuerungsaktionen Ankunftszeiten und/oder Abfahrtszeiten und/oder Standzeiten der Mehrzahl von Schienenfahrzeugen an Haltestellen innerhalb des Schienenverkehrsnetzes.

[0038] Hierdurch kann der technische Vorteil erreicht werden, dass eine effiziente Steuerung des Schienenverkehrs unter Berücksichtigung von kombinierten Steuerungszielen ermöglicht ist. Durch die Berücksichtigung von Abfahrtszeiten und/oder Ankunftszeiten und/oder Standzeiten der Schienenfahrzeuge an Haltestellen innerhalb des Schienenverkehrsnetzes in den jeweiligen Steuerungsaktionen kann eine präzise Steuerung des Schienenverkehrs erreicht werden. Die entsprechenden Ankunftszeiten und/oder Abfahrtszeiten und/oder Standzeiten können hierbei in Relation zu einem vorbestimmten optimierten Fahrplan stehen. Eine Steuerung der einzelnen Schienenfahrzeuge des Schienenverkehrs kann hierbei derart ausgestaltet werden, dass die in den Steuerungsaktionen definierten Abfahrtszeiten und/oder Ankunftszeiten und/oder Standzeiten durch die jeweiligen Schienenfahrzeuge eingehalten werden.

[0039] Nach einem zweiten Aspekt wird eine Recheneinheit bereitgestellt, wobei die Recheneinheit ausgebildet ist, das Verfahren zum Steuern eines Schienenverkehrs einer Mehrzahl von Schienenfahrzeugen nach einer der voranstehenden Ausführungsformen auszuführen.

[0040] Nach einem dritten Aspekt der Erfindung wird ein Computerprogrammprodukt umfassend Befehle bereitgestellt, die bei der Ausführung des Programms durch eine Datenverarbeitungseinheit diese veranlassen, das Verfahren zum Steuern eines Schienenverkehrs einer Mehrzahl von Schienenfahrzeugen nach einer der voranstehenden Ausführungsformen auszuführen.

[0041] Die oben beschriebenen Merkmale und Vorteile dieser Erfindung sowie die Art und Weise, wie diese erreicht werden, werden klarer und deutlicher verständlich durch die Erläuterungen der folgenden, stark vereinfachten, schematischen Darstellungen bevorzugter Ausführungsbeispiele. Hierbei zeigen jeweils:
FIG 1
eine schematische Darstellung eines Systems zum Steuern eines Schienenverkehrs gemäß einer Ausführungsform;
FIG 2
ein Flussdiagramm eines Verfahrens zum Steuern eines Schienenverkehrs gemäß einer Ausführungsform;
FIG 3
ein Diagramm einer Optimierung eines Schienenverkehrs in Bezug auf zwei Steuerungsziele;
FIG 4
eine schematische Darstellung einer zeitlichen Ausführung von zwei Aktionsauswahlregeln gemäß einem Ausführungsverhältnis;
FIG 5
eine schematische Darstellung einer Architektur für eine Zeitaufteilungsfunktion gemäß einer Ausführungsform;
FIG 6
eine weitere schematische Darstellung einer Architektur für eine Zeitaufteilungsfunktion gemäß einer weiteren Ausführungsform;
FIG 7
ein Diagramm eines Hypervolumens eines Optimierungszustands eines Schienenverkehrs; und
FIG 8
eine schematische Darstellung eines Computerprogrammprodukts.


[0042] FIG 1 zeigt eine schematische Darstellung eines Systems 200 zur Optimierung eines Schienenverkehrs gemäß einer Ausführungsform.

[0043] Ein System 200 zur Optimierung eines Schienenverkehrs umfasst gemäß der gezeigten Ausführungsform eine Mehrzahl von Modulen, die auf einer Recheneinheit 201 ausführbar sind. Das System 200 kann ferner in ein Offline-Teilsystem 202 und ein Online-Teilsystem 204 aufgeteilt sein, wobei das Offline-Teilsystem 202 offline, sprich unabhängig von einem Betrieb der Schienenfahrzeuge 215, ausgeführt wird, während das Online-Teilsystem 204 während des Betriebs der Schienenfahrzeuge 215 ausgeführt wird.

[0044] Die zentrale Komponente des Offline-Teilsystems 202 ist ein Fahrplanoptimierungsmodul 211. Das Fahrplanoptimierungsmodul 211 dient dazu, für einen vorbestimmten Zeitraum einen optimierten Fahrplan für einen Schienenverkehr einer Mehrzahl von Schienenfahrzeugen eines Schienenverkehrsnetzes zu erstellen. Den im Offline-Teilsystem 202 erstellten optimierten Fahrplan kann das Fahrplanoptimierungsmodul 211 über eine erste Schnittstelle an das Online-Teilsystem 204 übertragen, damit der Fahrplan zur Steuerung des Schienenverkehrs ausgeführt werden kann.

[0045] Im tatsächlichen Betrieb des Schienenverkehrs wird der nun Online-Fahrplan genannte Fahrplan durch ein Fahrplanmanagementmodul 205 verwaltet. Hierzu können Positionsdaten einzelner Schienenfahrzeuge des Schienenverkehrs über ein automatisches Schienenfahrzeugverfolgungsmodul 207 über eine zweite Schnittstelle S2 an das Fahrplanmanagementmodul 205 übertragen werden, damit dieses einen Vergleich zwischen Soll-Bewegungen des Fahrplans und tatsächlich durch die Schienenfahrzeuge des Schienenverkehrs ausgeführte Ist-Bewegungen ausführen kann.

[0046] Das Fahrplanmanagementmodul 205 kann über eine dritte Schnittstelle S3 Befehle zur Auswahl entsprechend zu befahrender Schienenwege an ein automatisches Streckenauswahlmodul 209 übertragen. Somit können rechtzeitig entsprechende Schienenwege reserviert werden, um einen Betrieb der Schienenfahrzeuge mit minimalen Verspätungen zu gewährleisten.

[0047] Das Fahrplanmanagementmodul 205 weist ferner eine bidirektionale Schnittstelle S2, S4 mit einem automatischen Schienenfahrzeugregelungsmodul 203 auf. Für den Fall, dass der Online-Fahrplan geändert werden muss, entweder durch einen neuen Sollfahrplan des Fahrplanoptimierungsmoduls 211 oder durch Änderungen eines Fahrdienstleiters, kann das automatische Schienenfahrzeugregelungsmodul 203 entsprechend informiert werden, um eine Änderung des Online-Fahrplans zu bewirken. Hierzu benötigt das automatische Schienenfahrzeugregelungsmodul 203 ferner aktuelle Positionsdaten der Schienenfahrzeuge, um aktuelle Verspätungen der Schienenfahrzeuge ermitteln und bei größeren Abweichungen geeignete Regelungen einleiten zu können.

[0048] Diese Regelungen können entsprechende durch die Schienenfahrzeuge auszuführende Steuerungsaktionen umfassen, mit denen gewünschte bzw. zur Aufhebung der Verspätung und zur Änderung des Fahrplans durch die Schienenfahrzeuge zu erreichende bzw. einzuhaltende Abfahrtszeiten und/oder Ankunftszeiten und Haltezeiten der Schienenfahrzeuge an Haltestellen der Schienenwege des Schienenverkehrsnetzes umfassen. Die entsprechenden Regelungen und/oder Steuerungsaktionen können über eine fünfte Schnittstelle S5 an das Fahrplanmanagementmodul 205 übermittelt werden.

[0049] Abschließend werden zur Anpassung des Fahrplans die entsprechenden Regelungen und Steuerungsaktionen und die entsprechenden optimierten Ankunftszeiten/Abfahrtszeiten/Haltezeiten vom automatischen Fahrplanmanagementmodul 205 über eine sechste Schnittstelle S6 an automatische Schienenfahrzeugsteuerungsmodule 213 der einzelnen Schienenfahrzeuge 315 des Schienenverkehrs übermittelt, damit diese die gewünschten Änderung bzw. Steuerungsaktionen ausführen können, um die optimierten Ankunftszeiten/Abfahrtszeiten/Haltezeiten zu erreichen oder einzuhalten.

[0050] Im Falle von automatisch fahrenden Schienenfahrzeugen kann das automatische Schienenfahrzeugsteuerungsmodul 213 energieoptimierte Fahrtrajektorien des Schienenfahrzeugs 203 ermitteln, die am besten zum aktuellen Online-Fahrplan passen. Im Falle des manuellen Fahrens wird der Fahrzeugführer beraten, ist aber in der Umsetzung der Regelungen frei.

[0051] In der gezeigten Ausführungsform ist das automatische Schienenfahrzeugregelungsmodul 203 eingerichtet, basierend auf den Zustandsdaten eines zu optimierenden Schienenverkehrs einer Mehrzahl von Schienenfahrzeugen das erfindungsgemäße Verfahren zum Steuern eines Schienenverkehrs einer Mehrzahl von Schienenfahrzeugen 215 auszuführen.

[0052] FIG 2 zeigt ein Flussdiagramm eines Verfahrens 100 zum Steuern eines Schienenverkehrs gemäß einer Ausführungsform.

[0053] Das erfindungsgemäße Verfahren 100 zum Steuern eines Schienenverkehrs einer Mehrzahl von Schienenfahrzeugen 215 kann durch ein System 200 gemäß der Ausführungsform in Figur 1 und insbesondere durch ein automatisches Schienenfahrzeugregelungsmodul 203 ausgeführt werden.

[0054] Zum Steuern eines Schienenverkehrs werden gemäß dem erfindungsgemäßen Verfahren 100 zunächst in einem Verfahrensschritt 101 Zustandsdaten des Schienenverkehrs der Mehrzahl von Schienenfahrzeugen 215 empfangen. Die Zustandsdaten beschreiben hierbei Zustände des Schienenverkehrs und umfassen wenigstens Positionsdaten der Mehrzahl von Schienenfahrzeugen, gemäß denen eine Positionierung der Schienenfahrzeuge innerhalb des Schienenverkehrsnetzes möglich ist. Die Zustandsdaten können darüber hinaus Steuerungskriterien des Schienenverkehrs, beispielsweise Energieverbräuche des Schienenverkehrs bzw. der einzelnen Schienenfahrzeuge oder Verspätungen der Schienenfahrzeuge sowohl als Gesamtheit als auch individuell und weitere relevante Kriterien zum Steuern eines Schienenverkehrs umfassen.

[0055] Das Verfahren kann während eines Betriebs des Schienenverkehrs ausgeführt werden, in dem die Schienenfahrzeuge entsprechend eines Fahrplans innerhalb des Verkehrsnetzes verfahren werden. Die Zustandsdaten beschreiben hierbei Zustände des Schienenverkehrs und beschreiben wenigstens die Positionen innerhalb des Verkehrsnetzes an denen sich Fahrzeuge zu einem bestimmten Zeitpunkt befinden. Die Zustandsdaten können ferner Zeitangaben umfassen, beispielsweise Verspätungszeiten der einzelnen Schienenfahrzeuge in Bezug auf einen optimierten Fahrplan.

[0056] In einem weiteren Verfahrensschritt 103 wird ein Steuerungsziel KPI1, KPI2, KPIN empfangen. Das Steuerungsziel kann hierbei beispielsweise durch einen Energieverbrauch der Gesamtheit der Schienenfahrzeuge oder eine Gesamtverspätung der Gesamtheit der Schienenfahrzeuge oder durch individuelle Verspätungen der einzelnen Schienenfahrzeuge gegeben sein.

[0057] Das Steuerungsziel KPI1, KPI2, KPIN kann während des Betriebs des Schienenverkehrs und somit während des Verfahrens der Schienenfahrzeuge innerhalb des Verkehrsnetzes empfangen werden. Dies ermöglicht eine Änderung eines Steuerungsziels KPI1, KPI2, KPIN während des online Betriebs des Schienenverkehrs. Das Steuerungsziel gibt hierbei ein Kriterium an, gemäß dem die Steuerung des Schienenverkehrs vorgenommen werden kann. Beispielsweise kann der Schienenverkehr derart angesteuert werden, dass ein Gesamtenergieverbrauch der Schienenfahrzeuge minimal ist. Alternativ kann der Schienenverkehr angesteuert werden, Verspätungen der Fahrzeuge zum Fahrplan zu vermeiden oder zu minimieren

[0058] In einem Verfahrensschritt 105 wird darauffolgend wenigstens eine Aktionsauswahlregel π1, π2, πN aus einer Mehrzahl vorgespeicherter Aktionsauswahregeln π1, π2, πN ausgewählt. Die Aktionsauswahlregeln π1, π2, πN sind eingerichtet, basierend auf Zustandsdaten des Schienenverkehrs Steuerungsaktionen zu ermitteln, die bei Ausführungen durch die Schienenfahrzeuge des Schienenverkehrs zu einer Optimierung des Schienenverkehrs bzgl. eines vorbestimmten Steuerungsziels KPI1, KPI2, KPIN führen. Die einzelnen Aktionsauswahlregeln π1, π2, πN sind bzgl. eines individuellen Steuerungsziels KPI1, KPI2, KPIN optimiert. Beispielsweise ist eine Aktionsauswahlregel π1, π2, πN auf eine Optimierung bzgl. eines Gesamtenergieverbrauchs des Schienenverkehrs optimiert, während eine weitere Aktionsauswahlregel bzgl. einer Minimierung einer Gesamtverspätung der Schienenfahrzeuge des Schienenverkehrs optimiert ist. Eine Optimierung einer Aktionsauswahlregel π1, π2, πN bzgl. eines Steuerungsziels KPI1, KPI2, KPIN ist derart zu verstehen, dass die jeweilige Aktionsauswahlregel π1, π2, πN eingerichtet ist, entsprechende Steuerungsaktionen zu bestimmen, die bei Ausführung durch die Schienenfahrzeuge zur Optimierung des Schienenverkehrs bzgl. des jeweiligen Steuerungsziels KPI1, KPI2, KPIN führen. Im Verfahrensschritt 105 wird demzufolge aus der Mehrzahl vorgespeicherter Aktionsauswahlregeln π1, π2, πN die Aktionsauswahlregel π1, π2, πN ausgewählt, die bzgl. des empfangenen Steuerungsziels KPI1, KPI2, KPIN optimiert ist.

[0059] Die durch die Aktionsauswahlregeln π1, π2, πN basierend auf den Zustandsdaten des Schienenverkehrs ermittelten Steuerungsaktionen können neben oder alternativ zu tatsächlichen Steuerbefehlen an die Schienenfahrzeuge Zeitvorgaben in Gestalt von Ankunfts-, Abfahrts- und/oder Standzeiten der Schienenfahrzeuge an Haltestellen des Verkehrsnetzes umfassen. Eine beispielsweise auf einen Energieverbrauch der Mehrzahl von Schienenfahrzeugen optimierte Aktionsauswahlregel π1, π2, πN ist somit eingerichtet, basierend auf den Zustandsdaten des Schienenverkehrs, in denen wenigstens die Positionen der Schienenfahrzeuge zu eine bestimmten Zeitpunkt beschrieben sind, Ankunfts-, Abfahrts- und/oder Standzeiten der Schienenfahrzeuge für in Zukunft anzusteuernde Haltestellen zu bestimmen, Ankunfts-, Abfahrts- und/oder Standzeiten derart ausgestaltet sind, dass bei Ansteuerung der Schienenfahrzeuge derart, dass ein Einhalten der Ankunfts-, Abfahrts- und/oder Standzeiten durch die Schienenfahrzeuge erreicht wird, ein Energieverbrauch der Schienenfahrzeuge minimiert wird.

[0060] Die entsprechend bestimmten Ankunfts-, Abfahrts- und/oder Standzeiten können hierbei für verschieden Steuerungsziele variieren. Beispielsweise kann es zur Reduzierung eines Energieverbrauchs vorteilhaft sein, ein Fahrzeug länger an einer Haltestelle halten zu lassen, um das Anfahren des Fahrzeugs mit dem Beschleunigen und/oder Bremsen andere Fahrzeuge zu synchronisieren. Für eine Reduzierung einer Verspätung der Schienenfahrzeuge können längere Standzeiten hingegen nicht förderlich sein, da hierdurch vielmehr weitere Verspätungen generiert würden. Die entsprechend ermittelten Ankunfts-, Abfahrts- und/oder Standzeiten hängen ferner von den Zustandsdaten des Schienenverkehrs und insbesondere von den Positionierungen der einzelnen Fahrzeuge ab.

[0061] In einem Verfahrensschritt 107 wird die wenigstens eine ausgewählte Aktionsauswahlregel π1, π2, πN auf die empfangenen Zustandsdaten des Schienenverkehrs ausgeführt und entsprechende Steuerungsaktionen ermittelt. Die ermittelten Steuerungsaktionen, beispielsweise die entsprechenden Ankunfts-, Abfahrts- und/oder Standzeiten, sind hierbei derart eingerichtet, dass bei entsprechender Ansteuerung der Fahrzeuge der Schienenverkehr in einen Zustand versetzt werden kann, der bezüglich des jeweiligen Steuerungsziel optimiert oder wenigstens verbessert ist gegenüber zeitlich früheren Zuständen. Beispielsweise kann in einem derart generierten Zustand eine Verspätung zum vorbestimmten Fahrplan reduziert oder ein Energieverbrauch verringert sein.

[0062] In einem Verfahrensschritt 109 werden die Steuerungsaktionen gemäß der Ausführungsform zu Figur 1 an die verschiedenen Module des Systems 200 bereitgestellt, so dass eine Steuerung des Schienenverkehrs ermöglicht ist. Die Steuerung umfasst hierbei, dass die Schienenfahrzeuge derart angesteuert werden, dass die im Verfahrensschritt ermittelten Ankunfts-, Abfahrts- und/oder Standzeiten durch die Fahrzeuge eingehalten werden. Die entsprechenden Ankunfts-, Abfahrts- und/oder Standzeiten können hierbei neben einer für ein jeweiliges Fahrzeug auf einer Fahrstrecke des Verkehrsnetzes unmittelbar vorausliegenden Haltestelle eine Mehrzahl von Haltestellen berücksichtigen, die durch das Fahrzeug auf der Fahrstrecke in einem vorbestimmten Zeitraum bei entsprechender Ansteuerung erreicht werden. Die entsprechenden Steuerungsaktionen können somit für ein Schienenfahrzeug einen Satz von Ankunfts-, Abfahrts- und/oder Standzeiten für eine Mehrzahl von Haltestellen umfassen.

[0063] Gemäß einer Ausführungsform wird in Verfahrensschritt 103 ein kombiniertes Steuerungsziel KPI empfangen. Das kombinierte Steuerungsziel KPI umfasst eine Mehrzahl der vorbestimmten Steuerungszielen KPI1, KPI2, KPIN, die jeweils mit individuellen Gewichtungen W1, W2, WN in das kombinierte Steuerungsziel KPI eingehen. Ein kombiniertes Steuerungsziel KPI kann somit beispielsweise eine simultane Optimierung bzgl. eines Energieverbrauchs und bzgl. einer Minimierung einer Gesamtverspätung des Schienenverkehrs umfassen, wobei die Optimierung bzgl. des Energieverbrauchs und die Optimierung bzgl. der Gesamtverspätung in einem beliebigen Verhältnis, beispielsweise 60 zu 40, in das kombinierte Steuerungsziel KPI eingehen können. Eine Steuerung kann somit derart erfolgen, dass beispielsweise zu 60% eine Reduzierung des Energieverbrauchs und zur 40% eine Reduzierung einer Verspätung erreicht werden. Die beschriebenen Steuerungsziele und die angegebenen Verhältnisse und Prozentangaben sind lediglich beispielhaft und stellen keine Einschränkung der Erfindung dar.

[0064] Im Verfahrensschritt 105 wird darauffolgend eine Mehrzahl von Aktionsauswahlregeln π1, π2, πN der vorgespeicherten Aktionsauswahlregeln π1, π2, πN ausgewählt. Die ausgewählten Aktionsauswahlregeln π1, π2, πN sind hierbei auf die entsprechenden Steuerungsziele KPI1, KPI2, KPIN des kombinierten Steuerungsziels KPI optimiert.

[0065] Im Verfahrensschritt 107 werden darauffolgend die Aktionsauswahlregeln π1, π2, πN der ausgewählten Mehrzahl gemäß einem Ausführungsverhältnis ausgeführt. Das Ausführungsverhältnis beschreibt hierbei für jede der ausgewählten Aktionsauswahlregeln π1, π2, πN einen zeitlichen Anteil an einer Gesamtausführungsdauer der Mehrzahl von ausgeführten Aktionsauswahlregeln π1, π2, πN und ermöglicht eine Erfüllung des kombinierten Steuerungsziels KPI durch Ausführung der ausgewählten Aktionsauswahlregeln π1, π2, πN gemäß des entsprechenden Ausführungsverhältnisses. Zum Steuern des Schienenverkehrs werden die Schienenfahrzeuge gemäß den durch die ausgewählten Aktionsauswahlregeln π1, π2, πN ermittelten Steuerungsaktionen in dem jeweiligen Ausführungsverhältnis angesteuert. Das Ausführungsverhältnis kann hierbei der Gewichtung der einzelnen Steuerungsziele KPI1, KPI2, KPIN des kombinierten Steuerungsziels KPI entsprechen, so dass der Schienenverkehr gemäß dem oben beschriebenen Beispiel beispielsweise zu 60 % eines Steuerungszeitraums gemäß einer Optimierung bzgl. eines Energieverbrauchs angesteuert wird und zu 40 % des Ausführungszeitraums gemäß einer Optimierung bzgl. einer Gesamtverspätung angesteuert wird. Die Ansteuerung der Schienenfahrzeuge erfolgt hierbei gemäß den durch die Aktionsauswahlregeln π1, π2, πN ermittelten Steuerungsaktionen. Das Ausführungsverhältnis kann jedoch auch von der jeweiligen Gewichtung W1, W2, WN der einzelnen Steuerungsziele KPI1, KPI2, KPIN des kombinierten Steuerungsziels KPI abweichen.

[0066] Das Ausführungsverhältnis kann hierbei gemäß einer Ausführungsform eine Ausführungsdauer t1, t2, tN für jede der einzelnen Aktionsauswahlregeln π1, π2, πN beschreiben und/oder eine zeitliche Abfolge der Mehrzahl von Aktionsauswahlregeln π1, π2, πN bestimmen. Der Schienenverkehr kann somit, dem oben beschriebenen Beispiel folgend, für eine entsprechend bestimmte Ausführungsdauer t1, t2 bzgl. des Energieverbrauchs optimiert und für eine entsprechende Ausführungsdauer t1, t2 bzgl. einer Gesamtverspätung optimiert. Die Ausführungsdauern t1, t2 können hierbei in entsprechende Zeitfenster aufgeteilt werden, so dass beispielswese abwechselnd der Schienenverkehr bzgl. des einen und darauffolgend bzgl. des anderen Steuerungsziels optimiert werden kann.

[0067] Das Ansteuern des Schienenverkehrs gemäß dem Ausführungsverhältnis und den entsprechend bestimmten Ausführungsdauern t1, t2, tN für die verschiedenen Aktionsauswahlregeln π1, π2, πN bedeutet hierbei, dass die Schienenfahrzeuge für eine Ausführungsdauer derart angesteuert werden, dass diese Ankunfts-, Abfahrts- und/oder Standzeiten erreichen oder einhalten, die geeignet sind, ein erstes Steuerungsziel zu erreichen, und für eine weitere Ausführungsdauer angesteuert werden, um andere Ankunfts-, Abfahrts- und/oder Standzeiten zu erreichen oder einzuhalten, die eingerichtet sind, ein weiteres Steuerungsziel des kombinierten Steuerungsziel zu erreichen.

[0068] Gemäß einer weiteren Ausführungsform kann das Ausführungsverhältnis für jede ausgewählte Aktionsauswahlregel π1, π2, πN eine Ausführungswahrscheinlichkeit P bestimmen, gemäß der die Aktionsauswahlregel π1, π2, πN in einem Ausführungszeitraum auszuführen ist. Gemäß dem Ausführungsverhältnis wird somit stochastisch bestimmt, zu welcher Wahrscheinlichkeit P jede Aktionsauswahlregel π1, π2, πN in einem entsprechenden Ausführungszeitraum auszuführen ist. Dies bedeutet, dass der Schienenverkehr gemäß der entsprechenden Ausführungswahrscheinlichkeit P während eines Ausführungszeitraums bzgl. des Energieverbrauchs bzw. der Gesamtverspätung optimiert werden kann. Eine Ausführungszeit kann beispielsweise durch eine Zykluszeit bei einer zyklischen Steuerung des Schienenverkehrs gegeben sein, so dass für jede Zykluszeit eines auszuführenden Zyklus der Steuerung des Schienenverkehrs gemäß den entsprechenden Ausführungswahrscheinlichkeiten P der Schienenverkehr bzgl. der jeweiligen Steuerungsziele KPI1, KPI2, KPIN optimiert werden kann.

[0069] Das Auswählen im Verfahrensschritt 105 und/oder das Ausführen im Verfahrensschritt 107 der Mehrzahl von Aktionsauswahlregeln π1, π2, πN kann durch eine Zeitaufteilungsfunktion 300 ausgeführt werden. Die Zeitaufteilungsfunktion 300 kann hierbei durch Techniken des maschinellen Lernens auf das Bestimmen entsprechender Ausführungsverhältnisse unter Berücksichtigung von kombinierten Steuerungszielen KPI zu bestimmen. Die Zeitaufteilungsfunktion 300 kann beispielsweise durch bestärkendes Lernen trainiert sein. Insbesondere kann die Zeitaufteilungsfunktion 300 durch ein entsprechendes trainiertes neuronales Netz 303 ausgebildet sein.

[0070] Entsprechend können die Aktionsauswahlregeln π1, π2, πN durch bestärkendes Lernen auf das Optimieren bzgl. der jeweiligen Steuerungsziele KPI1, KPI2, KPIN trainiert sein. Die Aktionsauswahlregeln π1, π2, πN können ebenfalls als entsprechend trainierte neuronale Netze ausgebildet sein.

[0071] Das Training der Zeitaufteilungsfunktion 300 bzw. der Aktionsauswahlregeln π1, π2, πN kann hierbei auf Simulationsdaten einer Simulation eines Schienenverkehrs basierend durchgeführt werden. Die Simulationsdaten können hierbei durch eine entsprechende Simulation, beispielsweise durch das Simulationsprogramm Falko, bereitgestellt werden.

[0072] Das Training der Aktionsauswahlregeln π1, π2, πN und/oder der Zeitaufteilungsfunktion 300 kann hierbei ein Maximieren einer Belohnungsfunktion umfassen, die entsprechend die jeweiligen Steuerungsziele KPI1, KPI2, KPIN oder kombinierten Steuerungsziele KPI umfassen.

[0073] Das Training der Aktionsauswahlregeln π1, π2, πN kann hierbei individuell durchgeführt werden, so dass jede Aktionsauswahlregel π1, π2, πN auf ein individuelles Steuerungsziel KPI1, KPI2, KPIN trainiert wird. Basierend auf den vortrainierten Aktionsauswahlregeln π1, π2, πN kann darauffolgend die Zeitaufteilungsfunktion 300 auf verschiedene kombinierten Steuerungsziele KPI, die jeweils unter Berücksichtigung verschiedener Gewichtungen W1, W2, WN die Steuerungsziele KPI1, KPI2, KPIN der einzelnen Aktionsauswahlregeln π1, π2, πN umfassen, auf das Bestimmen entsprechender Ausführungsverhältnisse trainiert werden.

[0074] Alternativ kann ein simultanes Training der Aktionsauswahlregeln π1, π2, πN und der Zeitaufteilungsfunktion 300 vorgenommen werden. Beim simultanen Training der Aktionsauswahlregeln π1, π2, πN und der Zeitaufteilungsfunktion 300 können somit die vortrainierten und auf die einzelnen Steuerungsziele KPI1, KPI2, KPIN optimierten Aktionsauswahlregeln π1, π2, πN auf die Erfüllung des kombinierten Steuerungsziels KPI trainiert werden, während die Zeitaufteilungsfunktion 300 trainiert wird, ein entsprechendes Ausführungsverhältnis zu bestimmen.

[0075] Das erfindungsgemäße Verfahren ist auf eine Vielzahl beliebiger Steuerungsziele KPI1, KPI2, KPIN und entsprechende kombinierte Steuerungsziele KPI und auf eine entsprechend beliebige Anzahl entsprechend trainierte Aktionsauswahlregeln π1, π2, πN anwendbar.

[0076] FIG 3 zeigt ein Diagramm einer Optimierung eines Schienenverkehrs in Bezug auf zwei Steuerungsziele (KPI1, KPI2, KPIN).

[0077] Figur 3 zeigt ein Diagramm einer Paretofront eines Schienenverkehrs, der bzgl. zwei Steuerungszielen KPI1, KPI2 gesteuert bzw. optimiert wird. Das Diagramm in Figur 3 zeigt hierbei eine prozentuale Optimierung O1 bzgl. des ersten Steuerungsziels KPI1 und eine prozentuale Optimierung O2 bzgl. des zweiten Steuerungsziels KPI2. Gezeigt sind mehrere optimierte Zustände Opt, Opt1, Opt2. Die dargestellten Punkte der Paretofront zeigen hierbei Optimierungen des Schienenverkehrs bzgl. der beiden Optimierungsziele KPI1, KPI2 für unterschiedliche Gewichtungen W2 des zweiten Steuerungsziels KPI2. Der Punkt Opt1 zeigt hierbei einen optimierten Zustand des Schienenverkehrs für eine Gewichtung W2 gleich 0 des zweiten Steuerungsziels KPI2, sodass der Schienenverkehr im gezeigten Optimierungszustand Opt1 zu 100 % bzgl. des ersten Steuerungsziels KPI1 optimiert ist. Der optimierte Zustande Opt2 zeigt hingegen eine Optimierung des Schienenverkehrs für eine Gewichtung W2 gleich 100 des zweiten Steuerungsziels KPI2, so dass in diesem optimierten Zustand der Schienenverkehr ausschließlich auf Optimierung bzgl. des zweiten Steuerungsziels KPI2 optimiert ist. Die weiteren optimierte Zustände zeigen verschiedene Verhältnisse der zwei Steuerungsziele KPI1, KPI2, die gemäß den jeweiligen Gewichtungen W1, W2 in einem kombinierten Steuerungsziel KPI zusammengefasst sind.

[0078] Im gezeigten Diagramm ist eine Optimierung des Schienenverkehrs bzgl. eines Referenzzustands Ref dargestellt, so dass die prozentualen Optimierungen O1, O2 als Verbesserungen des Schienenverkehrs bzgl. der ersten und zweiten Steuerungsziele KPI1, KPI2 in Bezug auf den Referenzzustand Ref darstellt.

[0079] Die gezeigten Zahlenwerte sind lediglich beispielhaft und stellen keine tatsächliche Optimierung eines Schienenverkehrs dar. Der dargestellte Optimierungsprozess des Schienenverkehrs kann beispielsweise eine Situation beschreiben, in der durch Betrieb der Schienenfahrzeuge der Schienenverkehr von einem vorbestimmten optimierten Fahrplan abgewichen ist, und somit durch Ausführung des erfindungsgemäßen Verfahrens und durch entsprechende Optimierung des Schienenverkehrs bzgl. der jeweiligen Steuerungsziele KPI1, KPI2, KPIN eine Verbesserung bzw. Zurückführung des Schienenverkehrs zu dem vorbestimmten optimierten Fahrplan unter Berücksichtigung der jeweiligen Steuerungsziele bewirkt werden soll.

[0080] FIG 4 zeigt eine schematische Darstellung einer zeitlichen Ausführung von zwei Aktionsauswahlregeln (π1, π2) gemäß einem Ausführungsverhältnis.

[0081] Figur 4 zeigt einen zeitlichen Verlauf einer Ausführung von zwei Aktionsauswahlregeln π1, π2, über einen Ausführungszeitraum, der in der gezeigten Ausführungsform durch eine Zykluszeit tc gegeben ist. In der gezeigten Ausführungsform wird die erste Aktionsauswahlregel π1, jeweils für eine erste Ausführungsdauer t1 ausgeführt, während die zweite Aktionsauswahlregel π2 darauffolgend für eine zweite Ausführungsdauer t2 ausgeführt wird. In der gezeigten Ausführungsform ist der Ausführungszeitraum der Zykluszeit tc jeweils in einzelne Zeitabschnitte ts ausgeführt. Die Aktionsauswahlregeln π1, π2, werden jeweils in den Zeitabschnitten ts ausgeführt und bewirken somit gemäß den jeweiligen Steuerungsaktionen Übergänge des Schienenverkehrs in verschiedene Zustände St, St+1, ..., St+9. Die Darstellung in Figur 4 zeigt ein Beispiel für ein Ausführungsverhältnis, in dem jeder Aktionsauswahlregel π1, π2, eine entsprechende Ausführungsdauer t1, t2 zugewiesen ist.

[0082] Alternativ hierzu können den gezeigten ersten und zweiten Aktionsauswahlregeln π1, π2 entsprechende Ausführungswahrscheinlichkeiten P zugeordnet werden, so dass die Aktionsauswahlregeln π1, π2 in den einzelnen Zeitabschnitten ts gemäß den jeweils zugeordneten Ausführungswahrscheinlichkeiten P ausgeführt werden.

[0083] FIG 5 zeigt eine schematische Darstellung einer Architektur für eine Zeitaufteilungsfunktion 300 gemäß einer Ausführungsform.

[0084] Figur 5 zeigt eine Architektur einer Zeitaufteilungsfunktion 300 zur Ausführung und Steuerung eines Schienenverkehrs. In der gezeigten Ausführungsfunktion wird die Zeitaufteilungsfunktion 300 zur Steuerung des Schienenverkehrs auf ein kombiniertes Steuerungsziel KPI angewendet, das mit den entsprechenden Gewichtungen W1, W2, WN versehene Steuerungsziele KPI1, KPI2, KPIN umfasst. Die Zeitaufteilungsfunktion 300 ist hierbei eingerichtet, ein Ausführungsverhältnis gemäß der in Figur 4 gezeigten Ausführungsform zu generieren, das für jede Aktionsauswahlregel π1, π2, πN eine entsprechende Ausführungsdauer ermittelt.

[0085] In der gezeigten Ausführungsform umfasst die Zeitaufteilungsfunktion 300 ein Zeitaufteilungsmodul 301 und ein Auswahlmodul 302. Das Zeitaufteilungsmodul 301 ist dazu eingerichtet, für kombinierte Steuerungsziele KPI entsprechende Ausführungsverhältnisse zu bestimmen. Das Auswahlmodul 302 ist ferner eingerichtet, basierend auf den bestimmten Ausführungsverhältnissen die jeweiligen Aktionsauswahlregeln π1, π2, πN auszuwählen. In der gezeigten Ausführungsform ist das Zeitaufteilungsmodul 301 als neuronales Netz 303 ausgebildet. Das Auswahlmodul 302 umfasst ferner in der gezeigten Ausführungsform eine Argmax-Funktion, die eingerichtet ist, die jeweiligen Aktionsauswahlregeln π1, π2, πN auszuwählen.

[0086] Neben den mit den Gewichtungen W1, W2, WN versehenen Steuerungsziele KPI1, KPI2, KPIN geht ferner ein Modulationsoperator mod als Aktivierungsfunktion in das neuronale Netz 303 des Zeitaufteilungsmoduls 301 ein. Der Modulationsoperator mod ermöglicht hierbei eine Berücksichtigung der Aufteilung der Zykluszeit tc als Ausführungszeitraum in die in Figur 4 dargestellten Zeitabschnitte ts. Abweichend zu der gezeigten Ausführungsform kann der Modulationsoperator mod als Aktivierungsfunktion auch in tieferen Schichten des neuronalen Netzes angeordnet sein. Insgesamt sind die in den Figuren 5, 6 gezeigten Strukturen der neuronalen Netze lediglich beispielhaft und beschreiben keine Strukturen tatsächlich ausführbarer neuronaler Netze.

[0087] In der gezeigten Architektur ist die Zeitaufteilungsfunktion 300 darauf trainiert, für beliebige kombinierte Steuerungsziele KPI ein entsprechendes Ausführungsverhältnis zu bestimmen, gemäß dem auf die einzelnen Steuerungsziele KPI1, KPI2, KPIN optimierten Aktionsauswahlregeln π1, π2, πN auszuführen sind.

[0088] Zur Ausführung der Zeitaufteilungsfunktion 300 und der Aktionsauswahlregeln π1, π2, πN zum Steuern eines Schienenverkehrs gemäß dem erfindungsgemäßen Verfahren 100, werden während des Betriebs des Schienenverkehrs und während des Verfahrens der Mehrzahl von Schienenfahrzeugen Zustandsdaten der Schienenfahrzeuge empfangen. Die Zustandsdaten können hierbei beispielsweise besagen, dass ein aktueller Zustand des Schienenverkehrs von einem vorbestimmten Fahrplan abweicht.

[0089] Eine Steuerung des Schienenverkehrs kann somit vorsehen, den Schienenverkehr wieder in Übereinstimmung mit dem optimierten Fahrplan zu bringen und entsprechend die Verspätungen zu reduzieren. Diese Ansteuerung kann bezüglich verschiedener Steuerungsziele KPI1, KPI2, KPIN angestrebt werden. Beispielsweise kann die Steuerung des Schienenverkehrs möglichst energiesparend angestrebt werden. Alternativ kann eine möglichst schnelle Reduktion der Verspätungen angestrebt werden.

[0090] In der gezeigten Ausführungsform wird die Steuerung des Schienenverkehrs unter Berücksichtigung eines kombinierten Steuerungsziels KPI angestrebt, das eine Mehrzahl von Steuerungszielen KPI1, KPI2, KPIN in einer bestimmten Gewichtung umfasst. Beispielsweise kann die Steuerung des Schienenverkehrs derart angestrebt werden, dass die Wiederherstellung des optimalen Fahrplans unter Berücksichtigung eines minimierten Energieverbrauchs und unter Berücksichtigung einer möglichst geringen Zeit bis zur erneuten Übereinstimmung mit dem optimierten Fahrplan erfolgt.

[0091] Zur Steuerung des Schienenverkehrs wird demnach ein entsprechendes kombiniertes Steuerungsziel KPI empfangen, das die jeweiligen angestrebten Steuerungsziele KPI1, KPI2, KPIN mit entsprechenden Gewichtungen umfasst, wobei die Gewichtungen W1, W2, WN für jedes KPI1, KPI2, KPIN eine Priorisierung innerhalb der Ansteuerung des Schienenverkehrs beschreiben.

[0092] Zur Steuerung wird die Zeitaufteilungsfunktion 300 auf das empfangene kombinierte Steuerungsziel KPI angewendet und ein entsprechendes Ausführungsverhältnis ermittelt. Das Ausführungsverhältnis gibt hierbei ein Verhältnis an, gemäß dem die zu den jeweiligen Steuerungszielen KPI1, KPI2, KPIN gehörigen bzw. auf diese optimierten Aktionsauswahlregeln π1, π2, πN auszuführen sind und gemäß dem der Schienenverkehr bezüglich der jeweiligen Steuerungsaktionen der Aktionsauswahlregeln π1, π2, πN anzusteuern ist.

[0093] Gemäß dem ermittelten Ausführungsverhältnis werden durch das Auswahlmodul 302 die entsprechenden Aktionsauswahlregeln π1, π2, πN ausgewählt und die ausgewählten Aktionsauswahlregeln π1, π2, πN auf die empfangenen Zustandsdaten des Schienenverkehrs angewendet. Das Anwenden der Aktionsauswahlregeln π1, π2, πN auf die Zustandsdaten umfasst wie oben beschrieben das Ermitteln entsprechender Steuerungsaktionen und gegebenenfalls entsprechender Ankunfts-, Abfahrts- und Standzeiten, die auf die jeweiligen Steuerungsziele optimiert sind. Jede Aktionsauswahlregel π1, π2, πN und die entsprechend durch diese ermittelbaren Steuerungsaktionen sind auf eines der Steuerungsziele optimiert.

[0094] Durch eine Ausführung einer Aktionsauswahlregel π1, π2, πN auf die Zustandsdaten des Schienenverkehrs ist die Aktionsauswahlregel π1, π2, πN in der Lage, Steuerungsaktionen zu bestimmen, die eingerichtet sind, bei Ausführung durch die Schienenfahrzeuge den Schienenverkehr aus einem aktuellen Zustand in einen Zustand zu überführen, der bezüglich des jeweiligen Steuerungsziels optimiert oder zumindest gegenüber dem zeitlichen vorangegangenen Zustand verbessert ist.

[0095] Das Ausführungsverhältnis beschreibt in der gezeigten Ausführungsform ein zeitliches Verhältnis, das jeder beteiligten Aktionsauswahlregeln π1, π2, πN eine Ausführungsdauer zuordnet, die den Zeitabschnitt angibt, während dem die jeweilige Aktionsauswahlregeln π1, π2, πN auszuführen ist. Das zeitliche Verhältnis ist hierbei derart eingerichtet, dass das jeweilige kombinierte Steuerungsziel KPI erreicht wird.

[0096] Die Steuerung des Schienenverkehrs kann zyklisch ausgeführt werden, sodass gemäß vorbestimmter Steuerzyklen Zustandsdaten und Steuerungsziele empfangen werden, die Zeitaufteilungsfunktion 300 auf die Steuerungsziele angewendet und entsprechende Ausführungsverhältnisse ermittelt werden, die entsprechenden Aktionsauswahlregeln π1, π2, πN gemäß der jeweiligen Ausführungsverhältnisse auf die empfangenen Zustandsdaten ausgeführt, entsprechende Steuerungsaktionen ermittelt werden und die Schienenfahrzeuge gemäß der Steuerungsaktionen angesteuert werden und der Schienenverkehr somit in einen bezüglich des jeweiligen Steuerungsziels optimierten oder wenigstens verbesserten Zustand überführt wird.

[0097] Die gezeigte Darstellung der Zeitaufteilungsfunktion 300 ist lediglich beispielhaft. Das darstellte neuronale Netz 301 stellt kein tatsächlich auszuführendes neuronales Netz dar.

[0098] FIG 6 zeigt eine weitere schematische Darstellung einer Trainingsarchitektur für eine Zeitaufteilungsfunktion 300 gemäß einer weiteren Ausführungsform.

[0099] Figur 6 zeigt eine weitere Ausführungsform einer Architektur für eine Zeitaufteilungsfunktion 300. In der gezeigten Ausführungsform ist die Zeitaufteilungsfunktion 300 darauf trainiert, ein Ausführungsverhältnis zu bestimmen, das für jede Aktionsauswahlregel π1, π2, πN entsprechende Ausführungswahrscheinlichkeiten P ermittelt. Abweichend zu der Ausführungsform in Figur 5 umfasst das Auswahlmodul 300 eine Softmax-Funktion 305, die eingerichtet ist, basierend auf den durch das Zeitaufteilungsmodul 301 bestimmten Ausführungswahrscheinlichkeiten P die entsprechenden Aktionsauswahlregeln π1, π2, πN auszuwählen.

[0100] Die Ausführung der Architektur erfolgt analog zur Ausführung der Architektur in Fig. 6. Anstelle der dort beschriebenen Ausführungsdauer werden in der in Fig. 7 dargestellten Architektur jedoch die verschiedenen Aktionsauswahlregeln für vorbestimmte Zeitabschnitte gemäß der durch Zeitaufteilungsfunktion 300 bestimmten Ausführungswahrscheinlichkeiten P ausgeführt.

[0101] FIG 7 zeigt ein Diagramm eines Hypervolumens HV eines Optimierungszustands eines Schienenverkehrs.

[0102] Figur 7 zeigt eine graphische Darstellung eines Hypervolumens HV für verschiedene optimierte Zustände eines bzgl. zweier Steuerungsziele KPI1, KPI2 zu optimierendem Schienenverkehr. Das Hypervolumen kann hierbei als objektive Größe zur Bestimmung der Güte eines Trainingsprozesses bzw. der Güte der Optimierungsfähigkeiten der einzelnen Aktionsauswahlregeln π1, π2, πN bzw. der Zeitaufteilungsfunktion 300 dienen.

[0103] FIG 8 zeigt eine schematische Darstellung eines Computerprogrammprodukts 40, umfassend Befehle, die bei der Ausführung des Programms durch eine Recheneinheit dieses veranlassen, das Verfahren 100 nach einer der oben genannten Ausführungsformen auszuführen.

[0104] Das Computerprogrammprodukt 400 ist in der gezeigten Ausführungsform auf einem Speichermedium 401 gespeichert. Das Speichermedium 401 kann hierbei ein beliebiges aus dem Stand der Technik bekanntes Speichermedium sein.

[0105] Obwohl die Erfindung im Detail durch das bevorzugte Ausführungsbeispiel näher illustriert und beschrieben wurde, so ist die Erfindung nicht durch die offenbarten Beispiele eingeschränkt und andere Variationen können vom Fachmann hieraus abgeleitet werden, ohne den Schutzumfang der Erfindung zu verlassen.


Ansprüche

1. Verfahren (100) zum Steuern eines Schienenverkehrs einer Mehrzahl von Schienenfahrzeugen (215), umfassend:

- Empfangen (101) von Zustandsdaten des Schienenverkehrs, wobei die Zustandsdaten Steuerungszustände des Schienenverkehrs der Mehrzahl von Schienenfahrzeugen (215) beschreiben und wenigstens Positionsdaten der Mehrzahl von Schienenfahrzeugen umfassen;

- Empfangen (103) eines Steuerungsziels (KPI1, KPI2, KPIN) zum Steuern des Schienenverkehrs der Mehrzahl von Schienenfahrzeugen (215);

- Auswählen (105) wenigstens einer Aktionsauswahlregel (π1, π2, πN) aus einer Mehrzahl von Aktionsauswahlregeln (π1, π2, πN) basierend auf dem Steuerungsziel (KPI1, KPI2, KPIN), wobei die Aktionsauswahlregeln (π1, π2, πN) eingerichtet sind, basierend auf Zustandsdaten des Schienenverkehrs Steuerungsaktionen des Schienenverkehrs zu ermitteln, wobei durch Ausführung der Steuerungsaktionen durch die Schienenfahrzeuge (215) der Schienenverkehr in einen bezüglich eines Steuerungsziels (KPI1, KPI2, KPIN) optimierten Zustand überführbar ist, wobei jede Aktionsauswahlregel (π1, π2, πN) für die Optimierung bezüglich eines individuellen Steuerungsziels (KPI1, KPI2, KPIN) eingerichtet ist, und wobei die wenigstens eine ausgewählte Aktionsauswahlregel (π1, π2, πN) für eine Optimierung bezüglich des empfangenen Steuerungsziels (KPI1, KPI2, KPIN) eingerichtet ist;

- Ausführen (107) der wenigstens einen ausgewählten Aktionsauswahlregel (π1, π2, πN) auf die empfangenen Zustandsdaten und Ermitteln von Steuerungsaktionen; und

- Bereitstellen (109) der Steuerungsaktionen zum Ansteuern der Mehrzahl von Schienenfahrzeugen (215).


 
2. Verfahren (100) nach Anspruch 1, wobei das empfangene Steuerungsziel (KPI1, KPI2, KPIN) ein kombiniertes Steuerungsziel (KPI) ist und eine Mehrzahl von Steuerungszielen (KPI1, KPI2, KPIN) umfasst, und wobei die Steuerungsziele (KPI1, KPI2, KPIN) mit individuellen Gewichtungen (W1, W2, WN) in das kombinierte Steuerungsziel (KPI) eingehen; umfassend:

- Auswählen (105) einer Mehrzahl von Aktionsauswahlregeln (π1, π2, πN), wobei jede Aktionsauswahlregel (π1, π2, πN) jeweils auf eine Optimierung bezüglich eines der Mehrzahl von Steuerungszielen (KPI1, KPI2, KPIN) des kombinierten Steuerungsziels (KPI) eingerichtet ist; und

- Ausführen (107) der Mehrzahl der ausgewählten Aktionsauswahlregeln (π1, π2, πN) gemäß einem Ausführungsverhältnis, wobei das Ausführungsverhältnis für jede ausgewählte Aktionsauswahlregel (π1, π2, πN) einen zeitlichen Anteil an einer Gesamtausführungsdauer der Mehrzahl von ausgewählten Aktionsauswahlregeln (π1, π2, πN) bestimmt, und wobei eine Ausführung der Mehrzahl von Aktionsauswahlregeln gemäß dem Ausführungsverhältnis das kombinierte Steuerungsziel (KPI) erfüllt.


 
3. Verfahren (100) nach Anspruch 2, wobei durch das Ausführungsverhältnis für jede Aktionsauswahlregel (π1, π2, πN) eine Ausführungsdauer (t1, t2) und/oder eine zeitliche Abfolge der Mehrzahl von Aktionsauswahlregeln (π1, π2, πN) bestimmt ist.
 
4. Verfahren (100) nach Anspruch 2, wobei durch das Ausführungsverhältnis für jede ausgewählte Aktionsauswahlregel (π1, π2, πN) eine Ausführungswahrscheinlichkeit (P) bestimmt ist, gemäß der die Aktionsauswahlregel (π1, π2, πN) in einem Ausführungszeitraum auszuführen ist.
 
5. Verfahren (100) nach einem der voranstehenden Ansprüche 2 bis 4, wobei die ausgewählten Aktionsauswahlregeln (π1, π2, πN) zyklisch ausgeführt werden, und wobei der Schienenverkehr gemäß der durch die Aktionsauswahlregeln (π1, π2, πN) bestimmten Steuerungsaktionen zyklisch gesteuert wird.
 
6. Verfahren (100) nach einem der voranstehenden Ansprüche, wobei das Auswählen und/oder das Ausführen der Aktionsauswahlregeln (π1, π2, πN) durch eine Zeitaufteilungsfunktion (300) ausgeführt wird, und wobei die Zeitaufteilungsfunktion (200) durch maschinelles Lernen trainiert ist, für kombinierte Steuerungsziele (KPI) entsprechende Ausführungsverhältnisse zu bestimmen.
 
7. Verfahren (100) nach einem der voranstehenden Ansprüche, wobei die Zeitaufteilungsfunktion (200) und/oder die Aktionsauswahlregeln (π1, π2, πN) durch bestärkendes Lernen trainiert sind.
 
8. Verfahren (100) nach Anspruch 7, wobei das Training der Aktionsauswahlregeln (π1, π2, πN) und/oder der Zeitaufteilungsfunktion (300) basierend auf Simulationsdaten ausgeführt wird, und wobei die Simulationsdaten auf einer Simulation eines Schienenverkehrs einer Mehrzahl von Schienenfahrzeugen (215) basieren.
 
9. Verfahren (100) nach Anspruch 7 oder 8, wobei das Training der Aktionsauswahlregeln (π1, π2, πN) und/oder der Zeitaufteilungsfunktion (300) ein Maximieren von Belohnungsfunktionen umfasst, und wobei die Belohnungsfunktionen Steuerungsziele (KPI1, KPI2, KPIN) und/oder kombinierte Steuerungsziele (KPI) definieren.
 
10. Verfahren (100) nach Anspruch 7, 8 oder 9, wobei die Aktionsauswahlregeln (π1, π2, πN) und die Zeitaufteilungsfunktionen (300) simultan trainiert werden.
 
11. Verfahren (100) nach einem der voranstehenden Ansprüche, wobei die Aktionsauswahlregeln (π1, π2, πN) und/oder die Zeitaufteilungsfunktion (300) als neuronale Netze (303) ausgebildet sind.
 
12. Verfahren (100) nach einem der voranstehenden Ansprüche, wobei Steuerungsziele (KPI1, KPI2, KPIN) umfassen: Minimierung eines Energieverbrauchs der Mehrzahl von Schienenfahrzeugen (215) und/oder Minimierung von Energieverbräuchen einzelner Schienenfahrzeuge (215) und/oder Minimierung einer Gesamtverspätung der Mehrzahl von Schienenfahrzeugen (215) und/oder Minimierung einer Maximalverspätung einzelner Schienenfahrzeuge (215) und/oder Minimierung einer quadratischen oder absoluten Abweichungssumme der Verspätungen bezüglich eines mittleren oder medianen Verspätungswerts der Mehrzahl von Schienenfahrzeugen (215).
 
13. Verfahren (100) nach einem der voranstehenden Ansprüche, wobei die Steuerungsaktionen Ankunftszeiten und/oder Abfahrtszeiten und/oder Standzeiten der Mehrzahl von Schienenfahrzeugen (215) an Haltestellen innerhalb des Schienenverkehrsnetzes umfassen.
 
14. Recheneinheit (201), wobei die Recheneinheit (201) ausgebildet ist, das Verfahren (100) zum Steuern eines Schienenverkehrs einer Mehrzahl von Schienenfahrzeugen nach einem der voranstehenden Ansprüche 1 bis 13 auszuführen.
 
15. Computerprogrammprodukt (400) umfassend Befehle, die bei der Ausführung des Programms durch eine Datenverarbeitungseinheit diese veranlassen, das Verfahren (100) zum Steuern eines Schienenverkehrs einer Mehrzahl von Schienenfahrzeugen nach einem der voranstehenden Ansprüche 1 bis 13 auszuführen.
 




Zeichnung






















Recherchenbericht









Recherchenbericht