Auf dem Weg zu saubererem, umweltfreundlicherem und schnellerem Fahren | MIT-Nachrichten

By | May 17, 2022
Spread the love

Niemand sitzt gerne an einer roten Ampel. Aber signalisierte Kreuzungen sind nicht nur ein kleines Ärgernis für Autofahrer; Fahrzeuge verbrauchen Kraftstoff und emittieren Treibhausgase, während sie darauf warten, dass das Licht umschaltet.

Was wäre, wenn Autofahrer ihre Fahrten so planen könnten, dass sie bei Grün an der Kreuzung ankommen? Während dies für einen menschlichen Fahrer nur ein Glücksfall sein könnte, könnte es von einem autonomen Fahrzeug, das seine Geschwindigkeit mithilfe künstlicher Intelligenz kontrolliert, konsequenter erreicht werden.

In einer neuen Studie demonstrieren MIT-Forscher einen maschinellen Lernansatz, der lernen kann, eine Flotte autonomer Fahrzeuge zu steuern, wenn sie sich einer signalisierten Kreuzung nähern und diese so passieren, dass der Verkehr reibungslos fließt.

Mithilfe von Simulationen fanden sie heraus, dass ihr Ansatz den Kraftstoffverbrauch und die Emissionen reduziert und gleichzeitig die durchschnittliche Fahrzeuggeschwindigkeit verbessert. Die Technik erzielt die besten Ergebnisse, wenn alle Autos auf der Straße autonom sind, aber selbst wenn nur 25 Prozent ihren Steueralgorithmus verwenden, führt dies immer noch zu erheblichen Kraftstoff- und Emissionsvorteilen.

„Dies ist ein wirklich interessanter Ort, um einzugreifen. Das Leben von niemandem ist besser, weil er an einer Kreuzung feststeckt. Bei vielen anderen Maßnahmen gegen den Klimawandel wird ein Unterschied in der Lebensqualität erwartet, sodass dort eine Eintrittsbarriere besteht. Hier ist die Barriere viel niedriger“, sagt Seniorautorin Cathy Wu, Assistenzprofessorin für Gilbert W. Winslow Career Development am Department of Civil and Environmental Engineering und Mitglied des Institute for Data, Systems, and Society (IDSS) and the Labor für Informations- und Entscheidungssysteme (LIDS).

Die Hauptautorin der Studie ist Vindula Jayawardana, eine Doktorandin in LIDS und der Fakultät für Elektrotechnik und Informatik. Die Forschungsergebnisse werden auf der European Control Conference vorgestellt.

Komplizierte Kreuzung

Während Menschen an einer grünen Ampel vorbeifahren können, ohne groß darüber nachzudenken, können Kreuzungen Milliarden verschiedener Szenarien darstellen, abhängig von der Anzahl der Fahrspuren, der Funktionsweise der Ampeln, der Anzahl der Fahrzeuge und ihrer Geschwindigkeit, der Anwesenheit von Fußgängern und Radfahrern usw.

Typische Ansätze zum Angehen von Kreuzungssteuerungsproblemen verwenden mathematische Modelle, um eine einfache, ideale Kreuzung zu lösen. Das sieht auf dem Papier gut aus, hält aber wahrscheinlich nicht in der realen Welt, wo die Verkehrsmuster oft so chaotisch sind, wie sie kommen.

Wu und Jayawardana wechselten den Gang und näherten sich dem Problem mit einer modellfreien Technik, die als Deep Reinforcement Learning bekannt ist. Reinforcement Learning ist eine Trial-and-Error-Methode, bei der der Kontrollalgorithmus lernt, eine Abfolge von Entscheidungen zu treffen. Es wird belohnt, wenn es eine gute Sequenz findet. Beim Deep Reinforcement Learning nutzt der Algorithmus Annahmen, die von einem neuronalen Netzwerk gelernt wurden, um Abkürzungen zu guten Sequenzen zu finden, selbst wenn es Milliarden von Möglichkeiten gibt.

Dies ist nützlich, um ein solches Problem mit langem Horizont zu lösen; Der Steueralgorithmus muss einem Fahrzeug über einen längeren Zeitraum mehr als 500 Beschleunigungsbefehle erteilen, erklärt Wu.

„Und wir müssen die Reihenfolge richtig hinbekommen, bevor wir wissen, dass wir gute Arbeit geleistet haben, um die Emissionen zu mindern und mit einer guten Geschwindigkeit an die Kreuzung zu kommen“, fügt sie hinzu.

Aber es gibt eine zusätzliche Falte. Die Forscher wollen, dass das System eine Strategie lernt, die den Kraftstoffverbrauch reduziert und die Auswirkungen auf die Reisezeit begrenzt. Diese Ziele können widersprüchlich sein.

„Um die Reisezeit zu verkürzen, wollen wir, dass das Auto schnell fährt, aber um die Emissionen zu reduzieren, wollen wir, dass das Auto langsamer wird oder sich überhaupt nicht bewegt. Diese konkurrierenden Belohnungen können für den Lernagenten sehr verwirrend sein“, sagt Wu.

Obwohl es schwierig ist, dieses Problem in seiner ganzen Allgemeinheit zu lösen, wandten die Forscher eine Problemumgehung an, indem sie eine Technik verwendeten, die als Belohnungsformung bekannt ist. Mit der Belohnungsformung geben sie dem System ein gewisses Domänenwissen, das es sich nicht selbst aneignen kann. In diesem Fall bestraften sie das System, wenn das Fahrzeug vollständig zum Stillstand kam, damit es lernte, diese Aktion zu vermeiden.

Verkehrstests

Nachdem sie einen effektiven Steueralgorithmus entwickelt hatten, evaluierten sie ihn mithilfe einer Verkehrssimulationsplattform mit einer einzigen Kreuzung. Der Steueralgorithmus wird auf eine Flotte vernetzter autonomer Fahrzeuge angewendet, die mit bevorstehenden Ampeln kommunizieren können, um Signalphasen- und Zeitinformationen zu erhalten und ihre unmittelbare Umgebung zu beobachten. Der Steueralgorithmus teilt jedem Fahrzeug mit, wie es beschleunigen und verzögern soll.

Ihr System erzeugte keinen Stop-and-Go-Verkehr, als sich Fahrzeuge der Kreuzung näherten. (Stop-and-Go-Verkehr tritt auf, wenn Autos aufgrund von angehaltenem Verkehr vor ihnen gezwungen sind, vollständig anzuhalten). In Simulationen schafften es mehr Autos in einer einzigen grünen Phase, was ein Modell übertraf, das menschliche Fahrer simuliert. Im Vergleich zu anderen Optimierungsmethoden, die ebenfalls darauf ausgelegt sind, Stop-and-go-Verkehr zu vermeiden, führte ihre Technik zu größeren Kraftstoffverbrauchs- und Emissionsreduzierungen. Wenn jedes Fahrzeug auf der Straße autonom ist, kann ihr Steuerungssystem den Kraftstoffverbrauch um 18 Prozent und die Kohlendioxidemissionen um 25 Prozent senken und gleichzeitig die Reisegeschwindigkeit um 20 Prozent erhöhen.

„Ein einziger Eingriff mit 20 bis 25 Prozent weniger Kraftstoff oder Emissionen ist wirklich unglaublich. Aber was ich interessant finde und auf das ich wirklich gehofft hatte, ist diese nichtlineare Skalierung. Wenn wir nur 25 Prozent der Fahrzeuge kontrollieren, erhalten wir 50 Prozent der Vorteile in Bezug auf Kraftstoff- und Emissionsreduzierung. Das bedeutet, dass wir nicht warten müssen, bis wir zu 100 Prozent autonome Fahrzeuge erreichen, um von diesem Ansatz zu profitieren“, sagt sie.

Später wollen die Forscher Interaktionseffekte zwischen mehreren Kreuzungen untersuchen. Sie planen auch zu untersuchen, wie unterschiedliche Kreuzungskonfigurationen (Anzahl der Fahrspuren, Signale, Zeiten usw.) die Reisezeit, Emissionen und den Kraftstoffverbrauch beeinflussen können. Darüber hinaus beabsichtigen sie zu untersuchen, wie sich ihr Steuerungssystem auf die Sicherheit auswirken könnte, wenn sich autonome Fahrzeuge und menschliche Fahrer die Straße teilen. Obwohl beispielsweise autonome Fahrzeuge möglicherweise anders fahren als menschliche Fahrer, könnten langsamere Straßen und Straßen mit gleichmäßigeren Geschwindigkeiten die Sicherheit verbessern, sagt Wu.

Obwohl sich diese Arbeit noch in einem frühen Stadium befindet, sieht Wu diesen Ansatz als einen Ansatz an, der in naher Zukunft praktikabler umgesetzt werden könnte.

„Das Ziel dieser Arbeit ist es, die Nadel in nachhaltiger Mobilität zu bewegen. Wir wollen auch träumen, aber diese Systeme sind große Trägheitsmonster. Das Identifizieren von Interventionspunkten, die kleine Änderungen am System sind, aber erhebliche Auswirkungen haben, ist etwas, das mich morgens aufweckt“, sagt sie.

Diese Arbeit wurde teilweise vom MIT-IBM Watson AI Lab unterstützt.

.

Leave a Reply

Your email address will not be published.