Storys & Hindergründe

ChatGPT Choreographie für Drohnenschwärme: KI-gestützte Inszenierung von Flugrobotern

Die TUM-Professorin setzt ChatGPT ein, um Choreographien für Drohnenschwärme zu entwerfen. Der Artikel beschreibt den Workflow von Idee über Simulation bis zur Live-Umsetzung, beleuchtet Sicherheitsprüfungen und zeigt, wie künstlerische Visionen mit technischer Präzision verschmelzen.

ChatGPT Choreographie für Drohnenschwärme: TUM-Methoden für kreative Drohnenformationen

Schnelle Antworten

Wie funktioniert SwarmGPT, um Drohnenschwärme zur Musik zu choreografieren?
SwarmGPT nutzt ein ChatGPT-Interface, um aus einem Musiktitel und Regeln Formationen als Textvorschläge zu erzeugen. Danach prüft ein Sicherheitsalgorithmus die Flugbahnen und korrigiert sie, bevor die Drohnen im realen Raum fliegen. Im TUM-Labor wird die Choreografie zunächst in der Simulation validiert, dann folgt der Realflug.
Welche Rolle spielt der Sicherheitsfilter bei der Drohnen-Choreografie?
Ohne den Sicherheitsfilter ist die Kollisionserkennung unvollständig, sodass etwa jede vierte Show unfallfrei bleibt. Mit dem zusätzlichen Sicherheitsalgorithmus werden die Vorführungen im Laborbetrieb nach TUM-Angaben heute zu 100 Prozent kollisionsfrei. Der Filter bügelt typische LLM-Fehler aus und hält Mindestabstände sowie Dynamikgrenzen ein.
Wie läuft der Ablauf im TUM-Labor ab – vom Prompt bis zum Startflug?
Sie wählen im Webinterface einen Musiktitel, beschreiben die gewünschte Show und ergänzen Regeln, zum Beispiel „Starte im Kreis, dann Wellenbewegung“. ChatGPT schlägt daraufhin eine Choreografie vor, ein Planungsalgorithmus validiert in der Simulation die Trajektorien. Erst wenn der Vorschlag passt, wird die Sequenz „eingeloggt“ und die Drohnen heben synchron ab.
Wie schnell ist eine neue Drohnen-Show einsatzbereit?
Im TUM-Labor ist eine 30-Sekunden-Choreografie für drei Drohnen in rund fünf Minuten ab Prompt flugfähig. Mit mehr Drohnen steigt die Rechen- und Planungszeit spürbar, weil mehr Konflikte eingeplant und gegebenenfalls umgeplant werden müssen.
Wie gut skaliert das System mit der Anzahl der Drohnen im Labor?
Die Demonstration ist laborintern bis zu neun Drohnen zuverlässig belegt (Stand 2025). Die Skalierung hängt vor allem von der Komplexität der gewünschten Formationen ab, weil enge Übergänge mehr Replanning auslösen. Außerdem steigt mit der Anzahl der Flugroboter das Konfliktpotenzial.
Lässt sich die SwarmGPT-Idee auf andere Roboter übertragen?
Grundsätzlich ja, aber außerhalb der TUM-Drohnen-Demos liegen die berichteten Trefferquoten noch deutlich niedriger: etwa 63 Prozent beim Greifen, 56 Prozent beim Kabel legen und 80 Prozent beim Tür öffnen. Für robuste Alltagsanwendungen braucht es daher zusätzliche Absicherung, insbesondere einen Safety Layer zwischen Sprache und physischer Aktion.

TUM zeigt: ChatGPT Choreographie für Drohnenschwärme

Die Technische Universität München (TUM) entwickelt eine ChatGPT Choreographie für Drohnenschwärme, die Musikstücke in koordinierte Flugmuster übersetzt und dabei einen Sicherheitsfilter nutzt, um Kollisionen zu vermeiden. Das Team um Prof. Angela Schoellig demonstriert damit, dass Large Language Models (LLMs) wie ChatGPT in der Robotik praktisch einsetzbar sind – Stand 2025 im Laborbetrieb mit bis zu neun Quadrocoptern.

Wie funktioniert die ChatGPT Choreographie für Drohnenschwärme?

ChatGPT erzeugt eine Abfolge von Formationen passend zur Musik, ein Sicherheitsalgorithmus prüft und korrigiert die Flugbahnen, erst danach fliegen die Drohnen im realen Raum. Der Mensch gibt die Aufgaben per Texteingabe vor, zusätzliche Prompts verfeinern Tempo, Formationen und Übergänge.

Im TUM-Labor wählt Doktorand Martin Schuck einen Musiktitel, beschreibt im Webinterface die gewünschte Show und ergänzt Regeln (z. B. „Starte im Kreis, dann Wellenbewegung“). ChatGPT schlägt daraufhin eine Choreografie vor. Ein ergänzender Planungsalgorithmus validiert die einzelnen Trajektorien auf Machbarkeit und Mindestabstände. Gefällt der Vorschlag in der Simulation, wird die Sequenz „eingeloggt“ – kurz darauf heben im Learning Systems and Robotics Lab sechs handtellergroße Quadrocopter ab und fliegen synchron zur Musik.

Der Versuchsraum ist etwa 40 Quadratmeter groß und drei Meter hoch. Sechs Decken-Kameras verfolgen 200-mal pro Sekunde die Positionen der Drohnen, abgeglichen mit den Sollwerten der Choreografie. So entstehen stabile, reproduzierbare Flugshows – bislang zuverlässig mit bis zu neun Drohnen.

Die Rolle des Sicherheitsfilters

Ohne den Sicherheitsfilter bleibt die Kollisionserkennung lückenhaft: Nur etwa jede vierte Show läuft dann unfallfrei durch. Mit dem Zusatzalgorithmus sind die Vorführungen im Laborbetrieb nach Angaben der TUM heute zu 100 Prozent kollisionsfrei. Der Filter bügelt typische LLM-Fehler aus – etwa zu enge Kurvenradien, unrealistische Beschleunigungen oder gegensinnige Diagonalen ohne Höhenabstand – und replantet Bahnen so, dass Mindestabstände, Dynamikgrenzen und Synchronität eingehalten werden.

Was ist SwarmGPT – und wie sicher ist das System?

SwarmGPT ist die von Prof. Schoellig benannte Kombination aus ChatGPT-Interface und Sicherheitsfilter, die als Mensch–Roboter-Schnittstelle und als Trajektorienplaner fungiert. Im TUM-Setup erreicht SwarmGPT laborintern eine sehr hohe Zuverlässigkeit, weil riskante Manöver automatisch entschärft werden.

SwarmGPT übernimmt zwei Aufgaben zugleich: Es generiert natürliche, musikgetriebene Formationsideen in Textform und überführt sie – nach automatischer Validierung – in physikalisch zulässige Flugbahnen. Für Nicht-Expertinnen und Nicht-Experten bedeutet das: Sie müssen keine Codezeile schreiben. In der Praxis hat sich gezeigt, dass selbst komplexe Übergänge (zum Beispiel entgegengesetzte Diagonalen oder dichte Kreisformationen) stabil funktionieren, sobald der Filter sie freigibt.

  • Interface: Texteingabe/Prompts statt Programmcode
  • Sicherheit: Automatische Kollisionvermeidung und Dynamiklimits
  • Transparenz: Vorab-Simulation auf dem Bildschirm, danach Realflug
  • Skalierung: Laborerprobt mit bis zu neun Drohnen (Stand 2025)

Wie schnell entstehen neue Shows – und wie gut skaliert das?

Eine 30-Sekunden-Choreografie für drei Drohnen ist im TUM-Labor in rund fünf Minuten einsatzbereit; mit mehr Drohnen steigt die Rechen- und Planungszeit spürbar. Das Konzept gilt als grundsätzlich skalierbar, weil der Sicherheitsfilter kollisionsreiche Passagen automatisiert umplant.

Vor der LLM-Ära wurden Choreografien mühsam von Hand entwickelt. Laut Prof. Schoellig dauerte es früher Jahre, bis erste Sequenzen mit sechs Drohnen zuverlässig liefen. Heute experimentiert das Team innerhalb von drei Monaten mit über 30 Shows für bis zu neun Drohnen. Die Skalierung hängt primär von zwei Faktoren ab: von der Komplexität der gewünschten Formation (viele enge Übergänge = mehr Replanning) und von der Anzahl der beteiligten Flugroboter (N²-Potenzial für Konflikte). Aus Redaktionssicht ist das Tempo der Iteration der größte operative Gewinn – schnelle Probe–Fehler–Korrektur-Zyklen führen sichtbar zu reiferen Shows.

Lässt sich der Ansatz auf andere Roboter übertragen?

Ja, aber die Erfolgsquoten liegen außerhalb der TUM-Drohnen-Demos aktuell noch deutlich niedriger: Berichtet werden Trefferquoten von etwa 63 Prozent (Greifen), 56 Prozent (Kabel legen) und 80 Prozent (Tür öffnen). Für robuste Alltagsanwendungen ist daher zusätzliche Absicherung nötig.

Die TUM-Forschung zielt darauf, das Sprach-Interface als universelle Brücke zum Roboter zu nutzen. Entscheidend ist dabei der „Safety Layer“ zwischen natürlicher Sprache und physischer Aktion. Erst wenn Domänenwissen (z. B. Greifkräfte, Toleranzen, Kollisionräume) fest im Planer verankert ist, nähert sich die Zuverlässigkeit dem Drohnen-Niveau an. Perspektivisch könnten Saugroboter oder kollaborative Industriegeräte per Sprachanweisung umprogrammiert werden – mit automatischem Übersetzen in sichere Trajektorien und Workflows.

Was bedeutet das für Smart Home und Entertainment?

Für Heim- und Event-Szenarien öffnet der Ansatz zwei Türen: intuitive Steuerung und verlässliche Sicherheit. Im Smart-Home-Kontext ist das heute eher ein Blick nach vorn als ein Produktversprechen – stationäre Haushaltsroboter profitieren künftig von Sprach-Interfaces, sofern ein Sicherheits- und Kontextmodell mitschwingt. Im Entertainment-Bereich sind Indoor-Drohnenshows mit geprüften Bahnen schon jetzt realistisch, vor allem in kontrollierten Umgebungen (Marker, Motion-Capture, definierte Startplätze).

Aus Redaktionssicht empfehle ich, Sprach-Interfaces immer mit klaren „Leitplanken“ zu kombinieren: feste No-Go-Zonen, definierte Geschwindigkeits- und Höhenlimits, fail-safe-Strategien bei Signalverlust. Das TUM-Setup zeigt, wie so etwas aussehen kann – mit Kameratracking bei 200 Hz, markierten Startpositionen und einem Filter, der jede Formation an die Physik zurückbindet.

Ein Blick ins Labor: Zahlen und Rahmenbedingungen

Die aktuelle Demonstration im Learning Systems and Robotics Lab der TUM läuft unter folgenden Bedingungen (Stand 2025):

  • Raum: ca. 40 m² Fläche, 3 m Höhe, klar definierter Flugkorridor
  • Tracking: sechs Decken-Kameras mit 200 Hz Positions-Feedback
  • Drohnen: handtellergroße Quadrocopter, präzise Startkreuze am Boden
  • Team: Prompting durch Forschende, automatische Validierung vor jedem Realflug
  • Leistungsbild: stabile Shows mit bis zu neun Drohnen, bei drei Drohnen ca. fünf Minuten vom Prompt bis zur flugfähigen 30-Sekunden-Sequenz
  • Sicherheit: ohne Filter etwa 25 Prozent unfallfreie Shows, mit Filter laborintern 100 Prozent kollisionsfrei

Fazit

Die TUM demonstriert mit SwarmGPT, dass eine ChatGPT Choreographie für Drohnenschwärme praxistauglich werden kann – dank Sicherheitsfilter, der LLM-Vorschläge in physikalisch saubere Flugbahnen überführt. Im Labor entstehen 30-Sekunden-Shows mit drei Drohnen in etwa fünf Minuten, zuverlässig skaliert bis neun Geräte. Für andere Robotersparten sind die Erfolgsquoten noch gemischt, doch das Prinzip – Sprache plus Safety Layer – weist den Weg. Für Smart Home und Entertainment heißt das: Sprachnahe Robotik rückt näher, wenn Sicherheit von Anfang an mitgeplant wird.

Innovationen in der Technologie beeinflussen nicht nur unseren Alltag, sondern auch kreative Prozesse, wie die Choreographie mit Flugrobotern zeigt. Diese spannende Verschmelzung von Kreativität und Technik öffnet neue Perspektiven und Möglichkeiten für die Nutzung von KI in verschiedenen Bereichen. Ähnliche innovative Ansätze finden sich auch im Bereich des Smart Living, wo intelligente Systeme dazu beitragen, das Leben komfortabler und effizienter zu gestalten.

Ein Beispiel für solche Innovationen ist die Smart Home Zukunft. Hier werden Visionen und Trends vorgestellt, die das Wohnen von morgen prägen könnten. Von automatisierten Haushaltsgeräten bis hin zu energieeffizienten Lösungen, die Technologie entwickelt sich stetig weiter, um unseren Wohnkomfort zu verbessern und gleichzeitig umweltfreundlich zu sein.

Ein weiteres faszinierendes Feld ist die Smart Garden Technologie. Diese ermöglicht eine effiziente Bewässerung und Pflege von Pflanzen durch intelligente Systeme, die den Bedarf genau analysieren und automatisch reagieren. So wird nicht nur Wasser gespart, sondern auch die Pflanzenpflege optimiert, was zu einem blühenden und gesunden Garten führt.

Zuletzt darf die Rolle der KI im Bereich der Sicherheit nicht unterschätzt werden. Die Haustiersicherheit Smart Home bietet wertvolle Tipps, wie intelligente Technologien eingesetzt werden können, um die Sicherheit unserer vierbeinigen Freunde zu gewährleisten. Kameras, Bewegungssensoren und automatische Fütterungssysteme sind nur einige Beispiele, wie Smart Home Technologien das Zusammenleben mit Haustieren sicherer und angenehmer machen können.

Diese Beispiele zeigen, wie die Integration von KI und smarten Technologien nicht nur in der Unterhaltung und im Alltag, sondern auch in spezialisierten Bereichen wie der Gartenpflege und Haustiersicherheit innovative Lösungen bietet, die unser Leben bereichern und vereinfachen.

Einmal die Woche das, was wirklich neu ist.

Keine Pressemitteilungen, keine Rabatt-Schleudern. Eine knappe Übersicht der Tests, Hintergründe und Werkzeuge, die wir selbst in der Redaktion nutzen.