Science
06.02.2018

Simulierter Wurm lernt, einen Stab zu balancieren

Forscher der TU-Wien haben das Nervensystem eines Fadenwurms im Computer simuliert und das virtuelle Wurmgehirn gelehrt, einen Stab zu balancieren.

Die Wissenschaftler haben den Fadenwwurm C. elegans als Vorlage für ihr virtuelles Wurmnervensystem herangezogen. Das Nervensystem dieses primitiven Tiers besteht nur aus 302 Neuronen und ist deshalb bestens erforscht. Das macht es einfach zu simulieren, was etwa auch vom Open Worm Project ausgenutzt wird (siehe futurezone-Interview). Die Wiener Forscher haben dieses einfache Nervennetzwerk im Computer nachgebildet und ihm beigebracht, einen Stab auf der zugehörigen virtuellen Schwanzspitze zu simulieren.

Das ist ein Trick, den C. Elegans in der Natur üblicherweise nicht aufführt. Das Nervensystem des Wurms verarbeitet lediglich einfache Reize und lässt den Wurm etwa in eine andere Richtung kriechen, wenn er auf ein Hindernis stößt. Diese Reflexe sind in den Verbindungen zwischen den Nervenzellen festgeschrieben. „Die Aufgabe, die der Wurm mit diesem einfachen Schaltkreis löst, hat Ähnlichkeit mit einem klassischen Problem aus der Technik – dem Balancieren eines Stabs“, sagt Ramin Hasani vom Institut für Technische Informatik der TU Wien.

Lernender Wurm

Die Forscher der TU wollten herausfinden, ob sie durch Änderungen an der Gewichtung der Verbindungen in einem simulierten Wurmnervensystem auch komplexere Aufgaben wie das Balancieren eines Stabs lösen können. Durch dereartige Modifikationen an der Vernetzung lernen Tiere und Menschen auch in der Natur. "Mit Hilfe von „bestärkendem Lernen“ (reinforcement learning), einer speziellen Methode aus dem Bereich des maschinellen Lernens, wurde das künstliche Reflex-Netzwerk am Computer trainiert und optimiert“, erklärt Radu Grosu.

Durch Anwenden dieser Methode hat das Wurmgehirn im Computer tatsächlich gelernt, den Stab im Gleichgewicht zu halten. Die Forscher mussten die nötigen Reaktionen auf Veränderungen des Schwerpunkts nicht ins System schreiben. Sie gaben dem Modell lediglich das Ziel vor, den Rest hat es sich durch Versuch und Irrtum nach und nach selber beigebracht. „Das Ergebnis ist ein Controller, der ein reales technisches Problem lösen kann – nämlich das Stabilisieren eines balancierten Stabs. Doch kein Mensch hat je eine Zeile Code dieses Controllers programmiert, er entstand einfach durch Trainieren eines biologisch entstandenen Nervensystems“, sagt Mathias Lechner.

Die Wiener Informatiker wollen solche aus der Biologie entlehnten Systeme weiter erforschen und so herausfinden, wo die Grenzen zwischen biologischen und technischen Schaltungen liegen.