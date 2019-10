Wie funktioniert es, diese Masse an Informationen über Moral, Werte, Gesetze, einer Maschine beizubringen?

Es gibt in der KI-Forschung zwei Zugänge. Der erste ist ein rein maschineller, bei dem der Roboter einfach nur beobachtet, wie Menschen sich verhalten. Davon lernt er, wie er sich selbst verhalten soll. Der Zugang ist rein beobachtungsbasiert und problematisch, weil man von dem, was ist, nicht das, was sein soll, ableiten kann. Das haben die Philosophen schon gesagt. Und wenn er jetzt jemanden beobachtet, der eine Handlung setzt, weiß er nicht, ob diese optional ist, also er sie auch hätte auslassen können oder ob sie vorgeschrieben ist.

Können Sie das mit einem Beispiel erklären?

Die Maschine kann unter Umständen Inferenzen machen – wenn alle auf der rechten Seite vom Gehsteig gehen, ist es vielleicht eine Vorschrift. Es stellt sich dann heraus, es ist keine Vorschrift, sondern eine Konvention. Sie kann also schon auf der linken Seite gehen. Wenn aber alle in der Einbahn in eine Richtung einfahren, dann ist das eine Regel. Und die darf sie nicht übertreten.

Wie kann der Roboter das unterscheiden?

Von der Beobachtung allein ist das ziemlich schwierig. Wir haben uns angeschaut, ob man Sanktionen und Bestrafungen einsetzen kann, um festzustellen, ob etwas vorgeschrieben oder nur erlaubt ist. Wenn jemand beispielsweise beim Gehen auf der linken Seite aufgehalten würde und eine Strafe bekäme, dann könnte man davon ableiten, dass es offensichtlich eine Vorschrift war. Der Roboter lernt, was man in einer Situation am besten macht. Das Problem ist: wenn man ein System fragt, warum es auf der linken Seite gegangen ist, kann es das nicht beantworten. Es hat nur gelernt. In dem Kontext macht man das. Und wenn es eine Übertretung begeht, kann es auch nicht sagen, warum das falsch war. Weil es das Gesetz selbst nicht repräsentiert und nicht einbauen kann in der Entscheidungsfindung.

Welche Lösung gibt es da?

Grundsätzlich gibt es einen Zugang, der nennt sich implizit. Auf Englisch: Value Alignment, ein Ausrichten der Werte, obwohl die Systeme keine Werte an sich haben. Die lernen Verhaltensmuster. Unser Zugang ist explizite Repräsentationen zu verwenden, das heißt, wir haben Regeln, die gelten in bestimmten Situationen und werden explizit im System repräsentiert.

Wie kann man das verstehen?

Zum Beispiel darf man in einer Einbahnstraße nur in eine Richtung fahren. Das System weiß das. Doch was passiert, wenn ihm ein anderes Auto in dieser Einbahn entgegenkommt und es einen Unfall gebe – es aber rückwärts fahren könnte? Soll es das machen? Hier haben wir einen Regelkonflikt, denn das System weiß: in einer Einbahn fährt man nur in eine Richtung. Es kommt aber ein Auto aus der anderen Richtung und es weiß: Unfälle soll es vermeiden, weil die verursachen Schaden – Menschen können sterben. Da muss das System abwägen können. Welche der Regel ist wichtiger?