Was kann KI – heute und morgen? – Interview mit Paul von Bünau für RETHINKING LAW

Professor Stephan Breidenbach und Dr. Paul von Bünau nähern sich in diesem Interview der Frage, was Künstliche Intelligenz heute im Kern ausmacht und was Voraussetzungen für echtes Verstehen wären. Darüber hinaus erörtern sie, welche Innovationen KI im Bereich der Rechtsdienstleistungen heute ermöglicht und welche Potenziale in Zukunft noch gehoben werden können.

Dieses Interview wurde zuerst im Fachmagazin zum digitalen Wandel im Recht, Rethinking Law, veröffentlicht. Wir stellen es hier mit freundlicher Genehmigung der Herausgeber und des Verlags zur Verfügung.

SBR: Lieber Paul, Du bist seit vielen Jahren auf KI fokussiert und in diesem Bereich vor allem auf Machine Learning spezialisiert. Mein Wunsch ist, dass Du heute kurz erklärst, was heute im Bereich KI geht und was nicht.

“Was KI heute methodisch im Kern ausmacht, sind zwei Dinge: Mustererkennung und Suche.”

PvB: Sehr gerne. Was KI heute methodisch im Kern ausmacht, sind zwei Dinge: Mustererkennung und Suche. Mustererkennung bedeutet, dass ich in großen Datenmengen Muster ableiten kann, die es mir erlauben Zusammenhänge zu erkennen und Prognosen abzugeben. Ein gutes Beispiel ist die Handschrifterkennung. Handschrift kann durch Algorithmen entziffert werden, wenn ich diese zunächst mit einer großen Menge an Bildern von handschriftlichen Zeichen ‚trainiere‘. Diese Daten müssen gelabelt sein, das heißt, mit den Trainingsbildern muss jeweils für den Computer verarbeitbar die Information verknüpft sein, was auf dem Bild zu sehen, bzw. zu lesen ist. Wenn ich dem Algorithmus nun ein neues Schriftbild vorlege, kann er eine Prognose dazu abgeben, was die Schriftzeichen wahrscheinlich für ein Wort darstellen sollen. Und je nachdem mit wie vielen Bildern der Algorithmus trainiert wurde, desto besser funktioniert das.

Diese Art der Technologie ermöglicht auch Anwendungen wie Gesichtserkennung oder Kreditscoring, teilweise auch die rein musterbasierte Übersetzung von Texten. Der andere große Bereich an Anwendungen wird auch oft in Kombination mit Mustererkennungsverfahren angewandt: Suchalgorithmen finden in einem großen Raum an Möglichkeiten, der für einen Menschen nicht leicht zu durchschauen wäre, die beste Variante. Das geht immer dann, wenn das Problem, für das ich eine optimale Lösung finden möchte, abgeschlossen und abstrakt beschreibbar ist. Spiele wie Schach oder Go eignen sich besonders gut dafür und sind diesem Verfahren sehr gut zugänglich. Für Menschen ist das Finden des Optimums sehr schwierig, weil der Möglichkeitsraum so groß ist, für Algorithmen jedoch nur eine Frage der Rechenpower. Auch ein Routing-Algorithmus, der bestimmt, wie ich am schnellsten von A nach B komme, ist im Grunde eine Suche durch den Optionenraum.

SBR: Dann ist das, was derzeit Micha Friedmann mit seinen Datenbeständen macht, mit all den Fragen an Rechtsanwälte, die beantwortet worden sind, und bei denen ihm Watson helfen will, sie zu erschließen – dann ist das im Grunde das Gleiche. Wenn jetzt eine neue Frage kommt, dann sucht Watson in diesem bereits vorhandenen Antwortraum, nach einer Antwort, die so nah wie möglich dran ist.

PvB: Genau. Das ist eine Kombination aus Musterkennung und Suche. Die meisten Mustererkennungsalgorithmen haben eine Suchkomponente. Die Schwierigkeit liegt in diesem Fall darin, annähernd so gut wie das ein junger Associate könnte, die Bedeutung einer Fallbeschreibung mit einer möglicherweise völlig anders lautenden Beschreibung des gleichen Sachverhaltes abzugleichen.

SBR: Wenn man sich vorstellt, dass Maschinen juristische Fälle lösen und Fragen beantworten – und nicht nur eine Antwort in einem existierenden Antwortuniversum suchen, sondern echte Antworten geben, – dann setzt das mindestens zwei grobe Schritte voraus. Der erste Schritt lautet: Ich muss den Sachverhalt auf Basis natürlicher Sprache verstehen. Dann muss ich daraus Schlüsse ziehen, die wiederum auf Sprache, nämlich einer Gesetzeslage, Urteilen, oder einer Kombination davon beruhen und dieses dann übereinander bringen. Das nennt der Jurist Subsumtion: den Sachverhalt unter die Norm bringen. Wenn ich das richtig verstehe, ist AI heute zu beiden Schritten noch nicht in der Lage.

PvB: So ist es. Beide Schritte sind ähnlich: Um sie umzusetzen, müsste ein Computer in der Lage sein, Texte wirklich zu verstehen. Das setzt aber voraus, dass es gelingt, Bedeutung so im Speicher eines Computers zu repräsentieren, dass auf Basis dieser Repräsentation z.B. logische Schlüsse möglich sind. Das geht heute noch nicht. Es ist allerdings möglich für standardisierte Falltypen, die durch vier oder fünf Parameter beschrieben sind, eine automatische Bearbeitung anzuschließen. Das ist beispielsweise im Fall von Flugzeugverspätungen umsetzbar.

SBR: Das, was wir bisher machen und was wir als Industrialisierung bezeichnen, gerade mit KnowledgeTools, ist ja, das wir auf Grund solcher Parameter von Hand etwas voreinstellen, was dann in einer Fertigungsstraße automatisch läuft. Du sagst, Künstliche Intelligenz bringt eventuell den Schritt dazu, dass diese Vorauswahl der Elemente aus einem Text heraus extrahiert wird.

PvB: Richtig. Derartiges würde sicherlich in der Bewerbung solcher Produkte als „Verstehen“ bezeichnet werden, hätte aber mit echtem Verstehen überhaupt nichts zu tun. Die praktischen Auswirkungen können natürlich trotzdem gigantisch sein. Gerade wenn man von Fällen spricht, die möglicherweise mit menschlicher Arbeit gar nicht mehr kostengünstig abzuarbeiten sind. Bestimmte Schadenersatzansprüche könnten so erstmals überhaupt durchsetzbar sein. Man muss unterscheiden zwischen dem Verstehen eines Falls und dem Verstehen des juristischen Wissens. Ersteres ist bei standardisierten Typen von Fällen in Grenzen möglich, letzteres noch gar nicht – auch, weil es bis jetzt an einer computerlesbaren Wissensrepräsentation mangelt.

SBR: Wagst Du eine Prognose, wann das möglich sein wird?

“Ich kenne heute noch keine methodisch-technologische Forschungsrichtung, die eines Tages voraussichtlich echtes Verstehen ermöglichen wird.”

PvB: Ich kenne heute noch keine methodisch-technologische Forschungsrichtung, die eines Tages voraussichtlich echtes Verstehen ermöglichen wird. Das sollten wir uns in 50 Jahren noch einmal anschauen. Allerdings nur, wenn wir von den Voraussetzungen ausgehen, die wir heute haben: Hauptsächlich in Texten codiertes Wissen, welches in dieser Form für Computer ganz besonders unzugänglich ist. Würde jetzt irgendeine Organisation beschließen, eine große Anzahl Juristen damit zu beauftragen, eine Repräsentation des gesamten juristischen Wissens von Hand zu bauen, wäre das wie eine Mondlandung. Dann könnte man nämlich das menschliche Wissen so an die Algorithmen herantragen, dass diese damit arbeiten können.

SBR: Der nächste Schritt ist natürlich: Wir haben keine Daten oder wir glauben keine zu haben. Ganz viele Daten, die produziert werden – wenn man allein nur an die Gerichtsurteile denkt -, verschwinden in irgendwelchen Datenbanken. Viele andere Daten über Transaktionen haben wir einfach nicht. Wir wissen nicht, was in Verträgen drin steht, weil diese ganz überwiegend nicht in computerlesbarer Form hinterlegt werden. Wenn wir über die nächsten Schritte reden, dann reden wir doch darüber, dass diese Daten ausgewertet werden und zwar mit Methoden, die aus eurem Bereich kommen.

PvB: Richtig. Um die Verträge zu strukturierten Daten zu machen – also zu einer tabellarischen Repräsentation der Kerninformation, die durch Algorithmen verarbeitbar sind – dann ist das so aufwendig, dass auch Computer dies nicht alleine schaffen. Man muss stattdessen davon ausgehen, Menschen hier algorithmisch zu unterstützen. Nur die Kerninformation extrahieren kann man hingegen in einfachen Fällen. Zum Beispiel beim Mietrecht: Kündigungsmodalitäten zu extrahieren ist inzwischen möglich. Bei komplexeren Vertragsarten, wie einem Gesellschaftervertrag für eine GmbH, wird es schon deutlich schwieriger.

SBR: Von Kevin Kelly, unserem Altmeister, habe ich mitgenommen, dass er gesagt hat, es geht nicht darum, dass ich eine große Intelligenz entwickle, die wir als künstlich bezeichnen, sondern KI an den einzelnen Stellschrauben anzuwenden. KI ist die neue Elektrizität. Andere sagen: KI ist das neue Öl. Man braucht es überall. Und wenn ich Dich richtig verstehe, überall dort, wo Daten auftauchen und eine Struktur bekommen.

“‘KI ist das neue Öl’ meint, dass man sich vom Bild der ganz großen disruptiven, kognitiven Leistung lösen sollte.”

PvB: So kann man es sehen. ‘KI ist das neue Öl’ meint, dass man sich vom Bild der ganz großen disruptiven, kognitiven Leistung lösen sollte. Es geht dann eher darum, an vielen Stellen inkrementell Prozesseffizienz zu schaffen, indem einzelne Arbeitsschritte optimiert werden können. Das ist sicherlich die Richtung, in die man stärker denken sollte, wenn man durch den Einsatz von KI bald Erfolge haben möchte.

SBR: Lass uns doch jetzt mal in die Zukunft schauen und fragen: An welchen Stellen wird für dich schon sichtbar, dass es noch nicht genutzte Potentiale gibt?

PvB: Wenn ich als Laie eine Rechtsdienstleistung einkaufen möchte, dann ist es für mich sehr interessant zu wissen, welche Erfolgsaussichten ich habe, wovon diese abhängen und mit was für Kosten ich zu rechnen habe. Das ist eine Information, die ich heute nur durch eine sogenannten kostenlose Erstberatung bekomme. Diese ist allerdings meist zu langsam und eventuell auch keine echte Beratung. Wenn ich mich selbst sachkundig mache, beispielsweise indem ich etwas google, kann ich mich aber nicht darauf verlassen, dass diese Information auch stimmt.

SBR: In einer datengetriebenen juristischen Welt wüsstest Du andererseits, wie diese oder eine ähnlich gelagerte Frage von unterschiedlichen Gerichten in der Vergangenheit zu welcher Tageszeit wie entschieden worden ist. Das kann durchaus relevant sein, denn es gibt Untersuchungen aus Amerika, die sagen, dass das Urteil von der Tageszeit und der Entfernung vom Mittagessen abhängt.

PvB: Das bringt uns zu einem Prozessschritt, den wir vorhin schon angesprochen haben. Nämlich: Der Inhalt meiner Anfrage muss verstanden, also so repräsentiert werden, das die Vergleichbarkeit gewährleistet ist. Das wird heute noch nicht mit hoher Präzision funktionieren. Stellt man sich aber einen Interaktionsmechanismus vor, der schrittweise präziser wird, indem der Algorithmus zurückfragt und damit ausgehend von einer unstrukturiert formulierten Anfrage das Thema nach und nach weiter strukturiert, ist es schon denkbar, dass man dem Algorithmus mit geringem Aufwand eine hohe Informationsqualität zur Verfügung stellen kann, so dass dann solche Vergleiche möglich werden. Das ermöglichen zum Beispiel Chatbots. Diese können erste Anfragen zunächst grob in verschiedene Kategorien einordnen, aber dann durch gezieltes Fragen den Menschen in einen Strukturierungsprozess mitnehmen, der sich nicht so anfühlt, als ob man ein großes Formular ausfüllt.

SBR: Schauen wir uns zum Schluss nochmal das Feld der Verträge an: Was werden wir alles mit Verträgen anfangen können? Wo sind die Schrauben, wo KI und Machine Learning als nächstes ansetzen?

PvB: Ich glaube, ein großes Anwendungsfeld, das bald möglich sein wird und einen großen Mehrwert hat, ist die Vertragsanalyse. Diese könnte es mir bald ermöglichen, einem Computer einen Vertrag vorzulegen und mir von diesem aufschlüsseln zu lassen, welche Klauseln in 99% Prozent der Verträgen zu finden sind, und welche 1% die sind, die ich mir noch einmal genauer anschauen sollte.

SBR: Möchtest Du uns zum Schluss eine generelle Prognose zum Rechtssystem mit auf den Weg geben? Sind die Entwicklungen für dich dystopisch? Oder versprichst du dir eine Steigerung von Qualität und Zugang zum Recht?

“Heutzutage Gesetze in Text zu schreiben ist wie die Bibel nur auf Latein zugänglich zu machen.”

PvB: Ich glaube, für manche Rechtsanwälte kann es durchaus dystopisch sein – ganz einfach weil sie vielleicht nicht mehr in der Lage sein werden, so deutlich mit ihrer Leistung zu verdienen. Ich glaube gesamtgesellschaftlich ist es dringend notwendig, dass wir durch das Schaffen von Transparenz, Klarheit und kostengünstigen Antworten breiteren Zugang zu rechtlicher Unterstützung bekommen, damit die Leute, die eigentlich Recht haben, dieses auch praktisch bekommen können. Das wiederum muss sicherlich bei der Gesetzgebung anfangen. Heutzutage muss man als Kapitalgesellschaft seine Bilanz als XML-Datei abgeben, weil auf Basis dieser strukturierten Form algorithmisch operiert werden kann. Meiner Ansicht nach müssten auch Gesetze in einer abstrakten “Programmiersprache” formuliert werden, denn dann könnte man sie einer Wissensbasis zugänglich machen. Heutzutage Gesetze in Text zu schreiben ist wie die Bibel nur auf Latein zugänglich zu machen. Der demokratisierende Effekt wird dabei nicht durch die Formulierung in einer Programmiersprache erreicht, sondern durch das was dann folgen kann: algorithmisch unterstütze Rechtsdienstleistungen zu demokratisierten Preisen.

SBR: Vielen Dank für das Gespräch.

——-

Dr. Paul von Bünau ist Geschäftsführer bei idalab, einer in Berlin ansässigen, 2003 gegründeten Agentur für Data Science, die sich auf Maschinelles Lernen, Künstliche Intelligenz, mathematische Modellierung und Data Strategy spezialisiert hat. idalab berät eine Vielzahl von Kunden im Bereich Bankwesen, Mobilität, Biotechnologie, im digitalen Sektor und darüber hinaus. Paul von Bünau studierte Mathematik, Informatik und Physik und promovierte im Bereich Statistische Datenanalyse.

Prof. Dr. Stephan Breidenbach ist Professor für Mediation an der Universität Wien und Professor für Bürgerliches Recht, Zivilprozessrecht und Internationales Wirtschaftsrecht an der Europa-Universität Viadrina in Frankfurt (Oder). In Zusammenhang mit seiner Beschäftigung mit Legal Tech hat er das LegalTech Center, welches einmal im Jahr die Berlin Legal Tech Konferenz ausrichtet, mitgegründet. Stephan Breidenbach ist einer der Autoren und Herausgeber des „Rechtshandbuch Legal Tech“ (C.H.Beck Verlag, Januar 2018), an welchem auch Paul von Bünau als Autor eines Kapitels beteiligt war.

——-

Feature Image: Fragment of the ‘Codex Regius’, Greek uncial manuscript of the New Testament (8th Century).

Share