Landwirtschaft und Data Science: Interview mit Robert Berendes – Teil 1

Data Science hat das Potential, entlang der gesamten Wertschöpfungskette der Landwirtschaft für Innovationen zu sorgen. Wir haben mit Robert Berendes, Venture Partner bei Flagship Ventures und ehemaliges Vorstandsmitglied von Syngenta über Data Science und Agriculture gesprochen.

Nicht erst seitdem Monsanto 2013 die “Climate Corporation” für 930 Millionen US-Dollar kaufte, steht das Thema Digital Agriculture im Fokus. Bei einer stetig wachsenden Weltbevölkerung ist das Thema Innovation zwangsläufig auf der Agenda. Welches Potential haben moderne Data Science Methoden, um auf diesem Weg zu unterstützen?

Robert Berendes ist Partner bei der Beratung a-connect, Venture Partner bei Flagship Ventures, einem VC mit Fokus im Bereich Biotechnology und Agriculture, ausserdem Operating Partner beim Private Equity Haus Paine & Partners und Board Member u.a. bei AgBiTech, Indigo, und Verdesian Life Sciences. Er war zuvor Head of Business Development und Vorstandsmitglied beiSyngenta, einem Agrarkonzern aus der Schweiz mit besonderem Schwerpunkt im Bereich Saatgut und Pflanzenschutz. Frühere Stationen machte er u.a. als Partner bei der Managementberatung McKinsey.

idalab: Es gibt unglaublich viele Ansatzpunkte für Data Science im Bereich Agriculture, oftmals wird Data Science gar als Treiber der Innovation bezeichnet. Wo sind Deiner Meinung nach die großen, innovativen Aspekte?

Robert Berendes: Ich glaube nicht, dass wir das komplette Spektrum der Data Science Applikationen im Bereich Agriculture überhaupt schon überblicken können. Die intelligente Datenverarbeitung zur Generierung von neuen Insights ist im Agriculture-Bereich immer noch sehr jungfräulich. Aber: Immer wenn es angewendet wird, werden wahnsinnige neue Insights kreiert.

idalab: An welche konkreten Bereiche denkst Du?

Robert Berendes: Wenn Du im landwirtschaftlichen Geschäft innovativ tätig sein möchtest, musst Du über Jahre hinweg im Feld oder Labor Versuche fahren. Nur über die Aggregation dieser Daten kommt man zu wirklichen Insights. Wenn man hier jedoch nicht nur klassische lineare Statistik anwendet, sondern andere Ambitionen hat und mit anderen Datenmengen arbeiten kann, wäre es beispielsweise möglich, die gesamte Pflanzenphysiologie auf Basis des Genoms zu simulieren. Da sind einige Firmen auf der Datenseite sehr gut aufgestellt, um genaue Voraussagen über das Verhalten der Pflanze im Feld zu machen. Das geht dann in einer solchen Bandbreite – also über die Simulation von Wettereinflüssen hinaus -, dass der Erkenntnisprozess bezüglich der Performance einer Pflanze maßgeblich beeinflusst werden kann.

Ein klassisches Beispiel: Wenn ich eine neue Pflanze auf den Markt bringe, die trockenheitsresistent ist, ist eine entscheidende Frage: Unter welchen Feuchtigkeitsbedingungen wächst die Pflanze gut? Wie viel Regenmangel hält die Pflanze aus? Wie ist der Performance-Verfall bei zu viel Regen? Die neue Pflanze soll letztlich unter allen Bedingungen besser sein, als die bisherige. Dies zu erreichen ist sehr schwierig und braucht unheimlich viele Versuche im Feld. Wenn man hier also in silico simulieren kann und über die dementsprechenden Data Science Kapazitäten verfügt, spart das unglaublich viel Zeit.

plant-1474807_1920
Ich denke, dass die Möglichkeiten von Data Science im Bereich Agriculture noch lange nicht ausgenutzt sind und mittelfristig zu einer massiven Beschleunigung des Entwicklungsprozesses neuer, besserer Pflanzen führen. Ein Prozess, der sonst 6-8 Jahre in Anspruch genommen hat, kann auf Monate oder gar Wochen reduziert werden.

idalab: Wenn wir also über eine konkrete Modellbildung sprechen gibt es ja eigentlich zwei Ansätze. Man kann bottom-up versuchen, die physikalische Realität in Formeln zu gießen und dann vorherzusagen, wie sich das System abhängig vom Input verhält. Oder man kann das top-down machen, also versuchen in historischen Daten Korrelationen und Muster zu entdecken, gleichzeitig läuft man so Gefahr, eine schwer interpretierbare Black Box zu bauen. Welche Strategien werden aktuell in diesem Kontext verfolgt?

Robert Berendes: Beides sieht man aktuell in Aktion, wobei der top-down Ansatz bisher klar dominant ist. Die Schwächen des top-down Ansatzes liegen aber in den verschiedenen Hürden im Landwirtschaftsbereich, die gar nicht so einfach zu überwinden sind. Aktuell wird eine Pflanze primär als komplette Einheit ohne Unterstruktur betrachtet. Wirkung und Reaktion werden zwar beobachtet, aber nicht auf Prozesse in der Pflanze zurückgeführt. Meistens werden diese Reaktionen dann mit Daten aus Satelliten zu Boden, Niederschlag etc. korreliert, um Vorhersagen zu haben. Meiner Meinung nach gibt es hier jedoch nur einen geringen Erkenntnisgewinn:

Die Vorhersagen werden nämlich insbesondere dann besser, wenn die Firmen auch die exakten Daten der spezifischen Felder haben. Aber die Bauern sind leider extrem misstrauisch, ihre Daten zu teilen. Hier sind Firmen wie John Deere, die ja die Maschinen, die solche Daten erfassen, an die Landwirte verkaufen in einer entscheidenden Position – aber auch hier werden die Daten nicht geteilt.

Ein wirklicher Durchbruch wird auch erst dann erfolgen, wenn wir den top-down und bottom-up Ansatz zusammenführen. Beim bottom-up Ansatz simuliert man die Pflanzen und dadurch braucht man auch nicht mehr so ein hohes Detaillevel an Daten für die Externalitäten. Das reicht trotzdem, um phänomenale Insights zu generieren. Hier sind wir gerade erst am Anfang einer steilen Entwicklungskurve.

idalab: Bei so einer pflanzlichen Simulation – was kann aktuell am schlechtesten simuliert werden und warum?

Robert Berendes: Das ist natürlich aktuell ein heißes Thema. Typischerweise hat man bei Pflanzen immer die genetischen Infos und man kann die kompletten physiologischen Prozesse abbilden. Es bleibt aber weiterhin einiges unklar zwischen Genotyp und Phänotyp, die Genexpression ist zum Beispiel nicht vollständig abbildbar.

idalab: Wie ist der Stand bezüglich Data Science entlang der gesamten Value Chain, also abseits vom Entwicklungsprozess?

Robert Berendes: Die Wertschöpfungskette zwischen Input Provider und Landwirt wird sich in den nächsten Jahren stark verändern. Aktuell gibt es einen riesigen Apparat, der zwischen diese beiden Parteien gespannt ist. Es gibt Weiterverkäufer, die viel Geld damit verdienen, dem Landwirt Information, Produktauswahl und Logistik zu liefern. Für diese Dienstleistung wird eine große Marge genommen – dieser Distributionsschritt ist aber aus meiner Sicht überdimensioniert. Wenn man diese Wertschöpfungskette mit einem Data Science Ansatz überdenkt und die Daten für den Bauern transparent verfügbar macht, kann man die Distribution auf den Kernbereich Logistik reduzieren und die Marge in Richtung Input Provider und Landwirt verschieben. Gerade für die Bauern ist es aktuell ein wirklich unhaltbarer Zustand – die werden von den “großen Jungs” up- und downstream in die Mangel genommen und sind das schlechtbezahlteste Glied der Kette.

Ein weiterer Aspekt, den ich gerne noch anfügen möchte, bezieht sich auf das on-Farm Tooling. Hier haben Landwirte eine über Generationen hinweg akkumulierte Erfahrung bezüglich der Handhabung bestimmter Pflanzenarten. Gleichzeitig gibt es sehr viele “Agricultural Consultants” die etwas vom Kuchen abhaben wollen, aber auch nicht viel schlauer sind. Wenn man mit Data Science die Entscheidungsfindung der Bauern dramatisch verbessern kann, ist dies ein nicht zu unterschätzender Effekt. Die Bauern wollen harte Fakten sehen, Data Science kann diese belastbaren Informationen liefern.

—-
Den zweiten Teil des Interviews publizieren wir an dieser Stelle in der nächsten Woche.

Contact the author
Paul von Bünau
+49 (30) 814 513-14
Subscribe
Share

Leave a Comment

Your email address will not be published. Required fields are marked *