“Ich glaube nicht, dass wir das komplette Spektrum der Data Science Applikationen im Bereich Agriculture überhaupt schon überblicken können”

By PAUL VON BÜNAU

Data Science hat das Potential, entlang der gesamten Wertschöpfungskette der Landwirtschaft für Innovationen zu sorgen. Wir haben mit Robert Berendes, Venture Partner bei Flagship Ventures und ehemaliges Vorstandsmitglied von Syngenta über Data Science und Agriculture gesprochen. Nicht erst seitdem Monsanto 2013 die “Climate Corporation” für 930 Millionen US-Dollar kaufte, steht das Thema Digital Agriculture im Fokus. Bei einer stetig wachsenden Weltbevölkerung ist das Thema Innovation zwangsläufig auf der Agenda. Welches Potential haben moderne Data Science Methoden, um auf diesem Weg zu unterstützen?

idalab: Es gibt unglaublich viele Ansatzpunkte für Data Science im Bereich Agriculture, oftmals wird Data Science gar als Treiber der Innovation bezeichnet. Wo sind Deiner Meinung nach die großen, innovativen Aspekte?

Robert Berendes: Ich glaube nicht, dass wir das komplette Spektrum der Data Science Applikationen im Bereich Agriculture überhaupt schon überblicken können. Die intelligente Datenverarbeitung zur Generierung von neuen Insights ist im Agriculture-Bereich immer noch sehr jungfräulich. Aber: Immer wenn es angewendet wird, werden wahnsinnige neue Insights kreiert.

An welche konkreten Bereiche denkst Du?

Wenn Du im landwirtschaftlichen Geschäft innovativ tätig sein möchtest, musst Du über Jahre hinweg im Feld oder Labor Versuche fahren. Nur über die Aggregation dieser Daten kommt man zu wirklichen Insights. Wenn man hier jedoch nicht nur klassische lineare Statistik anwendet, sondern andere Ambitionen hat und

mit anderen Datenmengen arbeiten kann, wäre es beispielsweise möglich, die gesamte Pflanzenphysiologie auf Basis des Genoms zu simulieren.

Da sind einige Firmen auf der Datenseite sehr gut aufgestellt, um genaue Voraussagen über das Verhalten der Pflanze im Feld zu machen. Das geht dann in einer solchen Bandbreite – also über die Simulation von Wettereinflüssen hinaus -, dass der Erkenntnisprozess bezüglich der Performance einer Pflanze maßgeblich beeinflusst werden kann.

Ein klassisches Beispiel:

Wenn ich eine neue Pflanze auf den Markt bringe, die trockenheitsresistent ist, ist eine entscheidende Frage: Unter welchen Feuchtigkeitsbedingungen wächst die Pflanze gut? Wie viel Regenmangel hält die Pflanze aus? Wie ist der Performance-Verfall bei zu viel Regen?

Die neue Pflanze soll letztlich unter allen Bedingungen besser sein, als die bisherige. Dies zu erreichen ist sehr schwierig und braucht unheimlich viele Versuche im Feld. Wenn man hier also in silico simulieren kann und über die dementsprechenden Data Science Kapazitäten verfügt, spart das unglaublich viel Zeit.

Ich denke, dass die Möglichkeiten von Data Science im Bereich Agriculture noch lange nicht ausgenutzt sind und mittelfristig zu einer massiven Beschleunigung des Entwicklungsprozesses neuer, besserer Pflanzen führen.

Ein Prozess, der sonst 6-8 Jahre in Anspruch genommen hat, kann auf Monate oder gar Wochen reduziert werden.

Wenn wir also über eine konkrete Modellbildung sprechen gibt es ja eigentlich zwei Ansätze. Man kann bottom-up versuchen, die physikalische Realität in Formeln zu gießen und dann vorherzusagen, wie sich das System abhängig vom Input verhält. Oder man kann das top-down machen, also versuchen in historischen Daten Korrelationen und Muster zu entdecken, gleichzeitig läuft man so Gefahr, eine schwer interpretierbare Black Box zu bauen. Welche Strategien werden aktuell in diesem Kontext verfolgt?

Beides sieht man aktuell in Aktion, wobei der top-down Ansatz bisher klar dominant ist. Die Schwächen des top-down Ansatzes liegen aber in den verschiedenen Hürden im Landwirtschaftsbereich, die gar nicht so einfach zu überwinden sind.

Aktuell wird eine Pflanze primär als komplette Einheit ohne Unterstruktur betrachtet. Wirkung und Reaktion werden zwar beobachtet, aber nicht auf Prozesse in der Pflanze zurückgeführt.

Meistens werden diese Reaktionen dann mit Daten aus Satelliten zu Boden, Niederschlag etc. korreliert, um Vorhersagen zu haben. Meiner Meinung nach gibt es hier jedoch nur einen geringen Erkenntnisgewinn:

Die Vorhersagen werden nämlich insbesondere dann besser, wenn die Firmen auch die exakten Daten der spezifischen Felder haben.

Aber die Bauern sind leider extrem misstrauisch, ihre Daten zu teilen. Hier sind Firmen wie John Deere, die ja die Maschinen, die solche Daten erfassen, an die Landwirte verkaufen in einer entscheidenden Position – aber auch hier werden die Daten nicht geteilt.

Ein wirklicher Durchbruch wird auch erst dann erfolgen, wenn wir den top-down und bottom-up Ansatz zusammenführen. Beim bottom-up Ansatz simuliert man die Pflanzen und dadurch braucht man auch nicht mehr so ein hohes Detaillevel an Daten für die Externalitäten. Das reicht trotzdem, um phänomenale Insights zu generieren. Hier sind wir gerade erst am Anfang einer steilen Entwicklungskurve.

Bei so einer pflanzlichen Simulation – was kann aktuell am schlechtesten simuliert werden und warum?

Das ist natürlich aktuell ein heißes Thema. Typischerweise hat man bei Pflanzen immer die genetischen Infos und man kann die kompletten physiologischen Prozesse abbilden. Es bleibt aber weiterhin einiges unklar zwischen Genotyp und Phänotyp, die Genexpression ist zum Beispiel nicht vollständig abbildbar.

Wie ist der Stand bezüglich Data Science entlang der gesamten Value Chain, also abseits vom Entwicklungsprozess?

Die Wertschöpfungskette zwischen Input Provider und Landwirt wird sich in den nächsten Jahren stark verändern. Aktuell gibt es einen riesigen Apparat, der zwischen diese beiden Parteien gespannt ist.

Es gibt Weiterverkäufer, die viel Geld damit verdienen, dem Landwirt Information, Produktauswahl und Logistik zu liefern. Für diese Dienstleistung wird eine große Marge genommen – dieser Distributionsschritt ist aber aus meiner Sicht überdimensioniert.

Wenn man diese Wertschöpfungskette mit einem Data Science Ansatz überdenkt und die Daten für den Bauern transparent verfügbar macht, kann man die Distribution auf den Kernbereich Logistik reduzieren und die Marge in Richtung Input Provider und Landwirt verschieben.

Gerade für die Bauern ist es aktuell ein wirklich unhaltbarer Zustand – die werden von den “großen Jungs” up- und downstream in die Mangel genommen und sind das schlechtbezahlteste Glied der Kette.

Ein weiterer Aspekt, den ich gerne noch anfügen möchte, bezieht sich auf das on-Farm Tooling. Hier haben Landwirte eine über Generationen hinweg akkumulierte Erfahrung bezüglich der Handhabung bestimmter Pflanzenarten. Gleichzeitig gibt es sehr viele “Agricultural Consultants” die etwas vom Kuchen abhaben wollen, aber auch nicht viel schlauer sind. Wenn man mit Data Science die Entscheidungsfindung der Bauern dramatisch verbessern kann, ist dies ein nicht zu unterschätzender Effekt. Die Bauern wollen harte Fakten sehen, Data Science kann diese belastbaren Informationen liefern.

Der Aspekt der Datenverfügbarkeit ist sehr interessant. Wie verhalten sich hier die “großen Player”? Gibt es Bestrebungen, Systeme zu etablieren, die Zugang zu diesen Daten ermöglichen?

Die großen Player sind natürlich extrem daran interessiert, die Daten vom Feld zu nutzen.

Den besten Datenzugang haben aktuell tatsächlich die Maschinenhersteller, weil deren Systeme auf dem Feld automatisch Daten erfassen können.

Gleichzeitig verkaufen die Hersteller also auch Sensorik, mit der Daten über die Pflanzen gesammelt werden sollen. Es gibt Bestrebungen diese Datenerfassung zu systematisieren, aber die Daten verbleiben meist bei den Maschinenherstellern, nur gelegentlich gibt es Partnerschaften. John Deere hat beispielsweise gerade mit DuPont Pioneer kooperiert, damit die Daten auch im Saatgut-Bereich eingesetzt werden können. Aber das sind Einzelfälle.

Was versprechen sich Saatguthersteller von den Daten?

Letztlich ist die Logik folgende: Man braucht eine Bandbreite an Technologien, um nachhaltig erfolgreich zu sein. Bestimmte Pflanzen reagieren unterschiedlich stark auf bestimmte Pestizide oder Dünger, und Schädlinge bilden über die Zeit Resistenzen. Wer zum Beispiel nur an Pestizid-Innovation arbeitet, kann irgendwann bestimmte Krankheiten nicht mehr bekämpfen. Das heißt integrierte Technologie hat einen echten Innovationsvorteil, weil sie Resistenzbildung rauszögert. Bei einem Blockbuster-Produkt, dessen Lebensdauer man so verlängert, redet man über Milliarden an zusätzlicher Wertschöpfung.

Die Innovationsgeschwindigkeit in dem Bereich ist zusätzlich nicht exponentiell. Mit einem einzelnen Tool stößt man deshalb unheimlich schnell an die Grenzen. Deshalb ist Data Science für die Kernstrategien in der modernen Agrarwelt auch so relevant: Es gibt hoch komplexe Anwendungen und Produkte, die man korrelieren muss, darum wird Digital Agriculture mehr und mehr als entscheidendes Tool gesehen, um hier erfolgreich zu sein.

Monsanto, ebenfalls ein Saatguthersteller, hat vor einigen Wochen für Schlagzeilen gesorgt, als ein Übernahmeangebot von Bayer kam. Grund für die hohe Bewertung soll auch die Technologie der “Climate Corporation” sein, ein Unternehmen das Monsanto 2013 erwarb. Ist das wirklich ein Treiber gewesen?

Hier will ich mich gerne kurz fassen. Die Technologie der “Climate Corporation” ist im wesentlichen “unproven”, die Firma ist eine der vielen, die im Bereich Digital Agriculture unterwegs sind. Ob hier wirklich die Innovation verborgen ist, bleibt abzuwarten.

Wenn wir über Innovation in der Landwirtschaft reden, scheint diese in einem R&D-lastigen Umfeld oft sehr kapitalintensiv zu sein. Wie nimmst Du das wahr, können kleine Firmen sich behaupten?

Es gibt aktuell unglaublich viel Geld, Milliarden an Venture Capital im Bereich Agriculture die zur Verfügung stehen. Aber dafür gibt es Bedingungen: Erstens, gute Ideen. Und zweitens, die Kombination von talentierten Leuten mit guten Ideen.

Man braucht definitiv weniger Geld als im Pharma-Bereich, der regulatorische Prozess ist zwar auch sehr langwierig und innovationsfeindlich; gleichzeitig ist der Prozess auf der Nicht-Pestizid-Seite viel einfacher und billiger.

Wenn man im Bereich Digital Agriculture ist, kann man bereits mit einstelligen Millionenbeträgen agieren. Hier ist einiges möglich, ohne direkt hohe Kosten zu haben.

Für zukünftige Entwicklungen scheint das Thema Data Ownership höchst relevant zu sein. Du sprachst an, dass die Maschinenhersteller hier eine gute Position haben. Wie wird sich das Geschäft mit Daten in diesem Bereich weiterentwickeln?

Meine Hypothese ist, dass der Data Input Bereich schnell kommoditisieren wird. Die Anzahl der Datenquellen wächst rasant, wenn wir allein nur neue Sensortechnologien anschauen oder auch die Möglichkeiten der Datenerfassung mit Drohnen betrachten.

Das ist aber nicht direkt umsatzrelevant, da völlig unklar ist, wie viele Daten man in Zukunft brauchen wird. Meine Vermutung deshalb: Der Preis für Daten wird weiter zurückgehen.

Ich sehe den größten Hebel in der Insight-Generierung, beim Bau der Algorithmen die zu wirklicher Wertschöpfung führen können.

Sicherlich gibt es noch die Frage, was im Bereich Data Delivery passiert. Hier ist auch viel Bewegung, aber es gibt mehr Leute, die Apps bauen können, als Personen, die belastbare Algorithmen entwickeln.

Für euch als VC, was sind die drei Kriterien nach denen ihr investiert? Gibt es da etwas Agriculture-spezifisches?

Für uns gibt es ganz grob diese Komponenten: Hat das Unternehmen einen bottom-up Ansatz? Also hat das Unternehmen die Interaktion zwischen der Pflanze und den Externalitäten in einer besonderen Weise entschlüsselt?

Kernfrage dabei: Gibt es durch das Verständnis bzw. die Modellierung auf molekularer Ebene Insights, die der Farmer auch nicht durch Erfahrungswerte abbilden kann?

Woher kommen die Daten, die genutzt werden um echte Erkenntnisse zu generieren? Wenn man auf Daten angewiesen ist, die vom Provider jederzeit abgeklemmt werden können, hat man ein essentielles Problem mit dem eigenen Geschäftsmodell. Welches Modell hat das Unternehmen, um seinen fairen Anteil an dem Gewinn durch die Insights zu bekommen?

Insbesondere der Punkt bezüglich des Geschäftsmodells ist interessant – mit welchem Framework denkst Du darüber nach?

Wenn man ein klassisches Software-Modell hat, dann zahlt der Bauer vielleicht einen Dollar pro Acre, aber hat das gesamte Risiko, ob deine große Erkenntnis, die du ihm verkaufst, sich auch materialisiert. Darum zahlt er auch so wenig und nicht die 30 Dollar, die jedoch angemessen wären, weil der Landwirt deinetwegen 100 Dollar mehr Ertrag hat.
Das ist die entscheidende Frage: Welches Geschäftsmodell hast du, das genau dies differenziert?

Da ist in der Industrie bisher kein echter Innovationsschritt da, weil das beherrschende Modell in der Agrarindustrie immer war: Der Bauer zahlt am Anfang der Saison, gegen eine Return-on-Investment Logik, die ihm vorab gezeigt wird (= “mit meinem Produkt machst du X mehr Ertrag, ich will davon x/4”).

Der Anbieter nimmt also sein Geld am Anfang der Saison und der Bauer steht im Regen. Und in der Landwirtschaft meist im wahrsten Sinne des Wortes.

Der Landwirt muss dafür Sorgen, dass dieser Mehrertrag, der ihm versprochen wurde, auch erwirtschaftet wird. Dieses Modell hat für Data Science Produkte aber natürlich massive Schwächen. Stell Dir vor, Du verkaufst nicht mehr ein physisches Produkt über dieses Modell, sondern eine Software. Da kratzt der Bauer sich nur am Kopf.

Abseits von eurem Portfolio: Was sind weitere spannende Firmen, von denen man im nächsten Jahr hören wird?

Ich nenne mal drei Firmen, die aus meiner Perspektive spannend sind, auch weil sie hinsichtlich der gerade angesprochenen Punkte einen interessanten Ansatz haben.

1. Farmers Business Network
Das Unternehmen ist aufgesetzt wie eine Kooperative, die versuchen durch das Einbinden und das Beteiligen von Farmern am Wachstum ein Community-Gefühl zu erzeugen. Die haben möglicherweise ein interessantes Geschäftsmodell entwickelt und könnten in diesem Digital Agriculture Bereich leicht einen Durchbruch erzielen, weil sie die Kunden ganz anders ansprechen, motivieren und aktivieren können.

2. AgBiome
Auch AgBiome hat ein interessantes Geschäftsmodell. Die arbeiten für verschiedene Partnerfirmen (u.a. Monsanto, Syngenta, etc.), aber lagern die Projekte in separate Unternehmenseinheiten aus. So werden die verschiedenen Projekte separiert und die Firma ist in der Lage mit einer Technologieplattform verschiedene Partner zu bedienen, die zugleich starke Wettbewerber für einander sind. AgBiome ist ebenfalls sehr innovativ aufgestellt im Hinblick auf Biopestizide.

3. VoloAgri
VoloAgri konzentriert sich auf Daten im Gemüsebereich. Gemüse ist ein sehr hochpreisiges Segment mit sehr hohen Margen in der Größenordnung 75-85%. Gemüsesaatgut ist sehr, sehr klein und hat spezielle Anforderungen in der Verarbeitung. Die Firma hat es geschafft, sehr systematisch kleine und mittelgroße Firmen im Gemüsesaatgut-Bereich aufzukaufen und quasi von 0 ein sehr wettbewerbsfähiges Unternehmen aufzubauen.

Robert, danke für das spannende und ausführliche Gespräch.

Robert Berendes ist Partner bei der Beratung a-connect, Venture Partner bei Flagship Ventures, einem VC mit Fokus im Bereich Biotechnology und Agriculture, ausserdem Operating Partner beim Private Equity Haus Paine & Partners und Board Member u.a. bei AgBiTechIndigo, und Verdesian Life Sciences.

Paul von Bünau

Managing Director

Mobile
+49 (0) 173 24 16 000

E-Mail
paul.buenau@idalab.de

Address
Potsdamer Straße 68
10785 Berlin