KI-Agenten mit Weitblick – Visual Intelligence im Zeitalter der Agents

März 16, 2026

Michael Fleischman ist CTO und Co-Founder von OpenSpace

Seit einiger Zeit beschäftige ich mich damit, wie man die Bedeutung von Reality Capture im sogenannten „Agentic Age“, dem Zeitalter der KI-Agenten, greifbar erklären kann, besonders für die Realwirtschaft: Bauwesen, Energie, industrielle Prozesse und ähnliche Bereiche. Die Technologie entwickelt sich rasant, und lange hat mir ein klarer Ansatz gefehlt – eine Perspektive, die verständlich macht, warum visuelle, räumliche Daten aus der realen Welt ins Zentrum dieser Diskussion gehören und nicht nur am Rand stehen.

Vor ein paar Monaten hat es dann plötzlich Klick gemacht. Ich habe Flüge zu einer Konferenz in Amsterdam gebucht und bin dabei auf ein Problem gestoßen, das keine Reise-App für mich lösen konnte. Ich reise nämlich etwas anders als die meisten: Wenn ich beruflich nach Europa fliege, ist mir oft egal, in welche Stadt genau. Wichtig ist mir nur, dass der Langstreckenflug von Kalifornien nach Europa nonstop ist. Diese rund zehn Stunden ununterbrochene Zeit sind mir viel wert. Genau danach zu suchen ist allerdings aufwendig und bedeutet viel Hin- und Her zwischen verschiedenen Tabs. Kurz gesagt: Es kostet Zeit und Arbeit. Also habe ich diesmal versucht, mir mit Vibe Coding selbst eine Lösung zu bauen. Und tatsächlich: Nach ein paar Stunden (und ein paar Tokens) hatte ich eine eigene Flug-Suchmaschine, die genau das gemacht hat, was ich wollte.

Was mich daran besonders beschäftigt hat (abgesehen davon, wie gut Vibe Coding inzwischen funktioniert), war die Frage, wer daran eigentlich Geld verdient hat. Denn am Ende gab es nur zwei Unternehmen, bei denen ich tatsächlich bezahlt habe: erstens die Vibe-Coding-Plattform (die einen Großteil dieses Geldes an das Foundation-Model-Unternehmen weitergibt) und zweitens das Unternehmen, das die Flugdaten bereitgestellt hat. Ohne diese Daten hätte die KI nichts tun können. Genau das war die Perspektive, die mir zuvor gefehlt hatte: In diesem neuen Zeitalter der KI-Agenten gewinnt Datenqualität. Und im Bauwesen gibt es keine wertvolleren Daten als die aus der realen Welt.

My vibe-coded travel buddy

Mein vibe-coded Travel Buddy

Daten, die die Realität abbilden, setzen sich durch

KI ist nur so gut wie die Daten, mit denen sie arbeitet. Und die Gewinner im Zeitalter der KI-Agenten werden nicht nur die Anbieter der Modelle sein – sondern vor allem die Unternehmen, die über umfangreiche, schwer reproduzierbare Daten verfügen.

Im Bauwesen geht es dabei um Daten aus der realen Welt: eine visuelle Dokumentation dessen, was tatsächlich auf der Baustelle passiert. OpenSpace baut diese Datenbasis seit fast einem Jahrzehnt kontinuierlich auf – heute umfassen sie über 6 Milliarden Quadratmeter erfasster Baustellendaten aus mehr als 95.000 Projekten in 132 Ländern.

Und je leistungsfähiger KI-Agenten werden, desto wertvoller werden genau diese Daten.

Agenten mit Augen

Bei OpenSpace beschäftigen wir uns intensiv mit der Frage, was es bedeutet, KI-Agenten zu entwickeln, die wirklich auf Daten aus der realen Welt basieren. Agenten, die nicht nur Fragen zu Dokumenten beantworten, sondern tatsächlich sehen, was auf der Baustelle passiert, und darauf reagieren können. Dieses Konzept nennen wir „Agenten mit Augen“.

An einem konkreten Beispiel möchte ich zeigen, wie das in der Praxis funktioniert.

Agent zur Prüfung offener Aufgaben

Vibe Coding eines Agenten mit Augen

Alles begann mit einer einfachen Anfrage eines Kunden. Ein Subunternehmer hatte eine große Anzahl offener Aufgaben erzeugt, die nie geschlossen wurden. Der Kunde wollte einen Agenten, der diese offenen Aufgaben am Ende der Woche (oder auch täglich, zum Beispiel während der Abnahmephase) automatisch zusammenstellt, strukturiert und übersichtlich für eine schnelle Durchsicht aufbereitet. An sich eine einfache Aufgabe.

Gemeinsam mit dem Kunden haben wir diesen Agenten auf Basis unserer bestehenden OpenSpace-APIs entwickelt. Jede Woche ruft der Agent alle offenen Aufgaben ab, verortet sie im Grundriss und stellt sie in einer einfachen Benutzeroberfläche dar. So können sie Schritt für Schritt durchgegangen und einzeln bearbeitet werden. Nützlich, aber noch nichts Besonderes: Im Grunde eine Aufgabe, die auch ein engagierter Praktikant in der ersten Woche für die Bauleitung übernehmen könnte. Anstatt eine Person mit dieser Aufgabe zu beschäftigen, und ihre Zeit für wichtigere Aufgaben freizumachen, wurde dieser Agent in wenigen Stunden per Vibe Coding erstellt und individuell auf den Nutzer zugeschnitten.

Das war Phase eins.

In Phase zwei wird es spannend.

Da dieser Kunde seine Baustelle regelmäßig mit OpenSpace erfasst, haben wir eine vollständige räumliche Historie jedes Bereichs im Projekt. Mit weniger als einer Stunde zusätzlichem Aufwand haben wir den Agenten erweitert: Neben dem ursprünglichen Aufgaben-Foto zieht er nun automatisch die aktuellste 360°-Aufnahme genau dieser Stelle heran und ermöglicht so einen direkten Vorher-Nachher-Vergleich. Plötzlich kann die prüfende Person direkt vom Schreibtisch aus erkennen, ob das Problem auf der Baustelle tatsächlich behoben wurde. Unser „Praktikant“ hat damit gewissermaßen ein fotografisches Gedächtnis und übernimmt Aufgaben, die sonst eher ein Projektingenieur erledigen würde.

In Phase drei zeigt sich dann das volle Potenzial solcher Agenten.

Sobald der Agent Zugriff auf diese Vorher-Nachher-Bilder hatte, haben wir ihm die Fähigkeit gegeben, selbst Entscheidungen zu treffen. Mithilfe unseres feinabgestimmten VLM (Vision Language Model) kann der Agent nun beide Bilder analysieren und bewerten, ob eine Aufgabe als gelöst gilt. Er kann diese Aufgabe sogar eigenständig schließen – ganz ohne menschliche Prüfung.

Was als einfacher wöchentlicher Datenabruf begann, hat sich zu einem Agenten entwickelt, der echte autonome Entscheidungen treffen kann und dabei kognitive Arbeit übernimmt, sodass sich Menschen auf das konzentrieren können, was sie am besten können: Gebäude bauen.

Genau das wird möglich, wenn man Agenten „Augen“ gibt. Agenten, die direkt Arbeitskosten senken können, vielleicht zum ersten Mal überhaupt in der Bautechnologie. Dazu werden wir in Zukunft noch mehr teilen. Und das alles wurde in wenigen Stunden umgesetzt, vollständig per Vibe Coding und in direkter Zusammenarbeit mit einem Kunden. Kein monatelanger Entwicklungszyklus. Keine Abstimmung über Roadmaps. Ein reales Problem, gelöst an einem einzigen Tag.

Die nächste Stufe: Die OpenSpace Agent Sandbox

A glimpse of the future?

Ein Blick in die Zukunft?

Der Issue-Review-Agent ist kein einmaliges Experiment. Er zeigt, wohin sich die Bautechnologie entwickelt: Kunden werden selbst zu Entwicklern.

Die Zeit, in der man Feature Requests einreicht und darauf wartet, dass ein Anbieter die passende Lösung entwickelt, geht zu Ende. Stattdessen entsteht etwas deutlich Stärkeres: Kunden, die beschreiben können, was sie brauchen, und innerhalb weniger Stunden eine Lösung erhalten, die exakt auf ihr Projekt, ihre Abläufe und ihr Team zugeschnitten ist.

Um das zu ermöglichen, entwickeln wir die OpenSpace Agent Sandbox – eine dedizierte Umgebung, mit der sich Agenten einfach erstellen, ausführen und kontinuierlich weiterentwickeln lassen, basierend auf Daten aus der realen Welt. Die Agent Sandbox bietet Kunden und Partnern Zugriff auf räumlich angereicherte Daten über die OpenSpace Spatial APIs, in einer Form, die gezielt für die Entwicklung von Agenten konzipiert ist.

Und wir stehen erst am Anfang.

Das Zeitalter der KI-Agenten ist da. Erfolgreich werden vor allem die Unternehmen sein, die über die besten, umfangreichsten, vollständigsten und aktuellsten Daten verfügen.

Im Bauwesen zählen Daten aus der realen Welt und die Plattform dafür ist OpenSpace.

Über den Autor

Michael Fleischman ist CTO und Co-Founder von OpenSpace. Auf der Autodesk DevCon 2026 in Amsterdam sprach er über das Thema „Agenten mit Augen“ im Zeitalter der KI-Agenten.

Insights|Produkte & Technologie|Unternehmen
Loading form...

Artikel lesen