Author Archives: Christian Bürckert

Ein Echtzeit-Strategiespiel im Browser. Ohne Framework. Mit KI.

Ein komplettes Echtzeit-Strategiespiel.
Im Browser.

Kein Framework.
Kein Build-Tool.
Kein npm install.

Nur eine index.html, etwas CSS und rund 3.000 Zeilen Vanilla JavaScript.

Entwickelt im Dialog mit Claude Code.
Und das Ergebnis überrascht selbst.

Die Inspiration

Die Idee war eine Mischung aus Age of Empires II, The Settlers und einem Hauch Civilization VI.
Nicht als Kopie, sondern als Essenz.

Die wirtschaftliche Tiefe von The Settlers.
Das militärische Tempo von Age of Empires.
Die strategische Perspektive eines Civilization.

Reduziert auf das Wesentliche und umgesetzt als Single-Page-App.

Was technisch drin steckt

Das Spiel generiert eine Hex-Grid-Karte prozedural. Wälder, Seen, Goldadern, Steinbrüche, Wüsten. Jede Partie beginnt anders.

Es gibt sechs Zeitalter, von der Stammeszeit bis zur Kaiserzeit. Fortschritt ist nicht nur optisch, sondern verändert Wirtschaft, Militär und Spieltempo.

Das Wirtschaftssystem basiert auf echten Transportwegen. Holzfäller schlagen Bäume, Bauern bestellen Felder, Händler bewegen Ressourcen. Wo Händler häufig laufen, entstehen Trampelpfade. Die Welt speichert ihr Verhalten.

Die Welt ist dynamisch:

Bäume wachsen nach
Fische regenerieren sich
Felder müssen neu bestellt werden

Militärisch stehen Miliz, Schwertkämpfer, Bogenschützen, Reiterei und Belagerungseinheiten bereit. Mauern, Tore, Brücken, Häfen und Markthandel erweitern die taktischen Möglichkeiten.

Ein KI-Gegner baut parallel eine eigene Wirtschaft auf und greift an. Keine statische Skript-Logik, sondern ein System mit eigenem Ressourcenfluss.

Dazu kommen:

Autosave
Minimap
Einheitengruppen
Prozeduraler Sound über die Web Audio API
Hintergrundmusik mit Suno generiert

Alles ohne externe Abhängigkeiten. Keine Engine. Keine Bibliotheken. Keine Toolchain.

Warum das spannend ist

Früher hätte ein solches Projekt Monate oder Jahre bedeutet. Setup, Tooling, Architektur, Iterationen.

Heute verschiebt sich die Grenze zwischen Idee und Umsetzung spürbar.
Nicht, weil Code trivial geworden ist. Sondern weil sich die Art der Zusammenarbeit verändert.

Mit KI-Unterstützung entsteht Software im Dialog.
Man beschreibt ein System, bekommt eine erste Version, refaktoriert gemeinsam, diskutiert Datenstrukturen, optimiert Logik und erweitert Mechaniken. Iteration wird extrem schnell.

Dieses Spiel ist kein Produkt.
Kein Monetarisierungsmodell.
Kein Jira-Board.

Es ist ein Experiment.

Ein Experiment, wie weit man mit klarer Architektur, strukturiertem Denken und KI-Unterstützung kommen kann, wenn man sich einfach einen Tag Zeit nimmt und baut.

🎮 Direkt spielen: https://christian.buerckert.eu/zeitalter-der-siedler/

Warum die aktuelle Diskussion über Entwickler nicht nur KI-Panik ist

Die Idee, Entwickler könnten bald ersetzt werden, taucht in regelmäßigen Wellen auf. In den 60er Jahren hieß es, höhere Programmiersprachen würden das Problem lösen. Später sollten CASE-Tools, dann No-Code-Plattformen, dann Outsourcing den Bedarf an spezialisierten Entwicklern drastisch senken. Jedes Mal wurde es einfacher, Software zu produzieren. Und jedes Mal verschwand die Komplexität nicht, sie verlagerte sich nur.

Heute trägt diese alte Erzählung ein neues Gewand. Generative KI kann in Sekunden Code erzeugen, Tests schreiben, Refactorings vorschlagen. Gleichzeitig verlieren Junior-Entwickler und Regular-Entwickler spürbar an Marktwert, weil viele klassische Einstiegsaufgaben automatisierbar geworden sind. Und selbst erfahrene Entwickler werden in Deutschland entlassen, häufig aus Kostengründen oder aufgrund strategischer Fehlentscheidungen im Bezug auf KI.

Das wirkt wie ein Widerspruch. Wenn alles automatisiert wird, warum bleiben echte Seniors rar? Warum sind Architekten, die Systeme verstehen, weiterhin so gefragt?

Die Antwort ist unspektakulär, aber entscheidend: Werkzeuge reduzieren Oberflächenarbeit. Sie eliminieren keine Komplexität. Software ist kein Textproblem. Sie ist ein Strukturproblem.

Und genau dort trennt sich gerade der Markt.

Was gerade wirklich an Wert verliert

An Wert verliert vor allem reine Codeproduktion ohne strukturelles Denken.

Ein einfaches Beispiel:

Prompt:
„Erstelle mir eine REST API mit Spring Boot für Benutzerverwaltung.“

Das Ergebnis ist meist funktional:

Controller
Service
Repository
CRUD-Endpunkte

Alles läuft. Tests vielleicht auch.

Aber was fehlt oft?

Keine klare Trennung zwischen Domain und Infrastruktur
Geschäftslogik im Controller
Direktzugriff auf JPA-Entities im API-Layer
Keine expliziten Ports
Keine durchdachte Fehlerstrategie

Kurzfristig sieht das produktiv aus. Langfristig entsteht Kopplung, die jede Erweiterung teuer macht. Auch mit KI. Wenn ein Junior nur lernt, so etwas zu generieren und zu akzeptieren, wird er austauschbar. Die KI liefert denselben Output.

Was stattdessen wertvoll wird

Wertvoll wird die Fähigkeit, Systeme zu formen.

1. Ports und Adapter wirklich verstehen

Nehmen wir dasselbe Beispiel, aber strukturiert gedacht.

Statt direkt auf JPA im Controller zuzugreifen, wird eine Domain-Schicht gebaut:

public interface UserRepository {
    Optional<User> findById(UserId id);
    void save(User user);
}

Das ist ein Port.

Die JPA-Implementierung ist nur ein Adapter:

@Repository
class JpaUserRepository implements UserRepository {
    // mapping between JPA entity and domain
}

Der Controller spricht nicht mit JPA, sondern mit einem Use Case:

public class CreateUserUseCase {
    private final UserRepository repository;

    public void execute(CreateUserCommand command) {
        User user = User.create(command);
        repository.save(user);
    }
}

Plötzlich entsteht:

Entkopplung
Testbarkeit ohne Datenbank
Austauschbarkeit der Persistenz
Klar definierte Verantwortlichkeiten

Eine KI kann diesen Code erzeugen. Aber nur, wenn jemand versteht, warum er so aussehen sollte.

2. Dependency Inversion bewusst einsetzen

Viele KI-generierte Lösungen hängen direkt an Frameworks:

@Service
public class PaymentService {
    @Autowired
    private StripeClient stripeClient;
}

Das sieht harmlos aus, koppelt aber die Fachlogik direkt an Stripe. Sauber gedacht würde man stattdessen ein Port definieren und dann eine Stripe-Adapter.

public interface PaymentGateway {
    PaymentResult charge(Money amount);
}

class StripePaymentGateway implements PaymentGateway {
    // Stripe specific logic
}

Jetzt hängt die Domain nicht mehr an Stripe. Sie hängt an einer Abstraktion. Das ist kein akademisches Detail. Das ist strategische Beweglichkeit.

3. Modularisierung statt Ordnerstruktur

Viele Projekte nennen sich „modular“, sind aber nur nach Technik sortiert:

controller
service
repository
dto

Echte Modularisierung schneidet nach fachlichen Grenzen:

billing
user-management
reporting
notification

Jedes Modul hat:

eigene Use Cases
eigene Ports
eigene Adapter

Abhängigkeiten zeigen nur in eine Richtung. Das erfordert Denken. Und genau das wird gerade wertvoll.

4. KI richtig einsetzen

KI ist kein Ersatz für Architektur. Sie ist ein Beschleuniger. Statt zu sagen: „Schreib mir einen Service.“ Sagt man besser: „Erzeuge eine Clean-Architecture-Struktur mit klar getrenntem Domain-Kern, Ports für Persistenz und Messaging, Adapter im Infrastruktur-Layer, keine Framework-Abhängigkeiten im Domain-Modul.“ Der Unterschied im Output ist dramatisch. KI verstärkt Präzision. Sie verstärkt aber auch Unschärfe. Wer nur delegiert, produziert strukturelle Schulden in Rekordgeschwindigkeit.

Was Junioren konkret tun sollten

Architektur lesen, nicht nur Tutorials konsumieren
Clean Architecture, Hexagonal Architecture, modulare Monolithen wirklich durcharbeiten.
Refactoring üben
Einen schlecht strukturierten Code bewusst in saubere Module überführen.
Tests ernst nehmen
Nicht nur happy path, sondern Verhalten absichern.
Domänenmodelle bauen
Geschäftslogik explizit modellieren statt in Services zu verteilen.
KI als Sparringspartner nutzen
Code generieren lassen, dann kritisch zerlegen:
- Wo ist Kopplung?
- Wo sind implizite Annahmen?
- Wo wird Infrastruktur in die Domain gezogen?
Verantwortung übernehmen
Architekturfragen stellen.
Abhängigkeiten hinterfragen.
Schnittstellen sauber definieren.

Warum das gerade die Chance ist

Der Markt selektiert gerade brutal, aber klar. Reiner Output verliert an Wert. Systemdenken gewinnt an Wert. Junioren, die sich jetzt in saubere Abhängigkeitsstrukturen, Modularisierung und Architektur vertiefen, entwickeln sich schneller in Richtung Senior als es früher möglich war. Nicht über Jahre von Tickets, sondern über bewusstes Strukturtraining. KI nimmt einfache Arbeit weg. Sie zwingt aber auch dazu, das Wesentliche zu lernen.

Und das Wesentliche war noch nie das Tippen von Code.
Es war immer das Entwerfen von Systemen.

Der Unterschied zwischen Entwickeln und Liefern

Software ist erst dann etwas wert, wenn sie benutzt wird. Alles davor ist Vorbereitung.

Dieser Satz klingt banal, trifft aber einen Nerv, weil ein Großteil dessen, was im Alltag als gute Softwareentwicklung gilt, genau an dieser Stelle endet. Code existiert, Konzepte sind sauber, Architekturen durchdacht, Tests fast vollständig. Und trotzdem bleibt das Ergebnis seltsam folgenlos. Es funktioniert, aber es wirkt nicht.

Entwickeln bewegt sich im Möglichkeitsraum. Solange entwickelt wird, ist alles noch verhandelbar. Abstraktionen lassen sich verbessern, Entscheidungen vertagen, Alternativen offenhalten. Entwickeln ist ein Zustand, in dem man intelligent sein darf, ohne sich festzulegen. Genau deshalb fühlt er sich produktiv an, auch wenn am Ende noch nichts nutzbar ist.

Liefern ist das Gegenteil. Liefern zwingt zur Festlegung. Es verlangt, Entscheidungen zu schließen, Unschärfen zu akzeptieren und Verantwortung für einen Zustand zu übernehmen, der nun real ist. Ab diesem Moment gehört Software nicht mehr dem Entwickler, sondern den Nutzern, dem Betrieb, dem System. Fehler werden sichtbar, Annahmen überprüfbar, Qualität messbar. Liefern macht Software angreifbar.

Der bekannte 80:20-Grundsatz ist hier kein Methodenwissen, sondern ein Charaktertest. Fast jeder Entwickler kennt ihn, viele können ihn erklären, aber nur wenige setzen ihn um, wenn es darauf ankommt. Denn 80:20 heißt nicht, schlampig zu arbeiten, sondern bewusst auf die letzten zwanzig Prozent Perfektion zu verzichten, um achtzig Prozent Wirkung zu erreichen. Das erfordert keine zusätzliche Technik, sondern Entscheidungskraft.

Typisch ist der Zustand des formalen Unfertigseins. Funktional ist alles vorhanden, aber Tests sind noch nicht ganz rund, Dokumentation existiert nur implizit, Konfiguration liegt im Kopf einzelner Personen, Betriebsannahmen sind nicht explizit gemacht. Das System läuft, aber nur, solange die richtigen Menschen verfügbar sind. Es ist gebaut, aber nicht übergeben.

Liefern bedeutet, diesen Zustand bewusst zu verlassen. Es heißt, Dinge so abzuschließen, dass andere sie nutzen können, ohne Rückfragen, ohne implizites Wissen, ohne Abhängigkeit vom Erbauer. Fertig heißt nicht perfekt, sondern stabil genug, um realen Betrieb auszuhalten. Alles Weitere entsteht aus Nutzung, nicht aus weiterer Theorie.

Gerade sehr gute Entwickler scheitern an dieser Schwelle. Wer viel weiß, sieht viele Risiken, viele Alternativen und viele offene Enden. Ohne die Fähigkeit, bewusst zu stoppen, wird Wissen zur Ausrede, nicht zu liefern. Das System bleibt im Entwicklungszustand, elegant, aber folgenlos.

An genau dieser Stelle zeigt sich Seniorität. Nicht im Umfang des Wissens, nicht in der Raffinesse der Lösung, sondern in der Fähigkeit, Verantwortung zu übernehmen. Ein Senior erkennt, wann Entwickeln aufhören muss, damit Liefern beginnen kann. Er akzeptiert, dass reale Nutzung härter, aber ehrlicher ist als jede weitere Optimierung.

Organisationen belohnen diesen Unterschied oft falsch. Technische Brillanz ist sichtbar, Abschluss ist leise. Konzepte beeindrucken, Übergaben fallen erst auf, wenn sie fehlen. So entsteht ein Umfeld, in dem Entwickeln gefeiert wird und Liefern als selbstverständlich gilt, obwohl genau dort der eigentliche Wert entsteht.

Der Unterschied zwischen Entwickeln und Liefern ist deshalb kein Detail und keine Methodendiskussion. Er ist ein Reifegrad. Entwickeln zeigt, was jemand kann. Liefern zeigt, wofür jemand bereit ist einzustehen. Erst wenn beides zusammenkommt, entsteht Software, die nicht nur gebaut wurde, sondern wirklich existiert.

Ein stabiler IPv4- und IPv6-Tunnel über Hetzner

Multi-WAN ohne Prefix-Chaos mit PFSENSE und HETZNER

Sobald im Heimnetz zwei verschiedene Internetanschlüsse zusammenkommen, entsteht ein Problem, das sich bei IPv4 elegant durch NAT versteckt, bei IPv6 aber offen zutage tritt. Beide Leitungen liefern unterschiedliche globale Präfixe, die jeweils an das jeweilige Provider-Netz gebunden sind. Ein Gerät, das ein IPv6-Paket über die erste Leitung verschickt, muss den Rückverkehr zwingend über genau diese Leitung empfangen. Diese strikte Bindung an den Ursprungs-Prefix gehört zum Kernprinzip von IPv6, das ohne NAT auskommt und den globalen Routingpfad offenlegt.

Sobald jedoch zwei WANs mit zwei verschiedenen Präfixen gleichzeitig aktiv sind, beginnt sich das Netz selbst zu widersprechen. Ein Client bekommt mehrere globale IPv6-Adressen aus beiden Präfixen, und die pfSense kann zwar entscheiden, welcher Upstream aktuell aktiv ist, aber sie darf das dazugehörige Präfix nicht dynamisch ersetzen. Die von den Clients verwendeten Adressen bleiben für viele Stunden gültig. Ein schnelles Wegschalten ist im IPv6-Standard nicht vorgesehen, da Router Advertisements große Zeitfenster haben und Adressen nicht spontan wegfallen sollen. Damit verliert der Rückweg den Bezug zur Quelle, und Verbindungen brechen ab, sobald die pfSense bei Ausfall eines WANs auf den anderen umschaltet.

Diese Situation lässt sich nicht mit Routenregeln, Gateway-Gruppen oder Failover-Mechanismen umgehen, da das Problem auf der Adresslogik selbst beruht. IPv6 verlangt für stabile Rückwege einen klaren, konsistenten Präfix-Ursprung. Genau deshalb scheitert klassisches Multi-WAN mit wechselnden Präfixen, während IPv4 dank NAT unbeeindruckt bleibt und einfach die Quelladresse umschreibt, sodass der Rückweg immer passt.

Die Lösung besteht darin, sich einen stabilen, unabhängigen Punkt zu schaffen, von dem der globale IPv6-Präfix kommt. Ein kleiner Hetzner-Server übernimmt diese Rolle. Er trägt das IPv6-Präfix dauerhaft und übersetzt gleichzeitig IPv4. Die pfSense verbindet sich nur noch per WireGuard-Tunnel mit ihm, und beide lokalen WANs dienen lediglich als Transportweg. Damit wird das gesamte Netz stabil, unabhängig davon, welche Leitung gerade aktiv ist.

1. Hetzner-Server vorbereiten

Debian 13 Mini, WireGuard und Prefix-Weitergabe

Der Server bildet den ruhenden Pol in der Architektur. Er hält die IPv6-Adresszone bereit und sorgt dafür, dass IPv4 sauber ins Internet übersetzt wird, unabhängig davon, welche Leitung zuhause aktiv ist.

WireGuard installieren und konfigurieren

Unter /etc/wireguard/wg0.conf:

[Interface]
Address = 10.0.1.1/24,fc00:1::1/64
ListenPort = 51820
PrivateKey = *****

[Peer]
PublicKey = SvJSW0lqfyrGTpMrYKkrF6WSMSy+WpoI6k9OOk4IO1U=
AllowedIPs = 192.168.1.0/24,10.0.1.2/32,fc00:1::2/128,2a01:<...hetzner präfix...>::/64

Das interne Tunnelnetz (10.0.1.0/24 und fc00:1::/64) verbindet den Server klar mit der pfSense. Zusätzlich wird das globale IPv6-/64 dem Peer bekannt gemacht.

ND-Proxy einrichten

Da Hetzner nur eine /128 am Interface vergibt, übernimmt ndppd die Antwort auf Neighbor-Discovery-Anfragen für das gesamte Präfix:

Konfiguration in /etc/ndppd.conf:

route-ttl 30000
proxy eth0 {
    rule 2a01:4f8:c010:8b3a::/64 {
        static
    }
}

Damit können alle Adressen aus dem Präfix verwendet werden, ohne dass sie direkt am Interface liegen.

IPv6-Adresse auf /128 setzen

In /etc/network/interfaces:

iface eth0 inet6 static
    address 2a01:4f8:c010:8b3a::1/128

Der Server hat so eine klare, feste Adresse, während das Präfix selbst durch ndppd verwaltet wird.

IPv4-Masquerading aktivieren

Damit das gesamte IPv4-LAN über den Tunnel sauber ins Internet gelangt, wird NAT in Richtung Hetzner-Interface aktiviert:

iptables -t nat -A POSTROUTING -o eth0 -j MASQUERADE

Die Regel bleibt dauerhaft aktiv und sorgt dafür, dass der Rückverkehr immer beim Server endet, unabhängig vom Zustand der heimischen WANs.

Damit ist der Server fertig.

2. pfSense vorbereiten

Zwei WANs, ein Tunnel, kein eigenes NAT mehr

Die pfSense verwendet ihre beiden WANs nur noch dazu, den Tunnel aufrechtzuerhalten. Der eigentliche Internetverkehr wird durch WireGuard transportiert. Alle Schritte beziehen sich auf das Menü der pfSense.

WAN-Konfiguration

Richtet die beiden WAN Schnittstellen ein. Bei mir WAN1 WAN2. Lasst die IPv6 Config einfach leer. Nutzen wir nicht. Dann auf:

Ort: System → Routing → Gateways

Beide WAN-Gateways werden auf IPv4 gestellt. Der Haken „Kill states when gateway is down“ sorgt dafür, dass Sessions beim Umschalten direkt sauber neu aufgebaut werden.

Gateway-Gruppe

Ort: System → Routing → Gateway Groups

Eine Gruppe mit beiden WANs, z. B. WAN1 als Tier 1 und WAN2 als Tier 2. Diese Gruppe wird später die Default-Route der pfSense. Damit springt der Tunnel automatisch auf die gerade funktionierende Leitung.

NAT deaktivieren

Ort: Firewall → NAT → Outbound

Outbound-Modus auf „Disabled“ setzen.
Die pfSense übernimmt kein NAT mehr, da das Hetzner-System diese Rolle zuverlässig übernimmt.

3. WireGuard auf pfSense

Tunnel aufbauen und als neues Gateway nutzen

Erst unter Packages “Wireguard” installieren.

Tunnel konfigurieren

Ort: VPN → WireGuard → Tunnels

Ein neues Tunnelinterface anlegen, z. B. WG-Hetzner, mit diesen Adressen:

10.0.1.2/24
fc00:1::2/64

Das Gegenstück zeigt auf die externe IPv4 vom Hetzner-Server.

WireGuard-Interface erzeugen

Ort: Interfaces → Assignments

Das WG-Interface hinzufügen und aktivieren. IPs eintragen. Speichern.
Gateways hinzufügen.

Gateways definieren

Ort: System → Routing → Gateways

IPv4-Gateway: 10.0.1.1
IPv6-Gateway: fc00:1::1

Beide auf „Unmonitored“ stellen, damit pfSense sie nicht fälschlich als offline erkennt.

Default-Route auf den Tunnel legen

Ort: System → Routing → Routes

Die pfSense selbst nutzt das IPv6-Gateway des Tunnels als Default-Route.
Damit läuft der gesamte Systemverkehr (Updates, DNS, Checks) über Hetzner.

4. LAN-Traffic durch den Tunnel schicken

IPv4 über den Tunnel

Ort: Firewall → Rules → LAN

Die bestehende IPv4-Regel auf das Gateway 10.0.1.1 umstellen.
Damit geht sämtlicher IPv4-Verkehr über WireGuard.

IPv6 über den Tunnel

In der IPv6-Regel das Gateway fc00:1::1 auswählen.

Damit ist klar, dass das globale IPv6-Präfix über Hetzner zurückgeführt wird.

5. WireGuard-Interface erlauben

Ort: Firewall → Rules → WG-Interface

Eine einfache „Any to Any“-Regel erzeugen, da der gesamte Verkehr durch dieses Interface läuft.

6. IPv6 im LAN verteilen

Ort: Interfaces → LAN → Static IPv6
und
Ort: Services → Router Advertisements

Das globale Hetzner-Präfix im LAN hinterlegen, z. B.:

2a01:4f8:c010:8b3a::2/64

Router Advertisements aktivieren, damit Clients sofort gültige IPv6-Adressen erhalten. In diesem Fall “Assisted” auswählen. IPv4 bleibt klassisch über DHCP, z. B. 192.168.1.1.

7. Ergebnis genießen

Die Kombination aus Tunnel, statischem IPv6-Präfix und zentralem IPv4-NAT ergibt ein äußerst stabiles Netz. Die beiden heimischen WANs dienen nur noch dazu, den Tunnel erreichbar zu halten. Da WireGuard bei Leitungswechseln kaum empfindlich ist, entstehen meist nur wenige verlorene Pakete, bevor der Verkehr transparent weiterläuft. Da Absender und Ziel gleich bleiben, verliert man in der Regel keine Verbindung. IPv6 bleibt dauerhaft gültig und verliert nie sein Präfix. IPv4 ist dank Hetzner-NAT unabhängig von lokalen Providerwechseln.

Damit entsteht ein kleines, robustes Hybridmodell, das die Vorteile eines Rechenzentrums mit einem dynamischen Heimnetz kombiniert.

Edit: Und wer jetzt keine Pakete durchbekommt, hat vermutlich das Offensichtliche vergessen. Auf dem Debian-Server muss natürlich IP-Forwarding aktiviert werden, sonst bleibt alles schön im Kernel stecken.

# IPv4 Forwarding
echo 1 > /proc/sys/net/ipv4/ip_forward

# IPv6 Forwarding
echo 1 > /proc/sys/net/ipv6/conf/all/forwarding

Dauerhaft geht es in /etc/sysctl.conf:

net.ipv4.ip_forward=1
net.ipv6.conf.all.forwarding=1

Speichern, sysctl -p und plötzlich lebt das Netz…

Zwischen Kontrolle und Kollision, die GenAI-Blase ist real und agentische KI kann gefährlich werden

„The trouble with the world is that the stupid are cocksure and the intelligent are full of doubt.“

— Bertrand Russell

Der Punkt, an dem „intelligent“ nicht gleich „vernünftig“ ist

Bertrand Russell beschreibt die aktuelle Lage der künstlichen Intelligenz hervorragend. Während viele Systeme mit erschütternder Selbstsicherheit handeln, fehlt ihnen genau das, was Intelligenz eigentlich ausmacht: Zweifel.

Generative Modelle wie GPT, Claude oder Gemini beeindrucken durch sprachliche Eleganz und scheinbare Rationalität. Doch sie sind nicht intelligent, sie approximieren. Mit dem Message Context Protocol (MCP), das diesen Modellen erlaubt, externe Funktionen auszuführen, etwa Mails zu verschicken, Daten zu verändern oder Tickets anzulegen, verleihen wir ihnen Handlungsspielräume, die sie weder verstehen noch beherrschen.

Damit überschreiten wir die Grenze zwischen kommunikativer und operativer Intelligenz. Und es entsteht eine neue Klasse von Risiken, die weit über technische Fehler hinausgeht.

Die falsche Gleichung: Sprachmodell = Intelligenz

Große Sprachmodelle (LLMs) beruhen nicht auf Denken, sondern auf fragmentierter Statistik. Mathematisch approximieren sie die bedingte Wahrscheinlichkeit, dass ein bestimmtes Token (Wortfragment) nach einer gegebenen Sequenz folgt. Diese Annäherung kann katastrophal falsch sein und das in unerwarteten Momenten.

Diese Wahrscheinlichkeiten werden in Milliarden Parametern abgebildet und durch Aktivierungsfunktionen wie ReLU oder GeLU in numerische Näherungen („Approximationswerte“) transformiert. Das Ergebnis ist kein echtes Wissen, sondern eine angenährte Sprachwahrscheinlichkeit. Die Lernfunktion der Modelle ist probabilistisch. Das, was wir am Ende sehen, ist eine geglättete Konfidenz über sprachliche Plausibilität, nicht über Wahrheit oder logische Kausalität.

Kurz gesagt: GenAI erzeugt Text, der richtig klingt, nicht Text, der richtig ist.

Das Seepferdchen-Emoji, die Frage, die das Chaos offenbarte

Das vermeintlich harmlose „Seepferdchen-Emoji“ ist zu einem Sinnbild der KI-Instabilität geworden.

Fragt man ein Sprachmodell danach, antwortet es überzeugt, „Ja, das gibt es“, korrigiert sich, halluziniert, und fällt in eine fast unendliche Schleife, die mit einer vernünftigen Antwort absolut nichts mehr zu tun hat.

Dieser Fehler ist kein kurioses Detail, sondern ein technisches Symptom: Er zeigt, dass Modelle keine semantische Stabilität besitzen. Wenn selbst triviale Fragen unvorhersehbare Reaktionen auslösen, sind agentische Anwendungen, also solche, die handeln dürfen, potenziell brandgefährlich. Praktisch jede Frage, egal wie vorsichtig formuliert, könnte eine Seepferdchen-Emoji-Frage sein.

MCP, Wenn Sprache plötzlich Macht bekommt

Mit dem Message Context Protocol (MCP) erhalten Sprachmodelle die Fähigkeit, externe Funktionen auszuführen. Was früher ein rein textbasiertes Chat-System war, kann nun real agieren:
Jira-Tickets erstellen, Systeme konfigurieren, E-Mails senden, Datenbanken abfragen.

Das MCP ist im Kern ein Kommunikationsprotokoll, das Kontext und Befehle standardisiert an externe Schnittstellen weitergibt. Damit wird aus einer passiven Text-KI ein aktives System, das reale Prozesse anstößt. Diesen Vorgang nennen wir aktuell Agentic AI. Wir unterstellen den Agenten Intelligenz, allerdings werden Handlungen nur generiert, nicht gedacht.

Genau diese Verbindung ist heikel. Denn die zugrundeliegende KI, ein stochastisches Sprachmodell, weiß nicht, was sie tut. Sie erkennt keine Grenzen zwischen plausibler und gefährlicher Aktion.

Ein harmloser Befehl wie „Erstelle bitte ein Ticket für alle betroffenen Projekte“ kann, je nach Implementierung, eine Flut von 100.000 Vorgängen erzeugen, ein ungewollter Denial-of-Service durch Sprachwahrscheinlichkeit.

Die Ursache: Das Modell interpretiert Sprache probabilistisch, nicht kausal. Es weiß nicht, was „alle Projekte“ bedeutet. Es weiß nur, dass diese Phrase oft mit einer Massenerstellung in Trainingsdaten korrelierte.

Die Illusion der Intention

Durch MCP entsteht eine gefährliche Täuschung: Ein Sprachmodell, das handeln kann, wirkt rational, ist es aber nicht.

Es hat keine Ziele, kein Bewusstsein, keine Vorstellung von Risiko. Es generiert Text, der über MCP zu einer echten Aktion wird. Was dabei fehlt, ist ein Verständnis von Ursache und Wirkung.

Das bedeutet: Eine vernünftige Frage kann denselben Effekt haben wie die Seepferdchen-Frage, eine scheinbar harmlose Eingabe, die in einem komplexen System katastrophale Kettenreaktionen auslöst.

Human in the Loop, ein unzureichendes Sicherheitsversprechen

„Wir setzen einfach einen Menschen in die Schleife.“

Human-in-the-Loop (HITL) oder Human-on-the-Loop (HOTL) beschreiben menschliche Eingriffsmechanismen in KI-Systeme. Der Begriff „Human“ ist dabei viel zu allgemein.
Ein beliebiger Mitarbeiter ist nicht automatisch qualifiziert, KI-Fehler zu erkennen oder ihre Risiken zu verstehen.

Deshalb müsste der AI-Act korrekterweise von Expert-in-the-Loop oder Expert-on-the-Loop sprechen.

Denn: Ein Sekretär darf keine automatisierten Buchungen freigeben, ein Sachbearbeiter kann keine algorithmischen Biases bewerten, und ein Entwickler ohne Fachkontext erkennt nicht, wann die KI einen regulatorischen Grenzfall überschreitet.

Fachkompetenz kann Fehler erkennen, nicht bloße Anwesenheit eines Menschen.

Und selbst darüber hinaus: Ein Entwickler kann nicht notwendigerweise schnell genug eingreifen, wenn sich ein Cursor irrt und beginnt, kritische Daten zu löschen. Zwischen Erkennen und Handeln vergeht Zeit, in einem autonomen System kann diese Verzögerung bereits ausreichen, um irreversiblen Schaden anzurichten.

Die Gefahr der Abstumpfung

Je zuverlässiger ein System wird, desto schwächer wird seine menschliche Kontrolle.

Der Effekt ist psychologisch belegt: Autofahrer mit aktivem Autopiloten reagieren deutlich langsamer in Notfällen. Der Grund: Der Mensch gewöhnt sich an Sicherheit, und verliert die Wachsamkeit.

In der KI gilt dasselbe Prinzip: Ein Buchhalter, der täglich 500 automatisch vorgeschlagene Buchungen bestätigt, prüft irgendwann nicht mehr kritisch. Wenn 999 Vorschläge korrekt sind, übersieht er den einen, der den Jahresabschluss ruiniert.

Je besser das System, desto größer das Risiko der menschlichen Abstumpfung. Das bedeutet man braucht größere Kontrollsysteme. Dinge, die die Aufmerksamkeit des kontrollierenden Experten on/in the Loop lenken.

Anomalieerkennung, also Systeme, die gezielt Abweichungen von erwarteten Mustern hervorheben, kann hier eine wirksame Gegenmaßnahme sein, nicht als Ersatz, sondern als Rückkopplung, die den Menschen im Loop wieder wach macht.

Risikoanalyse Ende-zu-Ende, nicht nur am Modell

Fehlerszenarien dürfen nicht nur auf Modell- oder Prompt-Ebene bewertet werden.
Die entscheidende Frage lautet: Was ist der reale Schaden, wenn etwas schiefläuft?

Beispiel	Mögliche Folge	Möglicher Schaden
Bot legt 100.000 Jira-Tickets an	Serverlast, Ausfallzeiten, Datenchaos	Wirtschaftlich hoch, reputativ kritisch
Falsche Buchung durch KI	Bilanzfehler, steuerliche Nachwirkungen	Potenziell juristisch relevant
Bot löscht falsche Datensätze	Verlust von Audit-Trails, Compliance-Verstöße	Revisionsrisiko, Bußgelder

Diese Betrachtung zeigt: Die „Intelligenz“ des Modells ist irrelevant, wenn die Auswirkungen eines Fehlers nicht kontrollierbar sind.

Man stelle sich die Bild-Schlagzeile vor, die erscheinen würde, wenn der Bot aufgrund einer Seepferdchen-Emoji-Frage seinen Handlungsspielraum ausschöpft und dabei eskaliert.

Wenn diese Schlagzeile nach „Systemfehler in Chatbot-KI schickt Krankenwagen zur falschen Adresse“ oder „KI löscht versehentlich Kundenkonten – Schaden in Milliardenhöhe“ klingt, ist das Risiko real, unabhängig davon, wie fortschrittlich das Modell ist und wie durchdacht der Prompt war.

Wirtschaftliche Realität, wenn die Kosten explodieren

Neben dem Risiko ist auch die Wirtschaftlichkeit ein limitierender Faktor. Jede GenAI-Anfrage verursacht Rechenkosten, GPU-Zeit, Energie, API-Tokens.

Viele Projekte rechnen sich nicht. Der ROI verschwindet, sobald man Skalierung, Monitoring und menschliche Aufsicht einbezieht. Eine „smarte“ Automatisierung wird schnell teurer als manuelle Arbeit, besonders, wenn sie regelmäßig korrigiert werden muss.

Damit ist GenAI oft ökonomisch untragbar, wenn sie über reine Textgenerierung hinausgeht.

Der Anti-KI-Hype als Gefahr

Diese Diskrepanz zwischen Kosten, Risiko und tatsächlichem Nutzen befeuert die sogenannte AI-Bubble. Wenn Unternehmen erkennen, dass viele Projekte weder stabil noch rentabel sind, folgt die Ernüchterung.

Das Risiko: eine Gegenbewegung, eine „Anti-AI-Welle“. Plötzlich wird alles, was nach KI klingt, als Gefahr wahrgenommen, regulatorisch, gesellschaftlich, finanziell.

Das wäre fatal. Denn nicht die Technologie ist schuld, sondern ihr unkritischer Einsatz.

Wege zur Reife, fünf Prinzipien verantwortungsvoller KI

Expertise statt Symbolik:
Ein „Human“ genügt nicht, Fachwissen ist Pflicht.
Funktionale Begrenzung:
KI darf nur dort handeln, wo Konsequenzen reversibel sind.
Ende-zu-Ende-Risikoprüfung:
Der Schaden zählt, nicht die Präzision des Modells.
Wirtschaftliche Vernunft:
Kosten und Nutzen ehrlich bilanzieren, vor dem Rollout.
Transparente Aufklärung:
Klar kommunizieren: GenAI approximiert Sprache, sie denkt nicht.

Verantwortung ist die eigentliche Intelligenz

Die gegenwärtige KI-Blase entsteht nicht, weil Modelle zu schlecht sind, sondern weil wir ihnen zu viel zutrauen.

Wir geben Systemen Macht, die nicht verstehen, was sie tun. Wir interpretieren statistische Sprache als logisches Denken. Und wir öffnen ihnen über Protokolle wie MCP Tore zu einer Welt, deren Risiken sie nicht begreifen können.

Die Zukunft von KI entscheidet sich nicht an der Größe der Modelle, sondern an der Reife ihrer Nutzer. Die wirtschaftliche Erfolg einer KI wird also nicht durch Anzahl der Parameter bestimmt, sondern durch Prinzipien.

Wer Verantwortung vor Geschwindigkeit stellt, bewahrt Innovation vor ihrem eigenen Untergang. Und betrachtet man es nüchtern, ist Europa mit dem AI-Act vielleicht besser vorbereitet als die USA.

Der Tokenizer, die wahre Revolution hinter GPT

In Diskussionen über Sprachmodelle fällt das Wort „Transformer“ beinahe reflexhaft. Man spricht über Attention, über Layer, über Billionen Parameter. Doch das eigentliche Genie liegt nicht in der Architektur, sondern davor: im Tokenizer.

Denn der Transformer kann nur berechnen, was der Tokenizer zuvor definiert hat. Er denkt nicht in Wörtern, nicht in Sätzen, nicht in Konzepten, sondern in numerisch kodierten Fragmenten sprachlicher Realität.

Der Tokenizer ist die epistemische Linse, durch die eine Maschine die Welt überhaupt erst sehen kann.

Von Zeichen zu Bedeutung

Der Tokenizer übersetzt Sprache, Code oder Zahlen in diskrete Einheiten – Tokens. Diese Tokens sind keine Wörter, sondern Bytefolgen, deren Segmentierung aus Häufigkeit und Kontextinformation gelernt wurde. Ein einfacher Satz, wie:

Ich liebe KI.

wird beispielsweise zu:

["Ich", " liebe", " KI", "."]
→ [464, 306, 11789, 13]

Das mag trivial wirken, ist aber die Grundlage maschinellen Verstehens. Denn derselbe Mechanismus funktioniert ebenso für HTML, Programmcode oder mathematische Ausdrücke:

<div class="box"> → ["<", "div", " class", "=", "\"box\"", ">"]
x = 42 → ["x", " =", " 42"]
心 → ["心"]

Das Modell sieht überall nur Sequenzen von Token-IDs, eine universelle Sprache aus Zahlen, die gleichermaßen natürliche Sprache, Symbolik und Syntax kodiert. Das ist die eigentliche Genialität: nicht der Transformer, sondern die Quantisierung der Sprache selbst.

Man beachte, dass die Leerzeichen teilweise dem Token zugeordnet werden. Außer am Satzanfang und am Satzende. Trotzdem, die symbolische Bedeutung der einzelnen Zeichen geht verloren. Daher kann GPT auch nicht zählen, wie viele r das Wort Strawberry hat. Außer, man trickst mit dem Tokenizer ein wenig.

Warum GPT nicht wirklich rechnet

Die Tokenisierung hat allerdings auch ihre Schattenseiten. Zahlen sind keine kontinuierlichen Größen, sondern diskrete Symbole. „42“ ist ein einziges Token, es steht nicht in einem numerischen Verhältnis zu „41“ oder „43“. Das Modell kann also keine numerischen Operationen durchführen, weil die numerische Struktur bereits beim Tokenizing zerstört wird. Es müsste diese Beziehung erst wieder lernen. In symbolischen Systemen wäre diese Beziehung explizit hinterlegt, im neuronalen System muss sie emergent aus Korrelationen rekonstruiert werden. Größere Zahlen werden oft in 3er-Gruppen von Ziffern zerlegt. Eine kluge Darstellung für Sprache, eine schlechte Darstellung für Mathematik. Das BPE-Verfahren behandelt numerische Blöcke nicht als kontinuierliche Werte, sondern als häufige Zeichenmuster, wodurch jede arithmetische Struktur verloren geht.

Das erklärt, warum GPT häufig bei Rechenaufgaben scheitert: Es sieht keine Zahlen, sondern Wörter mit Zahlenbedeutung. „42“ ist für das Modell ähnlich wie „Katze“, ein Token mit Kontext, nicht mit Arithmetik.

Interessanterweise ist dieses Defizit nicht rein maschinell. Auch Menschen denken über Zahlen tokenisiert. „42“ ist kulturell aufgeladen, als Meme, als Symbol, als literarische Konstante. Andere Sprachen illustrieren diese Segmentierung besonders deutlich: Das französische „quatre-vingt-dix“ (wörtlich „viermal zwanzig und zehn“) oder das japanische „hyaku“ (百 für 100) zeigen, dass auch menschliches Zahlverständnis nicht linear, sondern linguistisch kodiert ist.

Wir denken über Zahlen, wie der Tokenizer sie sieht: als sprachliche Einheiten, nicht als Mengen.

Von Wahrscheinlichkeiten zu Fragmenten

Das Training eines Sprachmodells basiert auf der bedingten Verteilung

P(ti ∣t1 , t2, …, ti−1)

der Wahrscheinlichkeit, dass ein bestimmtes Token ti als Nächstes folgt. Doch diese Wahrscheinlichkeit existiert im Modell nicht als analytische Funktion. Sie wird approximiert durch eine Vielzahl gewichteter Matrizen, deren Aktivierungen über Gradientendeszente so lange angepasst werden, bis die Differenz zwischen Vorhersage und tatsächlichem nächsten Token minimiert ist.

Was bleibt, ist kein probabilistischer Raum, sondern ein deterministisches Feld nicht linearer Approximationen. ReLUs eliminieren negative Aktivierungen und brechen damit Symmetrien. Damit wird jede probabilistische Interpretation systematisch zerstört, was bleibt, ist ein deterministisches Aktivierungsmuster, das sich nur noch statistisch deuten lässt. Dropout deaktiviert zufällig Neuronen und fragmentiert den Signalfluss.

Die oft zitierte Formel P(W∣C), die Wahrscheinlichkeit des nächsten Wortes W im Kontext C, existiert im trainierten Modell nicht mehr explizit. Sie ist lediglich die Zielfunktion des Lernprozesses, deren Spur sich in der Topologie der Gewichtsmatrizen verliert.

Das Ergebnis ist ein fragmentierter Aktivierungsraum, in dem Bedeutung als stabiler Attraktor entsteht, nicht als Wahrscheinlichkeitsverteilung. Das Modell konstruiert Kohärenz ohne Wahrheitszugang, es berechnet Konsistenz, nicht Realität.

Wie der Tokenizer Bedeutung ermöglicht

Der Transformer selbst ist architektonisch blind. Er multipliziert Matrizen, aggregiert Gewichte, verteilt Aufmerksamkeit. Aber was er tatsächlich „sieht“, hängt vollständig von der Tokenisierung ab.

Wenn der Tokenizer entscheidet, dass „magisch“ in „mag“ und „isch“ zerlegt wird, dann entsteht Bedeutung auf der Ebene dieser Fragmente, nicht des Wortes. Das Embedding jeder dieser Subtokens wird im Training über Millionen Kontexte hinweg angepasst. Ihre semantische Nähe ergibt sich aus der Korrelation ihrer Aktivierungen mit anderen Tokens.

„Hund“ ist kein Symbol, sondern eine Abfolge von Tokens wie [“H”, “und”], deren Koaktivierungen sich mit anderen Tier-bezogenen Tokens stabilisieren. „Schraubenzieher“ besteht aus [“Sch”, “rau”, “ben”, “zie”, “her”], deren Aktivierungspfade in Clustern erscheinen, die mit Werkzeugbegriffen korrelieren.

Semantik entsteht nicht auf der Wortebene, sondern als mehrschichtige Interferenz im hochdimensionalen Embedding-Raum. Der Tokenizer definiert die Atome, aus denen diese Semantik gebaut wird.

Der eigentliche Durchbruch

Der Tokenizer ist damit kein Vorverarbeitungsschritt, sondern das epistemische Fundament der gesamten Sprachintelligenz. Aber auch seine natürliche Grenze.

Er komprimiert die Welt in endlich viele Symbole, deren Dichte und Segmentierung bestimmen, welche Realität das Modell überhaupt lernen kann.

Es gibt Ansätze, die auf der Bedeutung einzelner Zeichen ansetzen. Allerdings haben diese auch einen viel höheren initialen Trainingsaufwand, um die Bedeutung ganzer Wörter zu verstehen.

Ein anderer Tokenizer, ein anderes Weltbild. Ein Tokenizer, der Zahlen nicht segmentiert, erzeugt ein Modell, das nicht rechnen kann. Ein Tokenizer, der Satzzeichen ignoriert, erzeugt ein Modell ohne Syntaxverständnis. Ein Tokenizer, der Zeichen falsch auftrennt, zerstört Semantik, bevor sie entstehen kann. Ein Modell ohne Tokenizer konvergiert aktuell nicht.

Der Transformer wäre dann ein Rechenwerk ohne Sprache, eine lineare Algebra über Rauschen.

Der Tokenizer bildet die Grenzfläche zwischen Sprache und Zahl, zwischen Syntax und Semantik. Seine Effizienz liegt darin, dass er Bedeutung komprimiert, bevor sie überhaupt verstanden wird. Er ist damit nicht nur das technische Fundament der modernen Sprachmodelle, sondern auch ihr erkenntnistheoretischer Rahmen.

USB-C ist wie Jira – sieht einheitlich aus, funktioniert aber nur zufällig

Ich dachte, USB-C wäre die Lösung. Ein Stecker für alles:
Laptop, Handy, Monitor, Kaffeemaschine – alles über ein Kabel.
Dachte ich.

Realität:
Ein Kabel lädt nur. Eines überträgt Daten. Eins kann 240 Watt, das nächste schmilzt bei 65. Und das teure Thunderbolt-Kabel? Erkennt dein Monitor nicht. Das U steht für “Universal”, sagen sie. “Unberechenbar”, sag ich.

Jedes Mal, wenn ich ein neues USB-C-Kabel in die Hand nehme, fühle ich mich wie bei einem Team, das denselben Jira-Workflow “standardisiert” nutzt.

Alles sieht gleich aus:
Open | In Progress | Done.

Aber wehe, man steckt was rein.
Das eine Team nutzt “Done” für “läuft lokal”.
Das andere für “wartet auf QA”.
Und eines schließt’s ab, wenn die Katze vom Entwickler auf Enter drückt.

Sie nennen es Alignment. Ich ‘Feel Good’-Architektur.
Jira ist das USB-C der Projektwelt.

Sieht genormt aus, steckt überall und niemand weiß, was es gerade überträgt.
Mal Daten. Mal Strom. Mal Hoffnung.

Wenn alles brennt: Vom Priorisieren zum Triagieren

Montagmorgen, 9:15 Uhr. Der Slack-Channel des Teams steht in Flammen. Drei neue P1-Tickets, ein kritisches System ist ausgefallen, zwei Kunden eskalieren gleichzeitig. Der Product Owner klebt hastig weitere Post-its an das ohnehin schon überfüllte Board, einige davon tragen aus Frust den Aufkleber “P0”. Im Hintergrund sitzen Entwickler vor ihren Bildschirmen, müde, mit dunklen Augenringen, einer tippt genervt ein “🔥🔥🔥” in den Chat.

Wenn alles dringend ist, ist am Ende gar nichts mehr dringend. Das Team rutscht in einen Zustand, in dem es nicht mehr gestaltet, sondern nur noch versucht, das Schlimmste zu verhindern. Aus Priorisierung wird Triage.

Priorisieren, solange das System gesund ist

Viele Teams arbeiten mit drei groben Prioritäten. P1 ist für Aufgaben, die sofort erledigt werden müssen. Jede Verzögerung hätte ernste Folgen. P2 sind Aufgaben mit festen Deadlines, die zwar wichtig sind, aber noch etwas Zeit haben. P3 schließlich sind Themen ohne festen Termin – Dinge, die man angeht, wenn Luft dafür ist.

In einem gesunden Team sorgt diese Einteilung für Ruhe. Man weiß, was zuerst erledigt wird, was geplant werden kann und was warten muss. So entsteht ein stabiler Fluss, und die Arbeit erzeugt spürbaren Nutzen.

Doch dieses System hat eine Grenze. Erst bleiben ein paar P3-Aufgaben liegen, was noch völlig normal ist. Dann geraten P2-Themen ins Rutschen, Deadlines werden geschoben. Spätestens wenn selbst P1-Aufgaben nicht mehr zuverlässig fertig werden, ist klar: Hier wird nicht mehr priorisiert, hier wird triagiert.

Der Ursprung des Begriffs

Der Ausdruck Triage kommt aus der Notfallmedizin. Nach einem schweren Unglück müssen Ärzte in kürzester Zeit entscheiden, wen sie zuerst behandeln. Manche Patienten können warten, andere brauchen sofort Hilfe – und in tragischen Fällen gibt es Menschen, die selbst mit allen verfügbaren Ressourcen kaum eine Überlebenschance hätten.

Im normalen Krankenhausbetrieb würde man auch um diese Patienten kämpfen. Doch wenn die Ressourcen nicht ausreichen, müssen Entscheidungen getroffen werden, die unter normalen Umständen undenkbar wären: Einige Patienten werden gezielt zurückgestellt, um möglichst viele andere retten zu können.

Das Ziel ist nicht Gerechtigkeit, sondern Schadensbegrenzung. So viele Menschen wie möglich sollen überleben, auch wenn das harte Entscheidungen erfordert.

Übertragen auf Softwareentwicklung bedeutet das: Das Team kann nicht mehr alles liefern, was wichtig ist. Es geht nicht mehr um die beste Lösung oder den größten Nutzen, sondern nur noch darum, den größten Schaden abzuwenden.

Wenn Triage zum Alltag wird

Triage in Softwareteams schleicht sich ein. Von außen betrachtet sieht man erst kleine Risse: Deadlines werden gelegentlich verschoben, Aufgaben bleiben länger liegen, die Stimmung kippt leicht ins Hektische. Dann beschleunigt sich der Zerfall.

Plötzlich sind fast alle Tickets P1. Niemand traut sich, “Nein” zu sagen. Entwickler springen von einer Eskalation zur nächsten, ohne je etwas richtig abzuschließen. Wichtige, aber nicht akute Themen wie Architektur, technische Schulden oder Qualitätssicherung verschwinden komplett aus dem Blickfeld. Immer öfter verschieben sich Termine, weil einfach nicht genug Zeit da ist.

Nach außen wirkt das wie permanentes Feuerlöschen. Von innen fühlt es sich schlimmer an: Arbeit verliert ihre Struktur und ihren Sinn.

Die psychologische Seite

Im Normalzustand weiß ein Team, warum es arbeitet. Es sieht Fortschritte, kann den eigenen Beitrag zur Wertschöpfung erkennen. Das motiviert und gibt Orientierung.

Im Triage-Modus verändert sich dieses Gefühl. Plötzlich geht es nur noch darum, Verluste zu begrenzen. Das, was nicht geschafft wird, hinterlässt Schuldgefühle. Das, was geschafft wird, sieht niemand, weil sofort die nächste Eskalation beginnt.

Irgendwann redet niemand mehr über neue Ideen oder Verbesserungen. Stattdessen geht es nur noch darum, wer Schuld trägt. Manche werden zynisch, andere ziehen sich innerlich zurück. Burnout und Fluktuation sind dann keine abstrakten Risiken mehr, sondern die logische Folge.

Mehr Leute, mehr Chaos

Wenn Teams am Limit sind, wird oft reflexartig nach mehr Personal gerufen. Das klingt vernünftig, löst aber selten das eigentliche Problem.

Neue Leute müssen eingearbeitet werden. In dieser Zeit sinkt die Leistung sogar, weil erfahrene Teammitglieder weniger schaffen, während sie die Neuen betreuen. Je größer ein Team wird, desto mehr Zeit geht für Abstimmung und Koordination drauf.

Es ist wie beim Kochen: Ein Hähnchen wird bei 200°C nach ein bis zwei Stunden perfekt. Dreht man den Ofen auf 800°C, ist es nach wenigen Minuten nur noch Kohle. Mit Teams ist es genauso – mehr Hitze bringt nicht zwangsläufig ein besseres Ergebnis, sondern oft nur Chaos.

Wenn ständig nach mehr Leuten gerufen wird, ist das oft ein Symptom. Das eigentliche Problem liegt meist tiefer: fehlender Fokus, zu viele parallele Projekte oder Entscheidungen, die keiner treffen will.

Der Weg aus der Triage

Ein Team kommt nicht allein aus diesem Zustand heraus. Es braucht Führung, die klare Prioritäten setzt und den Mut hat, unpopuläre Entscheidungen zu treffen.

Der erste Schritt: radikal ehrlich sein. Nicht alles kann P1 sein. Man muss akzeptieren, dass manche Themen bewusst verschoben oder sogar gestrichen werden. Machmal muss man ganze Projekte einstampfen. Wo wird tatsächlich Geld verdient, wo nicht? Was brauchen wir wirklich? Teams müssen umgestaltet werden, auch wenn Veränderung immer erstmal weh tut.

Dann gilt es, den Arbeitsfluss zu stabilisieren. Weniger parallel anfangen, mehr abschließen. Langfristige Themen wie Architektur oder technische Schulden dürfen nicht mehr unter den Tisch fallen. Und Führungskräfte müssen lernen, “Nein” zu sagen nicht zu den Menschen, sondern zu den Aufgaben, die das Team überfordern.

Nur so kann das Team wieder gestalten, statt nur noch zu reagieren.

Ein kurzer Ausnahmezustand ist normal

Natürlich gibt es Momente, in denen alles auf einmal zusammenkommt – ein großes Release, ein wichtiger Kunde, ein ungeplanter Ausfall. Kurze Phasen, in denen triagiert wird, sind unvermeidlich und manchmal sogar notwendig. Aber sie müssen die absolute Ausnahme bleiben.

Wenn Triage zur Routine wird, verliert das Team die Kontrolle über seine Arbeit. Dann geht es nicht mehr um Wertschöpfung, sondern nur noch ums Überleben. Und am Ende bleibt statt echter Ergebnisse nur noch ein Gefühl von permanentem Scheitern.

Processes, Horses and Peanut Butter

Why software development rarely tastes good, when you don’t let the chefs cook

There’s this brilliant video floating around the internet: A dad asks his kids to write down step-by-step instructions for making a peanut butter sandwich. (https://www.youtube.com/shorts/CM9JIVG6SQk)

The kids try their best. “Take a piece of bread.” “Open the jar.” “Use a knife to spread the peanut butter.”

Sounds easy. But the dad follows the instructions literally: He uses the wrong side of the knife. Rubs the closed jar on the bread. Places the bread upside down. And proudly says: “I did exactly what it said.”

Funny. And tragically accurate, if you’ve ever worked in software development.

Welcome to the land of process

In many companies, we don’t say: “Build us software that helps people solve problem X.” Instead, we get a wall of processes. Requirement process. Development process. QA process. Security checklist. Architecture review. Documentation standards.

Everything is described in detail. And yet the actual goal? Often a vague buzzword salad with some AI and “innovation” dressing on top.

The chef, the duck, and the misunderstanding

Now imagine walking into a Michelin-starred restaurant and saying: “I’ll have the duck, please. Sous-vide at exactly 58.3°C for 63 minutes. Then pan-seared in ghee not butter. Skin lightly crisped, but not crunchy.”

You’ll either be laughed at politely or shown the door. Because you don’t go to a professional to tell them how to do their job. You go because they know what they’re doing.

But in software development? We do exactly that. We tell engineers not only what to build but how to build it. Framework, language, database, CI/CD steps, naming conventions… you name it. And god forbid someone has their own idea.

The craft and the illusion

There are two major problems:

1. Fewer and fewer developers understand their craft. Writing code != building software. Software development is about thinking in models, understanding users, making trade-offs, and designing solutions that evolve.

2. We believe processes create products. They don’t. Processes can help, but they can’t replace thinking. And when they become the main focus, they kill what matters most: creativity, ownership, innovation.

From sandwiches to stud farms

Some companies treat innovation like animal husbandry: Defined breeding lines. Optimized insemination stations. Carefully maintained paddocks. Groomed workflows for every whinny.

And then they wonder why they keep getting horses. Faster horses. Shinier horses. Very expensive horses.

But no cars.

As Henry Ford once said:

“If I had asked people what they wanted, they would have said faster horses.”

We’re still doing it today. Only now we call it “cloud-native enterprise-ready SaaS.”

The bottom line

If you want real software, stop pretending that checklists are creativity. Trust your engineers. Talk about outcomes, not steps. And for heaven’s sake: stop telling the chef how to cook the duck.

Because if you still believe a good breeding plan will somehow produce a car, you may end up with a very fast horse. But you’ll never leave the paddock.

Koordination im Scrum-Team: Wer entscheidet was – und wie bleibt das Team mit den Stakeholdern im Austausch?

Agile Softwareentwicklung nach Scrum lebt von einer klaren Rollen- und Aufgabenverteilung. Doch gerade in der Zusammenarbeit zwischen Product Owner (PO) und Entwicklungsteam zeigt sich in der Praxis, wie wichtig ein gemeinsames Verständnis der Verantwortlichkeiten ist. Missverständnisse oder Rollenkonflikte können nicht nur die Teamdynamik, sondern auch die Produktqualität und Wirtschaftlichkeit erheblich beeinflussen.

Der Product Owner: Verantwortung für das Was und die Wichtigkeit

Der Product Owner trägt die zentrale Verantwortung für das Was und wie wichtig in der Produktentwicklung. Er sammelt Anforderungen, bewertet deren Nutzen und priorisiert die Themen im Product Backlog. Die Reihenfolge im Backlog gibt die fachliche Dringlichkeit und strategische Relevanz vor. Damit setzt der PO den Rahmen, was gebaut wird und was für den langfristigen Erfolg des Produkts am bedeutendsten ist.

Wesentlich ist dabei der kontinuierliche Austausch mit den Stakeholdern – also allen, die ein Interesse am Produkt haben, von Geschäftsführung und Management über Vertrieb bis zu den Endnutzern. Ihre Wünsche, Anforderungen und Rückmeldungen werden vom PO aufgenommen, bewertet und fließen in die Priorisierung ein. So wird sichergestellt, dass das Backlog die tatsächlichen Bedürfnisse widerspiegelt.

Das Entwicklungsteam: Verantwortung für Wann und Wie

Das Entwicklungsteam verantwortet das Wann und Wie. Im Rahmen des Sprint Plannings entscheidet das Team, gemeinsam mit dem PO, welche Aufgaben aus dem priorisierten Backlog in den kommenden Sprint aufgenommen werden. Dabei orientiert sich das Team grundsätzlich an der Priorisierung durch den PO – der Impact für das Produkt soll maximiert werden.

Allerdings spielen auch technische Abhängigkeiten, Architekturfragen, die aktuelle Systemlandschaft sowie die optimale Auslastung der Teammitglieder eine wesentliche Rolle. In bestimmten Fällen kann es sinnvoll oder sogar notwendig sein, ein weniger wichtiges Thema vorzuziehen, um technische Schulden zu vermeiden oder die Basis für ein hoch priorisiertes Feature zu schaffen. Diese Entscheidungen erfolgen stets transparent und im engen Austausch mit dem PO.

Das Wie der Umsetzung – also die technische Gestaltung, Architekturentscheidungen und der Weg zur Lösung – liegt in der Verantwortung des Teams. Nur das Team verfügt über das entsprechende Fachwissen, um stabile und nachhaltige Lösungen zu entwickeln, die auch langfristig wirtschaftlich bleiben.

Das gewünschte Spannungsfeld: Business Value und technische Realitäten

Das Spannungsfeld zwischen den Interessen des Product Owners und den Anforderungen des Entwicklungsteams ist kein Fehler im System, sondern ein zentrales Merkmal agiler Entwicklung. Der PO vertritt die fachlichen und wirtschaftlichen Ziele, das Team bringt die technische Perspektive und Umsetzbarkeit ein. Im Idealfall entsteht so eine produktive Balance zwischen kurzfristigem Business Value und nachhaltiger Softwarequalität.

Die Auswahl der Sprint-Inhalte geschieht daher nicht starr von oben nach unten, sondern immer mit Verstand und Blick für das große Ganze. Ziel bleibt es, den Nutzen für das Produkt zu maximieren – aber nicht um den Preis von Überlastung, technischen Kompromissen oder langfristigen Nachteilen.

Risiken durch Rollenkonflikte: Wenn Verantwortlichkeiten verschwimmen

Probleme entstehen vor allem dann, wenn Verantwortlichkeiten missachtet oder vermischt werden. Verwechselt der Product Owner beispielsweise das Setzen der Prioritäten (wie wichtig) mit der Entscheidung über das Wann, entsteht unnötiger Druck auf das Entwicklungsteam. Wird das Team gezwungen, Aufgaben allein aufgrund ihrer fachlichen Priorität sofort umzusetzen, ohne Rücksicht auf technische Abhängigkeiten oder sinnvolle Reihenfolgen, drohen Überlastung, Qualitätsverluste und im schlimmsten Fall technische Schulden, die später teuer behoben werden müssen.

Umgekehrt birgt es Risiken, wenn das Wie der technischen Umsetzung nicht im Einklang mit dem Was und dem verfügbaren Budget steht. Werden Features ohne Rücksicht auf Wirtschaftlichkeit überdimensioniert, steigt der Aufwand, während der Nutzen ausbleibt. Entwickelt das Team am fachlichen Bedarf vorbei, entstehen Lösungen, die zwar technisch elegant, aber zu teuer oder an den eigentlichen Marktanforderungen vorbei sind. Fehlt die Abstimmung zwischen fachlicher Anforderung und technischer Realisierung, verliert das Produkt schnell den Anschluss an die tatsächlichen Bedürfnisse der Stakeholder.

Deshalb ist es essenziell, dass beide Seiten nicht nur ihre Verantwortung kennen, sondern auch regelmäßig und offen miteinander im Dialog bleiben. Gegenseitige Kontrolle und konstruktiver Austausch sorgen dafür, dass Priorität, Umsetzbarkeit und wirtschaftliche Vernunft dauerhaft in Balance bleiben.

Feedback und Kommunikation: Die Brücke zu den Stakeholdern

Ein zentrales Element agiler Entwicklung ist die transparente Kommunikation mit den Stakeholdern. Der PO fungiert dabei als Schnittstelle zwischen Team und Außenwelt. Nachdem das Entwicklungsteam entschieden hat, welche Aufgaben im Sprint bearbeitet werden, informiert der PO die Stakeholder regelmäßig über den Stand der Dinge, Fortschritte und eventuelle Veränderungen im Fahrplan. Rückfragen, neue Anforderungen oder konstruktives Feedback der Stakeholder werden aufgenommen, bewertet und – sofern sinnvoll – in das Backlog überführt.

Dieser Kommunikationsprozess ist ein kontinuierlicher Kreislauf:

Der PO nimmt Anforderungen und Feedback der Stakeholder auf,
priorisiert diese im Product Backlog,
stimmt sich mit dem Entwicklungsteam über Umsetzbarkeit und Timing ab,
kommuniziert die Sprintplanung und aktuelle Fortschritte an die Stakeholder zurück.

So bleibt die Produktentwicklung flexibel, kann auf neue Erkenntnisse, Marktveränderungen oder technologische Herausforderungen reagieren, und sorgt gleichzeitig dafür, dass die Stakeholder jederzeit den Überblick über den Projektstand behalten.

Fazit

Scrum lebt von klaren Verantwortlichkeiten und dem produktiven Spannungsfeld zwischen fachlichen Zielen und technischer Realisierbarkeit.

Was und wie wichtig bestimmt der Product Owner, stets im Dialog mit den Stakeholdern.
Wann und wie liegt in der Verantwortung des Entwicklungsteams.

Dieses Spannungsfeld ist kein Hindernis, sondern der Schlüssel zu nachhaltigem Produkterfolg. Es sorgt dafür, dass fachliche Ziele und technische Realitäten ausbalanciert werden und das Team flexibel, effizient und zielgerichtet arbeiten kann. Die regelmäßige, transparente Kommunikation – insbesondere das Feedback an die Stakeholder – ist dabei der Kitt, der alle Elemente zusammenhält und den langfristigen Erfolg sicherstellt.