Worum es hier geht
Nicht „Wir probieren mal KI“, sondern: Wir bauen ein marktfähiges Produkt mit KI‑Einsatz.
Das heißt: messbarer Kundennutzen, verlässliche Ergebnisse, saubere Preise – und eine Marge, die auch bei Wachstum trägt. Marge entsteht, wenn Umsatz pro Nutzung deutlich über den variablen Nutzungskosten liegt. Fixkosten entscheiden, wie schnell ihr skaliert.
Die ökonomische Struktur – früher vs. heute (kurz & klar)
| Dimension | Früher (klassisches SaaS) | Heute (KI‑Produkt) |
| Umsatz‑Einheit | Seats/Lizenzen | Nutzung/Antwort + ggf. Seat |
| Steuergröße | LTV (Customer Lifetime Value) | Deckungsbeitrag je Nutzung, Plan‑CM |
| Hauptkosten | überwiegend fix (Infra, Vertrieb) | überwiegend variabel (Rechenleistung/„Tokens“, gezielte Suche/Tools, Speicher) |
| Marge grob | 80–90 % | 25–60 % |
| Preislogik | Pläne mit Feature‑Gating | Pläne + Kontingente/Overages |
| Forecast‑Hebel | Seat‑Zuwachs | Fallzahlen, Antwortlänge, Modellmix |
Umsatz-Einheit
Früher (klassisches SaaS): Seats/Lizenzen
Heute (KI-Produkt): Nutzung/Antwort + ggf. Seat
Steuergröße
Früher: LTV (Customer Lifetime Value)
Heute: Deckungsbeitrag je Nutzung, Plan-CM
Hauptkosten
Früher: überwiegend fix (Infra, Vertrieb)
Heute: überwiegend variabel (Rechenleistung/„Tokens“, gezielte Suche/Tools, Speicher)
Marge (grob)
Früher: 80–90 %
Heute: 25–60 %
Preislogik
Früher: Pläne mit Feature-Gating
Heute: Pläne + Kontingente/Overages
Forecast-Hebel
Früher: Seat-Zuwachs
Heute: Fallzahlen, Antwortlänge, Modellmix
Neu im KI‑Zeitalter: Deckungsbeitrag je Nutzung & Plan‑CM
Warum neu? In klassischem SaaS waren Compute‑Kosten pro zusätzlicher Nutzung kaum spürbar. Heute kostet jede Interaktion Geld – über Tokens und Tool‑Aufrufe. Tokens sind eure neuen COGS (Stückkosten der Leistung).
Deckungsbeitrag je Nutzung
- Betrachtet eure typischen Interaktionen: Welcher Umsatz steht welchen variablen Nutzungskosten gegenüber (Modell‑Rechenleistung, gezielte Suche/Tools, Speicher/Datentransfer)?
- Wenn’s klemmt, sind meist Antwortlänge, Modellgröße oder zu viele Zwischenschritte die Treiber.
Plan‑CM (Plan‑Deckungsbeitrag)
- Setzt je Tarif/Produktpfad ein Marge‑Ziel (z. B. 50–60 %).
- Preist so, dass ihr dieses Ziel in der typischen Nutzung trefft: Mindestumsatz + Kontingente + faire Mehrnutzung.
Überwacht Soll/Ist: Reißt die Nutzung den Plan, greift euer Router (kleineres Modell, kürzerer Kontext, weniger Quellen) – oder ihr justiert die Pakete.
Nachladen statt Nachtrainieren
Feintraining bindet Budget und Zeit. In vielen Fällen reicht es, zur Laufzeit das richtige Wissen nachzuladen und Antworten damit zu steuern. Ergebnis: bessere Treffer, aktuelle Inhalte, kontrollierbare Nutzungskosten. Einstieg: RAG für Entscheider: Wie ein Wissens‑Bot funktioniert – ohne Feintuning, ohne Code.
Was jetzt zählt – drei Schritte
- Preisleitplanken: Mindestumsatz je Plan + klare Kontingente. Mehrnutzung transparent. So bleibt die Marge planbar – auch wenn die Nutzung steigt.
- Nutzung schlank: präzise Fragen, kurze Antworten, nur relevante Quellen nachladen. Wiederverwendbares cachen statt jedes Mal neu „bezahlen“.
- Modellmix steuern: günstiges Modell als Default; nur bei echten Spezialfällen hochschalten. Euer Router entscheidet, nicht der Zufall.
Vom ersten Aha zum Markt
Onboarding am echten Problem, nicht an der Feature‑Liste. Vertrauensanker einbauen (Quellenhinweise, Versionen). Distribution so wählen, dass sie resoniert: Community‑Kanäle, Partner, Referenzen – Reichweite ist gut, resonante Reichweite ist besser.
Fazit
Ein KI‑Produkt rechnet sich, wenn Produktnutzen vor Technik kommt. Wer scharf definiert, was der Kunde kauft, wie die Nutzungskosten entstehen und wo die Distribution wirkt, hält die Marge stabil – und skaliert gesund.
Ihr plant ein KI‑Produkt oder wollt ein bestehendes Angebot wirtschaftlich trimmen? Wir zeigen, wo Marge verloren geht – und wo sie entsteht.
„Ich möchte mehr Marge mit KI!“
Wir beraten, implementieren, erweitern und begleiten. Meldet Euch gerne.