Zum Inhalt

Contingency-Plan: Preisverfall & Alternative Monetarisierung

Stand: 07. April 2026 Kontext: 6 Monate Marktdaten zeigen, dass der A100-Median historisch in 79% der Zeit unter unserem Break-even (€0.718/GPU/h) lag. Im Winter 2025/26 hätten wir 2–3 Monate Verlust gemacht. Dieses Dokument definiert abgestufte Maßnahmen, bevor ein vollständiger Exit nötig wird.

Zweck: Nicht Exit-Plan, sondern Zwischenplan — wie nutzen wir den Server gewinnbringend (oder verlustminimierend), wenn der Vast.ai-Spot-Preis einbricht?


1. Eskalationsstufen

 Netto-EUR/GPU/h    Status              Maßnahme
 ─────────────────────────────────────────────────────────────
  > €1.00           ✅ Komfort           Business as usual
  €0.85 – €1.00     ✅ Plan              Preisoptimierung, Multi-Plattform vorbereiten
  €0.72 – €0.85     ⚠️ Wachsam          Multi-Plattform aktiv, B2B-Akquise starten
  €0.55 – €0.72     🔴 Stufe 1          Plan B aktivieren: Alternative Monetarisierung
  €0.40 – €0.55     🔴 Stufe 2          Aggressive Diversifikation, Kostenreduktion
  < €0.40           🚪 Exit prüfen       Hardware-Resale evaluieren

2. Stufe „Wachsam" (€0.72 – €0.85 netto)

Trigger: 7-Tage-Rolling-Median fällt unter €0.85 Ziel: Auslastung maximieren, Einnahmequellen diversifizieren

Sofort-Maßnahmen (Aufwand: gering)

# Maßnahme Erwarteter Effekt Zeitbedarf
W1 Vast.ai Pricing aggressiv optimieren — näher an P50 listen, Splitting-Strategie anpassen (1x/2x/4x GPU-Slices) +5–10pp Auslastung Sofort
W2 TensorDock-Listing aktivieren — für Leerlauf-Zeiten auf Vast.ai +10–15% Auslastung in Lücken 1–2 Wochen Setup
W3 Monitoring verschärfen — stündliche Preisalerts, automatische Preisanpassung Schnellere Reaktion 1 Woche

Vorbereitung (parallel)

# Maßnahme Vorbereitung für
W4 B2B Landing Page aufsetzen (einfach, DE-fokussiert) Stufe 1 – Direktkunden-Akquise
W5 RunPod Sales kontaktieren — Host-Partner-Konditionen anfragen Stufe 1 – Plattform-Diversifikation
W6 Inference-Stack evaluieren — vLLM/TGI Setup testen, populäre Modelle Stufe 1 – Managed Inference

3. Stufe 1: Plan B (€0.55 – €0.72 netto)

Trigger: 14-Tage-Rolling-Median fällt unter Break-even (€0.718) Ziel: Verluste minimieren, alternative Einnahmen aufbauen

3.1 Plattform-Wechsel: Vast.ai ↔ TensorDock (Fallback-Strategie)

Die zwei Plattformen haben unterschiedliche Pricing-Modelle und Kundenbasis, was sie als gegenseitigen Fallback wertvoll macht:

Vast.ai TensorDock
Technologie Docker Container KVM Virtual Machines
Fee 0% 25%
Billing All-inclusive /GPU/h À la carte (GPU + CPU + RAM + Storage)
Endkundenpreis A100 $0.80–1.20 $1.23+ (mit 128GB RAM, 2TB NVMe)
Host-Netto $0.80–1.20 ~$0.92 (75% vom Gesamtpreis)
Host-Netto EUR €0.74–1.11 ~€0.85
Kundenbasis ML-Community, preissensitiv Enterprise/Business, stabilere Nachfrage
Uptime-Standard Keiner 99.99% (mit Penalties)

Fallback-Logik: Nicht Parallelbetrieb, sondern Plattformwechsel bei Preisverfall:

  • Normalfall: Server läuft auf Vast.ai (0% Fee, höchste Liquidität)
  • Vast.ai-Preisverfall (<€0.72): Server auf TensorDock umstellen — Enterprise-Kunden zahlen stabilere Preise, und unser Profil (viel RAM, viel NVMe) profitiert durch das komponentenbasierte Pricing überdurchschnittlich
  • TensorDock-Preisverfall: Zurück zu Vast.ai, oder B2B-Direktverträge aktivieren

Vorbereitung nötig: TensorDock benötigt KVM/Libvirt statt Docker → OS-Umstellung. Muss vor dem Ernstfall einmal durchgespielt sein (Hypervisor-Setup, TensorDock-Onboarding, Testlisting).

Geschätzter Umstellungsaufwand: 1–2 Tage (OS-Reinstall + KVM-Setup + TensorDock-Freischaltung, wenn Account bereits genehmigt).

Plattform Fee Host-Netto (A100) Vorteil
Vast.ai 0% $0.80–1.20 Höchste Liquidität, Container-basiert
TensorDock 25% ~$0.92 (bei $1.23 Endkunde) Enterprise-Kunden, komponentenbasiert
RunPod Individuell ~$0.90–1.10 (wenn akzeptiert) Premium-Segment, Fixpreise

3.2 B2B-Direktverträge (Aufbau 4–8 Wochen)

Parameter Wert
Zielpreis €0.90–1.20/GPU/h (20–40% über Marketplace)
Zielkunden KI-Startups, Forschungsinstitute, MLOps-Teams in DE/EU
Minimum-Commitment 1 GPU, 1 Monat, monatliche Abrechnung
SLA 99.5% Uptime (Colo-SLA), SSH/API-Zugang, dedizierte GPU
USP DE-Standort, DSGVO-konform, keine Marketplace-Overhead

Rechnung bei 2 GPUs B2B @ €1.10 + 2 GPUs Vast.ai @ €0.60:

Position Einnahmen/Mo
2 GPUs × €1.10 × 730h × 90% Ausl. €1.446
2 GPUs × €0.60 × 730h × 70% Ausl. €613
Gesamt €2.059
Kosten €2.095
Cashflow −€36

Fast Break-even — selbst wenn Vast.ai auf €0.60 einbricht. Ohne B2B-Anteil wären es −€372/Mo.

Kernvorteil B2B

Direktkunden haben keine Korrelation zum Vast.ai-Spot-Preis. Wenn der Marktplatz einbricht, laufen B2B-Verträge weiter zu festen Konditionen. Das ist die wichtigste Absicherung gegen Preisverfall.

3.3 Managed Inference API (Aufbau 2–4 Wochen)

Idee: Populäre Open-Source-Modelle hosten und Inference-API als Service verkaufen.

Modell VRAM-Bedarf Deployment Preis-Referenz
Llama 3.1 70B (4-bit) ~40GB → 1 GPU vLLM $0.40–0.80/1M tokens
Mistral Large ~80GB → 1 GPU vLLM/TGI $2.00/1M tokens (Mistral API)
SDXL / Flux ~12GB → 1 GPU ComfyUI API $0.02–0.05/Bild
Whisper Large v3 ~10GB → 1 GPU faster-whisper $0.006/Minute Audio

Margen-Logik: Bei hoher Auslastung (>80%) erwirtschaftet ein Inference-Endpoint €0.80–1.50/GPU/h effektiv — deutlich über dem Vast.ai-Spot-Preis, weil der Endkunde für Convenience und API-Zugang zahlt, nicht für Raw-GPU.

Aufwand: Mittel — vLLM/TGI Setup, API-Gateway, Billing, Monitoring. Realistische Vorbereitungszeit: 2–4 Wochen für MVP.

Risiko: Kundensupport, SLA-Verpflichtungen, Modell-Updates, Wettbewerb mit Together.ai/Fireworks/Groq.

3.4 Fine-Tuning-as-a-Service (Aufbau 4–8 Wochen)

Idee: Managed Fine-Tuning für KMUs anbieten — Kunden liefern Daten, wir liefern das Modell.

Paket Umfang Preis (Marktrecherche)
Basis LoRA Fine-Tune, 7B Modell, bis 10k Beispiele €200–500 einmalig
Standard Full Fine-Tune, 13–70B Modell, Custom Eval €500–2.000
Enterprise Multi-Model, RAG-Integration, Monitoring €2.000–5.000/Mo

GPU-Kosten pro Job: Ein LoRA Fine-Tune eines 7B-Modells dauert 1–4 GPU-Stunden → Kosten €0.72–2.88, Verkaufspreis €200+ → Marge >95%.

Risiko: Kleiner Markt, beratungsintensiv, skaliert schlecht. Aber: füllt GPU-Leerlaufzeiten und baut Expertise/Reputation auf.


4. Stufe 2: Aggressive Diversifikation (€0.40 – €0.55 netto)

Trigger: 30-Tage-Median fällt unter €0.55 Ziel: Verluste begrenzen, Server wirtschaftlich halten bis Markterholung

Zusätzliche Maßnahmen

# Maßnahme Erwartete Einnahmen
D1 GPU-Rendering (Blender, Video-Transcoding) €0.40–0.70/GPU/h
D2 Wissenschaftliches Rechnen (Simulation, Molecular Dynamics) €0.50–0.80/GPU/h (Uni-Budgets)
D3 Kostenreduktion — Wartungsrücklage temporär auf €100/Mo senken −€100/Mo Fixkosten
D4 Kurzfristige B2B-Rabatte — 3-Monats-Pakete zu €0.80/GPU/h Planbare Einnahmen vs. Spot-Verlust

Worst-Case-Rechnung bei €0.50 Vast.ai + Diversifikation

Szenario Einnahmen/Mo Cashflow
4 GPUs rein Vast.ai @ €0.50, 60% Ausl. €876 −€1.219
2 GPUs B2B @ €0.90, 90% + 2 GPUs Vast.ai @ €0.50, 60% €1.754 −€341
1 GPU Inference API + 1 GPU B2B + 2 GPUs Vast.ai ~€1.900 −€195

Selbst im Worst Case bleibt der Verlust unter €350/Mo — tragbar, wenn man bedenkt dass €1.500/Mo davon Eigenkapitalaufbau (Tilgung) sind.


5. Exit-Schwelle (< €0.40 netto, >3 Monate)

Trigger: 90-Tage-Median unter €0.40 — Markt ist strukturell kollabiert.

Option Geschätzter Erlös Timing
Hardware-Resale (4× A100 80GB + Server) €25.000–35.000 4–8 Wochen
Finanzierung weiter bedienen, Server offline −€1.500/Mo (nur Finanzierung) Sofort
Finanzierung mit Bank verhandeln (Stundung) Reduziert auf ~€500/Mo 2–4 Wochen

Exit ist der letzte Ausweg

Die A100 hat einen stabilen Resale-Markt. Selbst nach 24 Monaten Nutzung sind €20.000–25.000 Resale realistisch. Der Verlust wäre begrenzt auf die Differenz zwischen Finanzierungsrestschuld und Resale-Erlös.


6. Vorbereitungs-Timeline

Was muss vor einem Preisverfall vorbereitet sein, damit die Maßnahmen sofort greifen?

Maßnahme Vorbereitung nötig Wann fertig sein? Status
TensorDock Account + Listing Account anlegen, Libvirt-Hypervisor Vor Phase-A-Start ❌ Offen
B2B Landing Page Einfache Seite mit Preisen, SLA, Kontaktformular Monat 1–2 ❌ Offen
RunPod Sales-Gespräch Anfrage stellen, Konditionen klären Monat 1 ❌ Offen
vLLM/TGI Inference-Stack Docker-Setup, API-Gateway, 1 Modell deployen Monat 2–3 ❌ Offen
B2B Pilotkunde 1 Kunde über Netzwerk/LinkedIn Monat 3–4 ❌ Offen
Automatische Preisanpassung Script: Preis dynamisch an Markt anpassen Monat 1 ❌ Offen
Kill-Signal-Monitoring Automatische Alerts bei Preisverfall-Schwellen Vor Phase-A-Start ❌ Offen

Kernprinzip

Vorbereiten, bevor man es braucht. TensorDock-Listing und B2B-Landing-Page kosten wenig Aufwand, müssen aber stehen bevor der Preis fällt. Im Ernstfall ist keine Zeit für 2 Wochen Setup.


7. Zusammenfassung: Cashflow-Brücke

Das Contingency-System bildet eine Brücke zwischen Spot-Preisverfall und vollständigem Exit:

Vast.ai Spot-Preis (netto EUR/GPU/h):

 €1.00+  ███████████████████████████████  Komfort — Cashflow +€200–400/Mo
 €0.85   ████████████████████████████     Plan — Pricing optimieren
 €0.72   ██████████████████████           Wachsam — Multi-Plattform
 €0.60   ████████████████                 Plan B — B2B + TensorDock → ~Break-even
 €0.50   ██████████████                   Stufe 2 — Aggressive Diversifikation → −€200–350/Mo
 €0.40   ████████████                     Exit prüfen — Resale €25–35k

Die zentrale Erkenntnis: Zwischen „Vast.ai ist profitabel" und „wir müssen den Server verkaufen" liegen 3–4 Stufen von Maßnahmen, die den Verlust auf ein tragbares Niveau begrenzen. Der Server bezahlt sich durch die Finanzierung langfristig selbst — die Frage ist nur, ob wir die Durststrecken überbrücken können.

Antwort: Ja — wenn wir vorher die Infrastruktur vorbereiten.


Dieses Dokument wird aktualisiert, sobald sich die Marktlage ändert oder neue Monetarisierungsoptionen evaluiert werden.