Contingency-Plan: Preisverfall & Alternative Monetarisierung¶

Stand: 07. April 2026 Kontext: 6 Monate Marktdaten zeigen, dass der A100-Median historisch in 79% der Zeit unter unserem Break-even (€0.718/GPU/h) lag. Im Winter 2025/26 hätten wir 2–3 Monate Verlust gemacht. Dieses Dokument definiert abgestufte Maßnahmen, bevor ein vollständiger Exit nötig wird.

Zweck: Nicht Exit-Plan, sondern Zwischenplan — wie nutzen wir den Server gewinnbringend (oder verlustminimierend), wenn der Vast.ai-Spot-Preis einbricht?

1. Eskalationsstufen¶

 Netto-EUR/GPU/h    Status              Maßnahme
 ─────────────────────────────────────────────────────────────
  > €1.00           ✅ Komfort           Business as usual
  €0.85 – €1.00     ✅ Plan              Preisoptimierung, Multi-Plattform vorbereiten
  €0.72 – €0.85     ⚠️ Wachsam          Multi-Plattform aktiv, B2B-Akquise starten
  €0.55 – €0.72     🔴 Stufe 1          Plan B aktivieren: Alternative Monetarisierung
  €0.40 – €0.55     🔴 Stufe 2          Aggressive Diversifikation, Kostenreduktion
  < €0.40           🚪 Exit prüfen       Hardware-Resale evaluieren

2. Stufe „Wachsam" (€0.72 – €0.85 netto)¶

Trigger: 7-Tage-Rolling-Median fällt unter €0.85 Ziel: Auslastung maximieren, Einnahmequellen diversifizieren

Sofort-Maßnahmen (Aufwand: gering)¶

#	Maßnahme	Erwarteter Effekt	Zeitbedarf
W1	Vast.ai Pricing aggressiv optimieren — näher an P50 listen, Splitting-Strategie anpassen (1x/2x/4x GPU-Slices)	+5–10pp Auslastung	Sofort
W2	TensorDock-Listing aktivieren — für Leerlauf-Zeiten auf Vast.ai	+10–15% Auslastung in Lücken	1–2 Wochen Setup
W3	Monitoring verschärfen — stündliche Preisalerts, automatische Preisanpassung	Schnellere Reaktion	1 Woche

Vorbereitung (parallel)¶

#	Maßnahme	Vorbereitung für
W4	B2B Landing Page aufsetzen (einfach, DE-fokussiert)	Stufe 1 – Direktkunden-Akquise
W5	RunPod Sales kontaktieren — Host-Partner-Konditionen anfragen	Stufe 1 – Plattform-Diversifikation
W6	Inference-Stack evaluieren — vLLM/TGI Setup testen, populäre Modelle	Stufe 1 – Managed Inference

3. Stufe 1: Plan B (€0.55 – €0.72 netto)¶

Trigger: 14-Tage-Rolling-Median fällt unter Break-even (€0.718) Ziel: Verluste minimieren, alternative Einnahmen aufbauen

3.1 Plattform-Wechsel: Vast.ai ↔ TensorDock (Fallback-Strategie)¶

Die zwei Plattformen haben unterschiedliche Pricing-Modelle und Kundenbasis, was sie als gegenseitigen Fallback wertvoll macht:

	Vast.ai	TensorDock
Technologie	Docker Container	KVM Virtual Machines
Fee	0%	25%
Billing	All-inclusive /GPU/h	À la carte (GPU + CPU + RAM + Storage)
Endkundenpreis A100	$0.80–1.20	$1.23+ (mit 128GB RAM, 2TB NVMe)
Host-Netto	$0.80–1.20	~$0.92 (75% vom Gesamtpreis)
Host-Netto EUR	€0.74–1.11	~€0.85
Kundenbasis	ML-Community, preissensitiv	Enterprise/Business, stabilere Nachfrage
Uptime-Standard	Keiner	99.99% (mit Penalties)

Fallback-Logik: Nicht Parallelbetrieb, sondern Plattformwechsel bei Preisverfall:

Normalfall: Server läuft auf Vast.ai (0% Fee, höchste Liquidität)
Vast.ai-Preisverfall (<€0.72): Server auf TensorDock umstellen — Enterprise-Kunden zahlen stabilere Preise, und unser Profil (viel RAM, viel NVMe) profitiert durch das komponentenbasierte Pricing überdurchschnittlich
TensorDock-Preisverfall: Zurück zu Vast.ai, oder B2B-Direktverträge aktivieren

Vorbereitung nötig: TensorDock benötigt KVM/Libvirt statt Docker → OS-Umstellung. Muss vor dem Ernstfall einmal durchgespielt sein (Hypervisor-Setup, TensorDock-Onboarding, Testlisting).

Geschätzter Umstellungsaufwand: 1–2 Tage (OS-Reinstall + KVM-Setup + TensorDock-Freischaltung, wenn Account bereits genehmigt).

Plattform	Fee	Host-Netto (A100)	Vorteil
Vast.ai	0%	$0.80–1.20	Höchste Liquidität, Container-basiert
TensorDock	25%	~$0.92 (bei $1.23 Endkunde)	Enterprise-Kunden, komponentenbasiert
RunPod	Individuell	~$0.90–1.10 (wenn akzeptiert)	Premium-Segment, Fixpreise

3.2 B2B-Direktverträge (Aufbau 4–8 Wochen)¶

Parameter	Wert
Zielpreis	€0.90–1.20/GPU/h (20–40% über Marketplace)
Zielkunden	KI-Startups, Forschungsinstitute, MLOps-Teams in DE/EU
Minimum-Commitment	1 GPU, 1 Monat, monatliche Abrechnung
SLA	99.5% Uptime (Colo-SLA), SSH/API-Zugang, dedizierte GPU
USP	DE-Standort, DSGVO-konform, keine Marketplace-Overhead

Rechnung bei 2 GPUs B2B @ €1.10 + 2 GPUs Vast.ai @ €0.60:

Position	Einnahmen/Mo
2 GPUs × €1.10 × 730h × 90% Ausl.	€1.446
2 GPUs × €0.60 × 730h × 70% Ausl.	€613
Gesamt	€2.059
Kosten	€2.095
Cashflow	−€36

Fast Break-even — selbst wenn Vast.ai auf €0.60 einbricht. Ohne B2B-Anteil wären es −€372/Mo.

Kernvorteil B2B

Direktkunden haben keine Korrelation zum Vast.ai-Spot-Preis. Wenn der Marktplatz einbricht, laufen B2B-Verträge weiter zu festen Konditionen. Das ist die wichtigste Absicherung gegen Preisverfall.

3.3 Managed Inference API (Aufbau 2–4 Wochen)¶

Idee: Populäre Open-Source-Modelle hosten und Inference-API als Service verkaufen.

Modell	VRAM-Bedarf	Deployment	Preis-Referenz
Llama 3.1 70B (4-bit)	~40GB → 1 GPU	vLLM	$0.40–0.80/1M tokens
Mistral Large	~80GB → 1 GPU	vLLM/TGI	$2.00/1M tokens (Mistral API)
SDXL / Flux	~12GB → 1 GPU	ComfyUI API	$0.02–0.05/Bild
Whisper Large v3	~10GB → 1 GPU	faster-whisper	$0.006/Minute Audio

Margen-Logik: Bei hoher Auslastung (>80%) erwirtschaftet ein Inference-Endpoint €0.80–1.50/GPU/h effektiv — deutlich über dem Vast.ai-Spot-Preis, weil der Endkunde für Convenience und API-Zugang zahlt, nicht für Raw-GPU.

Aufwand: Mittel — vLLM/TGI Setup, API-Gateway, Billing, Monitoring. Realistische Vorbereitungszeit: 2–4 Wochen für MVP.

Risiko: Kundensupport, SLA-Verpflichtungen, Modell-Updates, Wettbewerb mit Together.ai/Fireworks/Groq.

3.4 Fine-Tuning-as-a-Service (Aufbau 4–8 Wochen)¶

Idee: Managed Fine-Tuning für KMUs anbieten — Kunden liefern Daten, wir liefern das Modell.

Paket	Umfang	Preis (Marktrecherche)
Basis	LoRA Fine-Tune, 7B Modell, bis 10k Beispiele	€200–500 einmalig
Standard	Full Fine-Tune, 13–70B Modell, Custom Eval	€500–2.000
Enterprise	Multi-Model, RAG-Integration, Monitoring	€2.000–5.000/Mo

GPU-Kosten pro Job: Ein LoRA Fine-Tune eines 7B-Modells dauert 1–4 GPU-Stunden → Kosten €0.72–2.88, Verkaufspreis €200+ → Marge >95%.

Risiko: Kleiner Markt, beratungsintensiv, skaliert schlecht. Aber: füllt GPU-Leerlaufzeiten und baut Expertise/Reputation auf.

4. Stufe 2: Aggressive Diversifikation (€0.40 – €0.55 netto)¶

Trigger: 30-Tage-Median fällt unter €0.55 Ziel: Verluste begrenzen, Server wirtschaftlich halten bis Markterholung

Zusätzliche Maßnahmen¶

#	Maßnahme	Erwartete Einnahmen
D1	GPU-Rendering (Blender, Video-Transcoding)	€0.40–0.70/GPU/h
D2	Wissenschaftliches Rechnen (Simulation, Molecular Dynamics)	€0.50–0.80/GPU/h (Uni-Budgets)
D3	Kostenreduktion — Wartungsrücklage temporär auf €100/Mo senken	−€100/Mo Fixkosten
D4	Kurzfristige B2B-Rabatte — 3-Monats-Pakete zu €0.80/GPU/h	Planbare Einnahmen vs. Spot-Verlust

Worst-Case-Rechnung bei €0.50 Vast.ai + Diversifikation¶

Szenario	Einnahmen/Mo	Cashflow
4 GPUs rein Vast.ai @ €0.50, 60% Ausl.	€876	−€1.219
2 GPUs B2B @ €0.90, 90% + 2 GPUs Vast.ai @ €0.50, 60%	€1.754	−€341
1 GPU Inference API + 1 GPU B2B + 2 GPUs Vast.ai	~€1.900	−€195

Selbst im Worst Case bleibt der Verlust unter €350/Mo — tragbar, wenn man bedenkt dass €1.500/Mo davon Eigenkapitalaufbau (Tilgung) sind.

5. Exit-Schwelle (< €0.40 netto, >3 Monate)¶

Trigger: 90-Tage-Median unter €0.40 — Markt ist strukturell kollabiert.

Option	Geschätzter Erlös	Timing
Hardware-Resale (4× A100 80GB + Server)	€25.000–35.000	4–8 Wochen
Finanzierung weiter bedienen, Server offline	−€1.500/Mo (nur Finanzierung)	Sofort
Finanzierung mit Bank verhandeln (Stundung)	Reduziert auf ~€500/Mo	2–4 Wochen

Exit ist der letzte Ausweg

Die A100 hat einen stabilen Resale-Markt. Selbst nach 24 Monaten Nutzung sind €20.000–25.000 Resale realistisch. Der Verlust wäre begrenzt auf die Differenz zwischen Finanzierungsrestschuld und Resale-Erlös.

6. Vorbereitungs-Timeline¶

Was muss vor einem Preisverfall vorbereitet sein, damit die Maßnahmen sofort greifen?

Maßnahme	Vorbereitung nötig	Wann fertig sein?	Status
TensorDock Account + Listing	Account anlegen, Libvirt-Hypervisor	Vor Phase-A-Start	❌ Offen
B2B Landing Page	Einfache Seite mit Preisen, SLA, Kontaktformular	Monat 1–2	❌ Offen
RunPod Sales-Gespräch	Anfrage stellen, Konditionen klären	Monat 1	❌ Offen
vLLM/TGI Inference-Stack	Docker-Setup, API-Gateway, 1 Modell deployen	Monat 2–3	❌ Offen
B2B Pilotkunde	1 Kunde über Netzwerk/LinkedIn	Monat 3–4	❌ Offen
Automatische Preisanpassung	Script: Preis dynamisch an Markt anpassen	Monat 1	❌ Offen
Kill-Signal-Monitoring	Automatische Alerts bei Preisverfall-Schwellen	Vor Phase-A-Start	❌ Offen

Kernprinzip

Vorbereiten, bevor man es braucht. TensorDock-Listing und B2B-Landing-Page kosten wenig Aufwand, müssen aber stehen bevor der Preis fällt. Im Ernstfall ist keine Zeit für 2 Wochen Setup.

7. Zusammenfassung: Cashflow-Brücke¶

Das Contingency-System bildet eine Brücke zwischen Spot-Preisverfall und vollständigem Exit:

Vast.ai Spot-Preis (netto EUR/GPU/h):

 €1.00+  ███████████████████████████████  Komfort — Cashflow +€200–400/Mo
 €0.85   ████████████████████████████     Plan — Pricing optimieren
 €0.72   ██████████████████████           Wachsam — Multi-Plattform
 €0.60   ████████████████                 Plan B — B2B + TensorDock → ~Break-even
 €0.50   ██████████████                   Stufe 2 — Aggressive Diversifikation → −€200–350/Mo
 €0.40   ████████████                     Exit prüfen — Resale €25–35k

Die zentrale Erkenntnis: Zwischen „Vast.ai ist profitabel" und „wir müssen den Server verkaufen" liegen 3–4 Stufen von Maßnahmen, die den Verlust auf ein tragbares Niveau begrenzen. Der Server bezahlt sich durch die Finanzierung langfristig selbst — die Frage ist nur, ob wir die Durststrecken überbrücken können.

Antwort: Ja — wenn wir vorher die Infrastruktur vorbereiten.

Dieses Dokument wird aktualisiert, sobald sich die Marktlage ändert oder neue Monetarisierungsoptionen evaluiert werden.