Contingency-Plan: Preisverfall & Alternative Monetarisierung¶
Stand: 07. April 2026 Kontext: 6 Monate Marktdaten zeigen, dass der A100-Median historisch in 79% der Zeit unter unserem Break-even (€0.718/GPU/h) lag. Im Winter 2025/26 hätten wir 2–3 Monate Verlust gemacht. Dieses Dokument definiert abgestufte Maßnahmen, bevor ein vollständiger Exit nötig wird.
Zweck: Nicht Exit-Plan, sondern Zwischenplan — wie nutzen wir den Server gewinnbringend (oder verlustminimierend), wenn der Vast.ai-Spot-Preis einbricht?
1. Eskalationsstufen¶
Netto-EUR/GPU/h Status Maßnahme
─────────────────────────────────────────────────────────────
> €1.00 ✅ Komfort Business as usual
€0.85 – €1.00 ✅ Plan Preisoptimierung, Multi-Plattform vorbereiten
€0.72 – €0.85 ⚠️ Wachsam Multi-Plattform aktiv, B2B-Akquise starten
€0.55 – €0.72 🔴 Stufe 1 Plan B aktivieren: Alternative Monetarisierung
€0.40 – €0.55 🔴 Stufe 2 Aggressive Diversifikation, Kostenreduktion
< €0.40 🚪 Exit prüfen Hardware-Resale evaluieren
2. Stufe „Wachsam" (€0.72 – €0.85 netto)¶
Trigger: 7-Tage-Rolling-Median fällt unter €0.85 Ziel: Auslastung maximieren, Einnahmequellen diversifizieren
Sofort-Maßnahmen (Aufwand: gering)¶
| # | Maßnahme | Erwarteter Effekt | Zeitbedarf |
|---|---|---|---|
| W1 | Vast.ai Pricing aggressiv optimieren — näher an P50 listen, Splitting-Strategie anpassen (1x/2x/4x GPU-Slices) | +5–10pp Auslastung | Sofort |
| W2 | TensorDock-Listing aktivieren — für Leerlauf-Zeiten auf Vast.ai | +10–15% Auslastung in Lücken | 1–2 Wochen Setup |
| W3 | Monitoring verschärfen — stündliche Preisalerts, automatische Preisanpassung | Schnellere Reaktion | 1 Woche |
Vorbereitung (parallel)¶
| # | Maßnahme | Vorbereitung für |
|---|---|---|
| W4 | B2B Landing Page aufsetzen (einfach, DE-fokussiert) | Stufe 1 – Direktkunden-Akquise |
| W5 | RunPod Sales kontaktieren — Host-Partner-Konditionen anfragen | Stufe 1 – Plattform-Diversifikation |
| W6 | Inference-Stack evaluieren — vLLM/TGI Setup testen, populäre Modelle | Stufe 1 – Managed Inference |
3. Stufe 1: Plan B (€0.55 – €0.72 netto)¶
Trigger: 14-Tage-Rolling-Median fällt unter Break-even (€0.718) Ziel: Verluste minimieren, alternative Einnahmen aufbauen
3.1 Plattform-Wechsel: Vast.ai ↔ TensorDock (Fallback-Strategie)¶
Die zwei Plattformen haben unterschiedliche Pricing-Modelle und Kundenbasis, was sie als gegenseitigen Fallback wertvoll macht:
| Vast.ai | TensorDock | |
|---|---|---|
| Technologie | Docker Container | KVM Virtual Machines |
| Fee | 0% | 25% |
| Billing | All-inclusive /GPU/h | À la carte (GPU + CPU + RAM + Storage) |
| Endkundenpreis A100 | $0.80–1.20 | $1.23+ (mit 128GB RAM, 2TB NVMe) |
| Host-Netto | $0.80–1.20 | ~$0.92 (75% vom Gesamtpreis) |
| Host-Netto EUR | €0.74–1.11 | ~€0.85 |
| Kundenbasis | ML-Community, preissensitiv | Enterprise/Business, stabilere Nachfrage |
| Uptime-Standard | Keiner | 99.99% (mit Penalties) |
Fallback-Logik: Nicht Parallelbetrieb, sondern Plattformwechsel bei Preisverfall:
- Normalfall: Server läuft auf Vast.ai (0% Fee, höchste Liquidität)
- Vast.ai-Preisverfall (<€0.72): Server auf TensorDock umstellen — Enterprise-Kunden zahlen stabilere Preise, und unser Profil (viel RAM, viel NVMe) profitiert durch das komponentenbasierte Pricing überdurchschnittlich
- TensorDock-Preisverfall: Zurück zu Vast.ai, oder B2B-Direktverträge aktivieren
Vorbereitung nötig: TensorDock benötigt KVM/Libvirt statt Docker → OS-Umstellung. Muss vor dem Ernstfall einmal durchgespielt sein (Hypervisor-Setup, TensorDock-Onboarding, Testlisting).
Geschätzter Umstellungsaufwand: 1–2 Tage (OS-Reinstall + KVM-Setup + TensorDock-Freischaltung, wenn Account bereits genehmigt).
| Plattform | Fee | Host-Netto (A100) | Vorteil |
|---|---|---|---|
| Vast.ai | 0% | $0.80–1.20 | Höchste Liquidität, Container-basiert |
| TensorDock | 25% | ~$0.92 (bei $1.23 Endkunde) | Enterprise-Kunden, komponentenbasiert |
| RunPod | Individuell | ~$0.90–1.10 (wenn akzeptiert) | Premium-Segment, Fixpreise |
3.2 B2B-Direktverträge (Aufbau 4–8 Wochen)¶
| Parameter | Wert |
|---|---|
| Zielpreis | €0.90–1.20/GPU/h (20–40% über Marketplace) |
| Zielkunden | KI-Startups, Forschungsinstitute, MLOps-Teams in DE/EU |
| Minimum-Commitment | 1 GPU, 1 Monat, monatliche Abrechnung |
| SLA | 99.5% Uptime (Colo-SLA), SSH/API-Zugang, dedizierte GPU |
| USP | DE-Standort, DSGVO-konform, keine Marketplace-Overhead |
Rechnung bei 2 GPUs B2B @ €1.10 + 2 GPUs Vast.ai @ €0.60:
| Position | Einnahmen/Mo |
|---|---|
| 2 GPUs × €1.10 × 730h × 90% Ausl. | €1.446 |
| 2 GPUs × €0.60 × 730h × 70% Ausl. | €613 |
| Gesamt | €2.059 |
| Kosten | €2.095 |
| Cashflow | −€36 |
Fast Break-even — selbst wenn Vast.ai auf €0.60 einbricht. Ohne B2B-Anteil wären es −€372/Mo.
Kernvorteil B2B
Direktkunden haben keine Korrelation zum Vast.ai-Spot-Preis. Wenn der Marktplatz einbricht, laufen B2B-Verträge weiter zu festen Konditionen. Das ist die wichtigste Absicherung gegen Preisverfall.
3.3 Managed Inference API (Aufbau 2–4 Wochen)¶
Idee: Populäre Open-Source-Modelle hosten und Inference-API als Service verkaufen.
| Modell | VRAM-Bedarf | Deployment | Preis-Referenz |
|---|---|---|---|
| Llama 3.1 70B (4-bit) | ~40GB → 1 GPU | vLLM | $0.40–0.80/1M tokens |
| Mistral Large | ~80GB → 1 GPU | vLLM/TGI | $2.00/1M tokens (Mistral API) |
| SDXL / Flux | ~12GB → 1 GPU | ComfyUI API | $0.02–0.05/Bild |
| Whisper Large v3 | ~10GB → 1 GPU | faster-whisper | $0.006/Minute Audio |
Margen-Logik: Bei hoher Auslastung (>80%) erwirtschaftet ein Inference-Endpoint €0.80–1.50/GPU/h effektiv — deutlich über dem Vast.ai-Spot-Preis, weil der Endkunde für Convenience und API-Zugang zahlt, nicht für Raw-GPU.
Aufwand: Mittel — vLLM/TGI Setup, API-Gateway, Billing, Monitoring. Realistische Vorbereitungszeit: 2–4 Wochen für MVP.
Risiko: Kundensupport, SLA-Verpflichtungen, Modell-Updates, Wettbewerb mit Together.ai/Fireworks/Groq.
3.4 Fine-Tuning-as-a-Service (Aufbau 4–8 Wochen)¶
Idee: Managed Fine-Tuning für KMUs anbieten — Kunden liefern Daten, wir liefern das Modell.
| Paket | Umfang | Preis (Marktrecherche) |
|---|---|---|
| Basis | LoRA Fine-Tune, 7B Modell, bis 10k Beispiele | €200–500 einmalig |
| Standard | Full Fine-Tune, 13–70B Modell, Custom Eval | €500–2.000 |
| Enterprise | Multi-Model, RAG-Integration, Monitoring | €2.000–5.000/Mo |
GPU-Kosten pro Job: Ein LoRA Fine-Tune eines 7B-Modells dauert 1–4 GPU-Stunden → Kosten €0.72–2.88, Verkaufspreis €200+ → Marge >95%.
Risiko: Kleiner Markt, beratungsintensiv, skaliert schlecht. Aber: füllt GPU-Leerlaufzeiten und baut Expertise/Reputation auf.
4. Stufe 2: Aggressive Diversifikation (€0.40 – €0.55 netto)¶
Trigger: 30-Tage-Median fällt unter €0.55 Ziel: Verluste begrenzen, Server wirtschaftlich halten bis Markterholung
Zusätzliche Maßnahmen¶
| # | Maßnahme | Erwartete Einnahmen |
|---|---|---|
| D1 | GPU-Rendering (Blender, Video-Transcoding) | €0.40–0.70/GPU/h |
| D2 | Wissenschaftliches Rechnen (Simulation, Molecular Dynamics) | €0.50–0.80/GPU/h (Uni-Budgets) |
| D3 | Kostenreduktion — Wartungsrücklage temporär auf €100/Mo senken | −€100/Mo Fixkosten |
| D4 | Kurzfristige B2B-Rabatte — 3-Monats-Pakete zu €0.80/GPU/h | Planbare Einnahmen vs. Spot-Verlust |
Worst-Case-Rechnung bei €0.50 Vast.ai + Diversifikation¶
| Szenario | Einnahmen/Mo | Cashflow |
|---|---|---|
| 4 GPUs rein Vast.ai @ €0.50, 60% Ausl. | €876 | −€1.219 |
| 2 GPUs B2B @ €0.90, 90% + 2 GPUs Vast.ai @ €0.50, 60% | €1.754 | −€341 |
| 1 GPU Inference API + 1 GPU B2B + 2 GPUs Vast.ai | ~€1.900 | −€195 |
Selbst im Worst Case bleibt der Verlust unter €350/Mo — tragbar, wenn man bedenkt dass €1.500/Mo davon Eigenkapitalaufbau (Tilgung) sind.
5. Exit-Schwelle (< €0.40 netto, >3 Monate)¶
Trigger: 90-Tage-Median unter €0.40 — Markt ist strukturell kollabiert.
| Option | Geschätzter Erlös | Timing |
|---|---|---|
| Hardware-Resale (4× A100 80GB + Server) | €25.000–35.000 | 4–8 Wochen |
| Finanzierung weiter bedienen, Server offline | −€1.500/Mo (nur Finanzierung) | Sofort |
| Finanzierung mit Bank verhandeln (Stundung) | Reduziert auf ~€500/Mo | 2–4 Wochen |
Exit ist der letzte Ausweg
Die A100 hat einen stabilen Resale-Markt. Selbst nach 24 Monaten Nutzung sind €20.000–25.000 Resale realistisch. Der Verlust wäre begrenzt auf die Differenz zwischen Finanzierungsrestschuld und Resale-Erlös.
6. Vorbereitungs-Timeline¶
Was muss vor einem Preisverfall vorbereitet sein, damit die Maßnahmen sofort greifen?
| Maßnahme | Vorbereitung nötig | Wann fertig sein? | Status |
|---|---|---|---|
| TensorDock Account + Listing | Account anlegen, Libvirt-Hypervisor | Vor Phase-A-Start | ❌ Offen |
| B2B Landing Page | Einfache Seite mit Preisen, SLA, Kontaktformular | Monat 1–2 | ❌ Offen |
| RunPod Sales-Gespräch | Anfrage stellen, Konditionen klären | Monat 1 | ❌ Offen |
| vLLM/TGI Inference-Stack | Docker-Setup, API-Gateway, 1 Modell deployen | Monat 2–3 | ❌ Offen |
| B2B Pilotkunde | 1 Kunde über Netzwerk/LinkedIn | Monat 3–4 | ❌ Offen |
| Automatische Preisanpassung | Script: Preis dynamisch an Markt anpassen | Monat 1 | ❌ Offen |
| Kill-Signal-Monitoring | Automatische Alerts bei Preisverfall-Schwellen | Vor Phase-A-Start | ❌ Offen |
Kernprinzip
Vorbereiten, bevor man es braucht. TensorDock-Listing und B2B-Landing-Page kosten wenig Aufwand, müssen aber stehen bevor der Preis fällt. Im Ernstfall ist keine Zeit für 2 Wochen Setup.
7. Zusammenfassung: Cashflow-Brücke¶
Das Contingency-System bildet eine Brücke zwischen Spot-Preisverfall und vollständigem Exit:
Vast.ai Spot-Preis (netto EUR/GPU/h):
€1.00+ ███████████████████████████████ Komfort — Cashflow +€200–400/Mo
€0.85 ████████████████████████████ Plan — Pricing optimieren
€0.72 ██████████████████████ Wachsam — Multi-Plattform
€0.60 ████████████████ Plan B — B2B + TensorDock → ~Break-even
€0.50 ██████████████ Stufe 2 — Aggressive Diversifikation → −€200–350/Mo
€0.40 ████████████ Exit prüfen — Resale €25–35k
Die zentrale Erkenntnis: Zwischen „Vast.ai ist profitabel" und „wir müssen den Server verkaufen" liegen 3–4 Stufen von Maßnahmen, die den Verlust auf ein tragbares Niveau begrenzen. Der Server bezahlt sich durch die Finanzierung langfristig selbst — die Frage ist nur, ob wir die Durststrecken überbrücken können.
Antwort: Ja — wenn wir vorher die Infrastruktur vorbereiten.
Dieses Dokument wird aktualisiert, sobald sich die Marktlage ändert oder neue Monetarisierungsoptionen evaluiert werden.