Zum Inhalt

Skalierungsstrategien & Alternative Business Cases

Stand: April 2026 Kontext: redc validiert Phase A (1× 4xA100 80GB, Vast.ai, Colocation). Dieses Dokument bewertet systematisch alle realistischen Pfade, die AI-Compute-Kapazität wirtschaftlich hochzuskalieren — über den reinen Marketplace-Ansatz hinaus.

Kernannahme: Die Nachfrage nach AI-Compute wird massiv steigen (2,25× pro Jahr). Wer jetzt Kapazität aufbaut, hat einen strukturellen Vorteil. Die Frage ist: wie skaliert man am schnellsten und wirtschaftlichsten?


1. Übersicht: Skalierungspfade

# Strategie Einstieg ab Kapital Marge vs. Marketplace Priorität
S1 Multi-Plattform Marketplace Phase A Gering +0–15% ⭐⭐⭐ Sofort
S2 B2B Direktverträge Phase A+ Gering +20–40% ⭐⭐⭐ Sofort
S3 Managed Inference Platform Phase B (8+ GPUs) Mittel (SW-Dev) +30–60% ⭐⭐ Mittelfrist
S4 KI-Startup-Partnerschaften Phase A+ Gering +10–25% ⭐⭐⭐ Sofort
S5 Revenue-Based Financing Phase B (nachgewiesener Umsatz) Keins (ist Finanzierung) N/A ⭐⭐ Mittelfrist
S6 KfW / Fördermittel Phase A Gering (Antragsaufwand) N/A ⭐⭐⭐ Sofort prüfen
S7 Cluster-as-a-Service (Training) Phase B+ (16+ GPUs) Hoch (InfiniBand) +30–50% ⭐ Langfrist
S8 Sovereign Cloud / EU-Aufträge Phase B (Zertifizierungen) Mittel +20–40% ⭐⭐ Mittelfrist
S9 GPU-Leasing an Dritte Phase B Gering +15–25% ⭐⭐ Mittelfrist

2. Detailanalyse

S1: Multi-Plattform Marketplace ⭐⭐⭐

Idee: Nicht nur Vast.ai, sondern parallel auf TensorDock, und perspektivisch RunPod.

Warum: Risikodiversifikation + Auslastungsoptimierung. Wenn Vast.ai 80% Auslastung bringt, kann die restliche Zeit auf TensorDock monetarisiert werden.

Plattform Fee Endkundenpreis A100 80GB Realistisch ab
Vast.ai 0% $0.65–1.20 (Marktpreis) Phase A
TensorDock 25% $0.80–1.10 Phase A+
RunPod Secure Individuell $1.39 (Fixpreis) Phase B (SOC2 nötig)

Aufwand: Gering — TensorDock-Bewerbung einreichen, Libvirt-Hypervisor installieren. Risiko: Verschiedene Tech-Stacks (Container vs. VM) können komplex werden.

Empfehlung: TensorDock-Bewerbung in Phase A einreichen. RunPod Sales-Gespräch starten.

Siehe Plattformvergleich für Details.


S2: B2B Direktverträge ⭐⭐⭐

Idee: Statt über Marketplaces direkt an Unternehmen verkaufen — dedizierte GPU-Kapazität mit SLA.

Warum: Keine Plattform-Fees, höhere Preise, planbare Auslastung, Kundenbindung.

Preisvergleich:

Kanal Typischer Preis A100 80GB Fee Netto Host
Vast.ai Spot $0.93–1.07 0% $0.93–1.07
B2B Direkt (EU) $1.20–1.60 0% $1.20–1.60
RunPod Secure (Referenz) $1.39 Individuell ~$0.90–1.10

Zielkunden: - Kleine KI-Startups in DE/EU, die stable Compute brauchen aber keine AWS-Verträge wollen - Forschungsinstitute / Universitäten (Drittmittelprojekte mit Compute-Budget) - MLOps-Teams, die dedizierte Fine-Tuning- oder Inferenz-Kapazität mieten - KI-Agenturen, die für Kundenprojekte GPU-Burst-Kapazität brauchen

Einstieg: 1. Eigene Landing Page mit Preisen, SLA, Standort-Info (DE, DSGVO-konform) 2. 1–2 Pilotkunden über Netzwerk/LinkedIn akquirieren 3. Einfacher Vertrag: Monatsabrechnung, 30 Tage Kündigungsfrist 4. API/SSH-Zugang direkt auf die Hardware (kein Marketplace-Overhead)

Marge: +20–40% über Marketplace. Bei $1.30 direkt statt $1.00 auf Vast.ai → €360 Mehrumsatz/Mo pro Server bei 80% Auslastung.

Risiko: Akquise-Aufwand, Kundensupport, SLA-Verpflichtungen.

Empfehlung: Ab Phase A+ (nach 3 Monaten Betriebserfahrung) aktiv Pilotkunden suchen. Selbst 1 Direktkunde für 2 GPUs zu $1.30 verbessert die Gesamtmarge signifikant.


S3: Managed Inference Platform ⭐⭐

Idee: Statt rohe GPUs zu vermieten: eine Plattform anbieten, auf der Kunden KI-Modelle deployen und per API nutzen.

Warum: Deutlich höhere Margen — Kunden zahlen für Convenience, nicht für Rohcompute.

Vergleich:

Anbieter Preis pro Token (GPT-4-Klasse) GPU-Kosten dahinter Bruttomarge
OpenAI $15/M Input, $60/M Output ~$2–4/h 60–80%
Replicate $0.50–2.00/h pro Model $0.30–1.00/h 50–70%
redc (hypothetisch) $0.80–1.50/h pro Model $0.72 Break-even 10–50%

Einstieg realistisch ab: 8–16 GPUs (Phase B). Erfordert Software-Entwicklung: - Container-Orchestrierung (Kubernetes oder leichtere Alternative) - Model-Deployment-Pipeline (vLLM, TGI, Triton) - API-Gateway + Billing - Monitoring + Auto-Scaling

Aufwand: Hoch. 3–6 Monate Entwicklung für MVP. Eher für einen technischen Gründer machbar.

Empfehlung: Nicht für Phase A. Ab Phase B evaluieren — evtl. mit Open-Source-Tools (vLLM + Caddy + Stripe) ein Minimal-Angebot bauen.


S4: KI-Startup-Partnerschaften ⭐⭐⭐

Idee: Direkte Partnerschaften mit wachsenden KI-Startups — dedizierte Kapazität gegen Commitment.

Warum: Planbare Auslastung, gegenseitiges Wachstum, potenziell Equity-Tausch.

Modelle:

Modell Beschreibung Vorteil
Compute-Credit-Deal Startup bekommt X GPU-Stunden/Mo zu Vorzugspreis, zahlt 3–6 Mo im Voraus Cash-Vorlauf, planbare Auslastung
Revenue Share Startup zahlt % vom Umsatz statt Fixpreis Wächst mit Startup mit
Equity-for-Compute redc stellt Compute, bekommt kleine Beteiligung High Risk / High Reward

Zielgruppe: Deutsche KI-Startups in der Pre-Seed/Seed-Phase, die: - Kein Budget für AWS Reserved Instances haben - Flexible Compute brauchen (Training + Inference) - DSGVO-konforme Infrastruktur in DE benötigen

Einstieg: LinkedIn, KI-Meetups (Berlin, München), Startup-Acceleratoren (EXIST, TechFounders). 1–2 Partnerschaften können 50% der Serverauslastung abdecken.

Empfehlung: Parallel zu Phase A Netzwerk aufbauen. Erste Partnerschaft ab Monat 3–6 realistisch.


S5: Revenue-Based Financing (RBF) ⭐⭐

Idee: Wachstumskapital ohne Eigenkapitalverwässerung — Investor erhält % des Umsatzes bis Rückzahlung.

Warum: Klassischer Mietkauf skaliert linear (1 Server = 1 Finanzierung). RBF kann schnelleres Wachstum ermöglichen, wenn der Umsatz bewiesen ist.

Funktionsweise: 1. redc weist 6 Monate stabilen Umsatz nach (€2.000+/Mo) 2. RBF-Anbieter stellt €50–100k zur Verfügung 3. redc zahlt 5–10% des monatlichen Umsatzes zurück 4. Rückzahlung: 1,2–1,5× des Investitionsbetrags

Anbieter in DE/EU: - re:cap (Berlin) — spezialisiert auf SaaS/Tech - Clearco (EU-weit) - Wayflyer (E-Commerce/Tech) - Capchase (recurring revenue)

Einstieg: Erst nach 6+ Monaten Phase A mit nachgewiesenem Umsatz. Typisch €50–200k verfügbar.

Vorteil vs. weiterer Mietkauf: Schnellere Freigabe, keine persönliche Bürgschaft, flexible Rückzahlung.


S6: KfW & Fördermittel ⭐⭐⭐

Idee: Staatliche Finanzierung und Förderprogramme für den Aufbau.

KfW ERP-Gründerkredit

Parameter Details
Programm ERP-Gründerkredit — StartGeld / Universell
Betrag Bis €500.000 (Investition + Betriebsmittel)
Konditionen Zinsgünstig, bis 2 tilgungsfreie Anlaufjahre
Sicherheiten KfW übernimmt 80% Haftungsfreistellung
Antrag Über Hausbank (Hausbankprinzip)
Relevanz ⭐⭐⭐ Direkt nutzbar für Hardware-Finanzierung Server 2–4

Empfehlung: Sofort mit Hausbank sprechen. KfW-Gründerkredit als Alternative oder Ergänzung zu Mietkauf für Phase B Server evaluieren. Besonders die 80% Haftungsfreistellung reduziert das persönliche Risiko deutlich.

IPCEI-CIS (Cloud/Edge) & IPCEI-AI

Parameter Details
Programm IPCEI für Cloud-Infrastruktur und KI
Betrag Bis €25M (als assoziierter Partner)
Relevanz ⚠️ Nur als Konsortialpartner realistisch

Thematisch hochrelevant (souveräne EU-Cloud, KI-Compute), aber die Projektgröße ist für eine UG in Phase A unrealistisch als Lead. Ab Phase B+ könnte redc als assoziierter Partner in einem Konsortium mitlaufen — z.B. als Compute-Provider für ein Forschungsprojekt.

Gaia-X Lighthouse-Projekte

BMWK hat Gaia-X-Leuchtturmprojekte bis Juni 2025 gefördert. Neue Runden für 2026 sind wahrscheinlich. redc könnte sich als souveräner Compute-Provider positionieren — DE-Standort, DSGVO-Konformität, perspektivisch Green Compute.

Empfehlung: Gaia-X Hub Deutschland beobachten. Bei neuen Ausschreibungen als Compute-Provider bewerben.

Weitere Programme

Programm Relevanz Einstieg
BMBF KI-Forschungsförderung Indirekt — als Compute-Partner für Forschungsprojekte Phase B
EU Chips Act Competence Centres Indirekt — Zugang zu Expertise/Ressourcen Phase B+
Landesförderung (NRW, BY, BE) Unklar — keine spezifischen Programme für GPU-Hosting identifiziert Prüfen

S7: Cluster-as-a-Service (Training) ⭐

Idee: Dedizierte GPU-Cluster mit InfiniBand-Interconnect für Trainings-Workloads anbieten.

Warum: Training ist der GPU-intensivste und margenträchtigste Workload. Kunden zahlen Premium für niedrige Latenz zwischen GPUs.

Anforderungen: - ≥16 GPUs mit NVLink/InfiniBand-Interconnect - Shared Storage (NVMe-oF, Lustre) - Cluster-Management (SLURM, Kubernetes) - Hardware-Invest: €200k+ für 16 GPU + Netzwerk

Einstieg: Frühestens Phase B+ (16+ GPUs). Erfordert erhebliche Hardware-Investition in Netzwerk-Infrastruktur.

Realitätscheck: A100 PCIE hat kein NVLink und kein InfiniBand — das limitiert die Multi-GPU-Training-Performance erheblich. Für ernsthaftes Training-as-a-Service bräuchte redc SXM4-Varianten mit NVLink. Das ist ein anderer Hardware-Pfad als der aktuelle Plan.

Empfehlung: Nicht mit A100 PCIE verfolgen. Falls H100/H200 SXM in Phase B beschafft wird, dann als Option evaluieren.


S8: Sovereign Cloud / EU-Aufträge ⭐⭐

Idee: Sich als "souveräner" AI-Compute-Provider positionieren — DE-Standort, DSGVO, perspektivisch Green Compute.

Warum: EU-CSRD zwingt Unternehmen ab 2025 zur Nachhaltigkeitsberichterstattung. Deutsche Datenresidenz wird zunehmend nachgefragt. Öffentliche Auftraggeber bevorzugen EU-Anbieter.

Differenzierung:

Merkmal Hyperscaler (AWS/GCP) redc
Datenresidenz EU-Region (US-Firma) DE (deutsche UG)
DSGVO Compliance über Auftragsverarbeitung Deutsche Firma, DE-Rechenzentrum
Green Compute "100% Renewable" Claims Phase C: nachweisbar direkt am EE-Standort
Preis A100 80GB $2–4/h $1.00–1.30/h

Zielkunden: Öffentliche Forschung, Behörden, regulierte Industrie (Finanz, Gesundheit), CSRD-pflichtige Unternehmen.

Einstieg: Ab Phase B mit ISO 27001 / BSI C5 Zertifizierung des Colo-Partners. Marketing-Website mit Sovereign-Cloud-Positionierung.

Empfehlung: Positionierung bereits in Phase A aufbauen (Website, Messaging). Zertifizierungen über Colo-Partner abbilden. Erste Behörden-/Forschungsanfragen ab Phase B möglich.


S9: GPU-Leasing an Dritte ⭐⭐

Idee: Statt eigene GPUs auf Marketplaces zu listen, komplette Server an andere Hosting-Anbieter oder Startups leasen.

Warum: Garantierte Einnahmen, kein Marketplace-Risiko, kein Kundensupport.

Modell: - redc finanziert Server (€1.500/Mo Mietkauf) - Vermietet den kompletten Server an Startup X für €2.200/Mo (12-Monats-Vertrag) - Startup betreibt den Server selbst (Vast.ai, eigene Kunden etc.) - redc Marge: €105/Mo nach OPEX (€595) + Finanzierung (€1.500)

Vorteil: Risikoarm, planbar, skalierbar. Nachteil: Niedrigere Marge als eigenes Hosting. Abhängigkeit von einem Mieter.

Empfehlung: Als Fallback-Strategie behalten, falls Marketplace-Auslastung dauerhaft unter 70% bleibt.


3. Empfohlene Skalierungsstrategie

Phase A (Monat 1–6): Validierung

Primär:    Vast.ai (100% Traffic)
Parallel:  TensorDock-Bewerbung, RunPod-Sales-Gespräch
Vorbereitung: B2B-Website aufsetzen, Netzwerk aufbauen
Prüfen:    KfW ERP-Gründerkredit für Phase B

Phase A+ (Monat 6–12): Diversifikation

Marketplace: Vast.ai + TensorDock (~85% Auslastung gesamt)
B2B:         1–2 Pilotkunden (dedizierte GPUs, $1.20–1.40/h)
Partnering:  1 KI-Startup-Partnerschaft (Compute-Credits)
Finanzierung: KfW-Antrag für Server 2

Phase B (Monat 12–24): Skalierung

Server:     2–4 (8–16 GPUs)
Marketplace: Vast.ai + TensorDock + RunPod Secure
B2B:        3–5 Direktkunden (30–40% der Kapazität)
Plattform:  Managed Inference MVP evaluieren
Förderung:  Gaia-X / IPCEI als Konsortialpartner prüfen
Sovereign:  ISO 27001 über Colo-Partner, erste Behörden-Anfragen

Phase B+ (Monat 24–36): Premium-Positionierung

Server:     5–9 (20–36 GPUs)
Mix:        40% B2B Direkt, 40% Marketplace, 20% Managed
Finanzierung: RBF für schnellere Skalierung
Hardware:   H100/H200 für Premium-Segment evaluieren
Sovereign:  BSI C5, erste öffentliche Aufträge

4. Wirtschaftlicher Vergleich der Strategien

Annahme: 4× A100 80GB, 80% Auslastung, €2.095/Mo Fixkosten

Strategie Preis $/GPU/h Netto €/Mo Cashflow/Mo vs. Baseline
Baseline (Vast.ai only, $0.93) $0.93 €2.008 −€87
Multi-Plattform ($0.93 Vast + $1.00 TD) ~$0.95 €2.052 −€43 +€44
+ 1 B2B-Kunde (2 GPUs @ $1.30) ~$1.12 eff. €2.414 +€319 +€406
+ Startup-Partner (2 GPUs vorab bezahlt) ~$1.05 eff. €2.268 +€173 +€260
Managed Inference (4 GPUs @ $1.50 eff.) $1.50 €3.237 +€1.142 +€1.229

Kerninsight

Ein einziger B2B-Direktkunde für 2 GPUs zu $1.30 macht den Unterschied zwischen Verlust und €319/Mo Gewinn. Die Marketplace-Optimierung bringt €44/Mo — die B2B-Diversifikation bringt €406/Mo. Der Hebel liegt nicht im Marketplace-Preis, sondern in der Kundenmix-Strategie.


5. Finanzierungslandschaft für Skalierung

Quelle Betrag Konditionen Zeitpunkt
Mietkauf (aktuell) ~€58k pro Server 48 Mo, ~€1.500/Mo Phase A ✅
KfW ERP-Gründerkredit bis €500k Zinsgünstig, 80% Haftungsfreist. Phase B ⭐
Revenue-Based Financing €50–200k 5–10% vom Umsatz, 1,2–1,5× Rückzahlung Phase B+ (nach 6 Mo Umsatz)
IPCEI / Gaia-X variabel Zuschüsse, als Konsortialpartner Phase B+
Landesförderbank (NRW.BANK, IBB etc.) €50–500k Ergänzend zu KfW Phase B

Empfehlung: KfW ist der wichtigste Hebel für Phase B. Die 80% Haftungsfreistellung bedeutet: bei €58k Hardware-Kredit haftet man persönlich nur für €11.600 statt €58.000. Das de-risked die Skalierung massiv.


6. Risiken & Warnsignale

Risiko Betrifft Mitigation
Kundenkonzentration (1 B2B-Kunde = 50%) S2, S4 Max 40% pro Kunde, Marketplace als Fallback
Software-Entwicklung ohne Kunden (S3) S3 Erst MVP, dann Kunden — nicht umgekehrt
Überfinanzierung (mehr Server als Nachfrage) S5, S6 Gate-System aus BP §10 strikt einhalten
PCIE-Limitation für Training (kein NVLink) S7 A100 PCIE = Inference/Fine-Tuning. Training-Cluster erst mit SXM4/H100
Sovereign-Washing ohne Substanz S8 Zertifizierungen aufbauen, nicht nur Marketing

Dieses Dokument wird aktualisiert, sobald sich die Markt- oder Förderlage ändert. Letzte Aktualisierung: April 2026