Skalierungsstrategien & Alternative Business Cases¶

Stand: April 2026 Kontext: redc validiert Phase A (1× 4xA100 80GB, Vast.ai, Colocation). Dieses Dokument bewertet systematisch alle realistischen Pfade, die AI-Compute-Kapazität wirtschaftlich hochzuskalieren — über den reinen Marketplace-Ansatz hinaus.

Kernannahme: Die Nachfrage nach AI-Compute wird massiv steigen (2,25× pro Jahr). Wer jetzt Kapazität aufbaut, hat einen strukturellen Vorteil. Die Frage ist: wie skaliert man am schnellsten und wirtschaftlichsten?

1. Übersicht: Skalierungspfade¶

#	Strategie	Einstieg ab	Kapital	Marge vs. Marketplace	Priorität
S1	Multi-Plattform Marketplace	Phase A	Gering	+0–15%	⭐⭐⭐ Sofort
S2	B2B Direktverträge	Phase A+	Gering	+20–40%	⭐⭐⭐ Sofort
S3	Managed Inference Platform	Phase B (8+ GPUs)	Mittel (SW-Dev)	+30–60%	⭐⭐ Mittelfrist
S4	KI-Startup-Partnerschaften	Phase A+	Gering	+10–25%	⭐⭐⭐ Sofort
S5	Revenue-Based Financing	Phase B (nachgewiesener Umsatz)	Keins (ist Finanzierung)	N/A	⭐⭐ Mittelfrist
S6	KfW / Fördermittel	Phase A	Gering (Antragsaufwand)	N/A	⭐⭐⭐ Sofort prüfen
S7	Cluster-as-a-Service (Training)	Phase B+ (16+ GPUs)	Hoch (InfiniBand)	+30–50%	⭐ Langfrist
S8	Sovereign Cloud / EU-Aufträge	Phase B (Zertifizierungen)	Mittel	+20–40%	⭐⭐ Mittelfrist
S9	GPU-Leasing an Dritte	Phase B	Gering	+15–25%	⭐⭐ Mittelfrist

2. Detailanalyse¶

S1: Multi-Plattform Marketplace ⭐⭐⭐¶

Idee: Nicht nur Vast.ai, sondern parallel auf TensorDock, und perspektivisch RunPod.

Warum: Risikodiversifikation + Auslastungsoptimierung. Wenn Vast.ai 80% Auslastung bringt, kann die restliche Zeit auf TensorDock monetarisiert werden.

Plattform	Fee	Endkundenpreis A100 80GB	Realistisch ab
Vast.ai	0%	$0.65–1.20 (Marktpreis)	Phase A
TensorDock	25%	$0.80–1.10	Phase A+
RunPod Secure	Individuell	$1.39 (Fixpreis)	Phase B (SOC2 nötig)

Aufwand: Gering — TensorDock-Bewerbung einreichen, Libvirt-Hypervisor installieren. Risiko: Verschiedene Tech-Stacks (Container vs. VM) können komplex werden.

Empfehlung: TensorDock-Bewerbung in Phase A einreichen. RunPod Sales-Gespräch starten.

Siehe Plattformvergleich für Details.

S2: B2B Direktverträge ⭐⭐⭐¶

Idee: Statt über Marketplaces direkt an Unternehmen verkaufen — dedizierte GPU-Kapazität mit SLA.

Warum: Keine Plattform-Fees, höhere Preise, planbare Auslastung, Kundenbindung.

Preisvergleich:

Kanal	Typischer Preis A100 80GB	Fee	Netto Host
Vast.ai Spot	$0.93–1.07	0%	$0.93–1.07
B2B Direkt (EU)	$1.20–1.60	0%	$1.20–1.60
RunPod Secure (Referenz)	$1.39	Individuell	~$0.90–1.10

Zielkunden: - Kleine KI-Startups in DE/EU, die stable Compute brauchen aber keine AWS-Verträge wollen - Forschungsinstitute / Universitäten (Drittmittelprojekte mit Compute-Budget) - MLOps-Teams, die dedizierte Fine-Tuning- oder Inferenz-Kapazität mieten - KI-Agenturen, die für Kundenprojekte GPU-Burst-Kapazität brauchen

Einstieg: 1. Eigene Landing Page mit Preisen, SLA, Standort-Info (DE, DSGVO-konform) 2. 1–2 Pilotkunden über Netzwerk/LinkedIn akquirieren 3. Einfacher Vertrag: Monatsabrechnung, 30 Tage Kündigungsfrist 4. API/SSH-Zugang direkt auf die Hardware (kein Marketplace-Overhead)

Marge: +20–40% über Marketplace. Bei $1.30 direkt statt $1.00 auf Vast.ai → €360 Mehrumsatz/Mo pro Server bei 80% Auslastung.

Risiko: Akquise-Aufwand, Kundensupport, SLA-Verpflichtungen.

Empfehlung: Ab Phase A+ (nach 3 Monaten Betriebserfahrung) aktiv Pilotkunden suchen. Selbst 1 Direktkunde für 2 GPUs zu $1.30 verbessert die Gesamtmarge signifikant.

S3: Managed Inference Platform ⭐⭐¶

Idee: Statt rohe GPUs zu vermieten: eine Plattform anbieten, auf der Kunden KI-Modelle deployen und per API nutzen.

Warum: Deutlich höhere Margen — Kunden zahlen für Convenience, nicht für Rohcompute.

Vergleich:

Anbieter	Preis pro Token (GPT-4-Klasse)	GPU-Kosten dahinter	Bruttomarge
OpenAI	$15/M Input, $60/M Output	~$2–4/h	60–80%
Replicate	$0.50–2.00/h pro Model	$0.30–1.00/h	50–70%
redc (hypothetisch)	$0.80–1.50/h pro Model	$0.72 Break-even	10–50%

Einstieg realistisch ab: 8–16 GPUs (Phase B). Erfordert Software-Entwicklung: - Container-Orchestrierung (Kubernetes oder leichtere Alternative) - Model-Deployment-Pipeline (vLLM, TGI, Triton) - API-Gateway + Billing - Monitoring + Auto-Scaling

Aufwand: Hoch. 3–6 Monate Entwicklung für MVP. Eher für einen technischen Gründer machbar.

Empfehlung: Nicht für Phase A. Ab Phase B evaluieren — evtl. mit Open-Source-Tools (vLLM + Caddy + Stripe) ein Minimal-Angebot bauen.

S4: KI-Startup-Partnerschaften ⭐⭐⭐¶

Idee: Direkte Partnerschaften mit wachsenden KI-Startups — dedizierte Kapazität gegen Commitment.

Warum: Planbare Auslastung, gegenseitiges Wachstum, potenziell Equity-Tausch.

Modelle:

Modell	Beschreibung	Vorteil
Compute-Credit-Deal	Startup bekommt X GPU-Stunden/Mo zu Vorzugspreis, zahlt 3–6 Mo im Voraus	Cash-Vorlauf, planbare Auslastung
Revenue Share	Startup zahlt % vom Umsatz statt Fixpreis	Wächst mit Startup mit
Equity-for-Compute	redc stellt Compute, bekommt kleine Beteiligung	High Risk / High Reward

Zielgruppe: Deutsche KI-Startups in der Pre-Seed/Seed-Phase, die: - Kein Budget für AWS Reserved Instances haben - Flexible Compute brauchen (Training + Inference) - DSGVO-konforme Infrastruktur in DE benötigen

Einstieg: LinkedIn, KI-Meetups (Berlin, München), Startup-Acceleratoren (EXIST, TechFounders). 1–2 Partnerschaften können 50% der Serverauslastung abdecken.

Empfehlung: Parallel zu Phase A Netzwerk aufbauen. Erste Partnerschaft ab Monat 3–6 realistisch.

S5: Revenue-Based Financing (RBF) ⭐⭐¶

Idee: Wachstumskapital ohne Eigenkapitalverwässerung — Investor erhält % des Umsatzes bis Rückzahlung.

Warum: Klassischer Mietkauf skaliert linear (1 Server = 1 Finanzierung). RBF kann schnelleres Wachstum ermöglichen, wenn der Umsatz bewiesen ist.

Funktionsweise: 1. redc weist 6 Monate stabilen Umsatz nach (€2.000+/Mo) 2. RBF-Anbieter stellt €50–100k zur Verfügung 3. redc zahlt 5–10% des monatlichen Umsatzes zurück 4. Rückzahlung: 1,2–1,5× des Investitionsbetrags

Anbieter in DE/EU: - re:cap (Berlin) — spezialisiert auf SaaS/Tech - Clearco (EU-weit) - Wayflyer (E-Commerce/Tech) - Capchase (recurring revenue)

Einstieg: Erst nach 6+ Monaten Phase A mit nachgewiesenem Umsatz. Typisch €50–200k verfügbar.

Vorteil vs. weiterer Mietkauf: Schnellere Freigabe, keine persönliche Bürgschaft, flexible Rückzahlung.

S6: KfW & Fördermittel ⭐⭐⭐¶

Idee: Staatliche Finanzierung und Förderprogramme für den Aufbau.

KfW ERP-Gründerkredit¶

Parameter	Details
Programm	ERP-Gründerkredit — StartGeld / Universell
Betrag	Bis €500.000 (Investition + Betriebsmittel)
Konditionen	Zinsgünstig, bis 2 tilgungsfreie Anlaufjahre
Sicherheiten	KfW übernimmt 80% Haftungsfreistellung
Antrag	Über Hausbank (Hausbankprinzip)
Relevanz	⭐⭐⭐ Direkt nutzbar für Hardware-Finanzierung Server 2–4

Empfehlung: Sofort mit Hausbank sprechen. KfW-Gründerkredit als Alternative oder Ergänzung zu Mietkauf für Phase B Server evaluieren. Besonders die 80% Haftungsfreistellung reduziert das persönliche Risiko deutlich.

IPCEI-CIS (Cloud/Edge) & IPCEI-AI¶

Parameter	Details
Programm	IPCEI für Cloud-Infrastruktur und KI
Betrag	Bis €25M (als assoziierter Partner)
Relevanz	⚠️ Nur als Konsortialpartner realistisch

Thematisch hochrelevant (souveräne EU-Cloud, KI-Compute), aber die Projektgröße ist für eine UG in Phase A unrealistisch als Lead. Ab Phase B+ könnte redc als assoziierter Partner in einem Konsortium mitlaufen — z.B. als Compute-Provider für ein Forschungsprojekt.

Gaia-X Lighthouse-Projekte¶

BMWK hat Gaia-X-Leuchtturmprojekte bis Juni 2025 gefördert. Neue Runden für 2026 sind wahrscheinlich. redc könnte sich als souveräner Compute-Provider positionieren — DE-Standort, DSGVO-Konformität, perspektivisch Green Compute.

Empfehlung: Gaia-X Hub Deutschland beobachten. Bei neuen Ausschreibungen als Compute-Provider bewerben.

Weitere Programme¶

Programm	Relevanz	Einstieg
BMBF KI-Forschungsförderung	Indirekt — als Compute-Partner für Forschungsprojekte	Phase B
EU Chips Act Competence Centres	Indirekt — Zugang zu Expertise/Ressourcen	Phase B+
Landesförderung (NRW, BY, BE)	Unklar — keine spezifischen Programme für GPU-Hosting identifiziert	Prüfen

S7: Cluster-as-a-Service (Training) ⭐¶

Idee: Dedizierte GPU-Cluster mit InfiniBand-Interconnect für Trainings-Workloads anbieten.

Warum: Training ist der GPU-intensivste und margenträchtigste Workload. Kunden zahlen Premium für niedrige Latenz zwischen GPUs.

Anforderungen: - ≥16 GPUs mit NVLink/InfiniBand-Interconnect - Shared Storage (NVMe-oF, Lustre) - Cluster-Management (SLURM, Kubernetes) - Hardware-Invest: €200k+ für 16 GPU + Netzwerk

Einstieg: Frühestens Phase B+ (16+ GPUs). Erfordert erhebliche Hardware-Investition in Netzwerk-Infrastruktur.

Realitätscheck: A100 PCIE hat kein NVLink und kein InfiniBand — das limitiert die Multi-GPU-Training-Performance erheblich. Für ernsthaftes Training-as-a-Service bräuchte redc SXM4-Varianten mit NVLink. Das ist ein anderer Hardware-Pfad als der aktuelle Plan.

Empfehlung: Nicht mit A100 PCIE verfolgen. Falls H100/H200 SXM in Phase B beschafft wird, dann als Option evaluieren.

S8: Sovereign Cloud / EU-Aufträge ⭐⭐¶

Idee: Sich als "souveräner" AI-Compute-Provider positionieren — DE-Standort, DSGVO, perspektivisch Green Compute.

Warum: EU-CSRD zwingt Unternehmen ab 2025 zur Nachhaltigkeitsberichterstattung. Deutsche Datenresidenz wird zunehmend nachgefragt. Öffentliche Auftraggeber bevorzugen EU-Anbieter.

Differenzierung:

Merkmal	Hyperscaler (AWS/GCP)	redc
Datenresidenz	EU-Region (US-Firma)	DE (deutsche UG)
DSGVO	Compliance über Auftragsverarbeitung	Deutsche Firma, DE-Rechenzentrum
Green Compute	"100% Renewable" Claims	Phase C: nachweisbar direkt am EE-Standort
Preis A100 80GB	$2–4/h	$1.00–1.30/h

Zielkunden: Öffentliche Forschung, Behörden, regulierte Industrie (Finanz, Gesundheit), CSRD-pflichtige Unternehmen.

Einstieg: Ab Phase B mit ISO 27001 / BSI C5 Zertifizierung des Colo-Partners. Marketing-Website mit Sovereign-Cloud-Positionierung.

Empfehlung: Positionierung bereits in Phase A aufbauen (Website, Messaging). Zertifizierungen über Colo-Partner abbilden. Erste Behörden-/Forschungsanfragen ab Phase B möglich.

S9: GPU-Leasing an Dritte ⭐⭐¶

Idee: Statt eigene GPUs auf Marketplaces zu listen, komplette Server an andere Hosting-Anbieter oder Startups leasen.

Warum: Garantierte Einnahmen, kein Marketplace-Risiko, kein Kundensupport.

Modell: - redc finanziert Server (€1.500/Mo Mietkauf) - Vermietet den kompletten Server an Startup X für €2.200/Mo (12-Monats-Vertrag) - Startup betreibt den Server selbst (Vast.ai, eigene Kunden etc.) - redc Marge: €105/Mo nach OPEX (€595) + Finanzierung (€1.500)

Vorteil: Risikoarm, planbar, skalierbar. Nachteil: Niedrigere Marge als eigenes Hosting. Abhängigkeit von einem Mieter.

Empfehlung: Als Fallback-Strategie behalten, falls Marketplace-Auslastung dauerhaft unter 70% bleibt.

3. Empfohlene Skalierungsstrategie¶

Phase A (Monat 1–6): Validierung¶

Primär:    Vast.ai (100% Traffic)
Parallel:  TensorDock-Bewerbung, RunPod-Sales-Gespräch
Vorbereitung: B2B-Website aufsetzen, Netzwerk aufbauen
Prüfen:    KfW ERP-Gründerkredit für Phase B

Phase A+ (Monat 6–12): Diversifikation¶

Marketplace: Vast.ai + TensorDock (~85% Auslastung gesamt)
B2B:         1–2 Pilotkunden (dedizierte GPUs, $1.20–1.40/h)
Partnering:  1 KI-Startup-Partnerschaft (Compute-Credits)
Finanzierung: KfW-Antrag für Server 2

Phase B (Monat 12–24): Skalierung¶

Server:     2–4 (8–16 GPUs)
Marketplace: Vast.ai + TensorDock + RunPod Secure
B2B:        3–5 Direktkunden (30–40% der Kapazität)
Plattform:  Managed Inference MVP evaluieren
Förderung:  Gaia-X / IPCEI als Konsortialpartner prüfen
Sovereign:  ISO 27001 über Colo-Partner, erste Behörden-Anfragen

Phase B+ (Monat 24–36): Premium-Positionierung¶

Server:     5–9 (20–36 GPUs)
Mix:        40% B2B Direkt, 40% Marketplace, 20% Managed
Finanzierung: RBF für schnellere Skalierung
Hardware:   H100/H200 für Premium-Segment evaluieren
Sovereign:  BSI C5, erste öffentliche Aufträge

4. Wirtschaftlicher Vergleich der Strategien¶

Annahme: 4× A100 80GB, 80% Auslastung, €2.095/Mo Fixkosten

Strategie	Preis $/GPU/h	Netto €/Mo	Cashflow/Mo	vs. Baseline
Baseline (Vast.ai only, $0.93)	$0.93	€2.008	−€87	—
Multi-Plattform ($0.93 Vast + $1.00 TD)	~$0.95	€2.052	−€43	+€44
+ 1 B2B-Kunde (2 GPUs @ $1.30)	~$1.12 eff.	€2.414	+€319	+€406
+ Startup-Partner (2 GPUs vorab bezahlt)	~$1.05 eff.	€2.268	+€173	+€260
Managed Inference (4 GPUs @ $1.50 eff.)	$1.50	€3.237	+€1.142	+€1.229

Kerninsight

Ein einziger B2B-Direktkunde für 2 GPUs zu $1.30 macht den Unterschied zwischen Verlust und €319/Mo Gewinn. Die Marketplace-Optimierung bringt €44/Mo — die B2B-Diversifikation bringt €406/Mo. Der Hebel liegt nicht im Marketplace-Preis, sondern in der Kundenmix-Strategie.

5. Finanzierungslandschaft für Skalierung¶

Quelle	Betrag	Konditionen	Zeitpunkt
Mietkauf (aktuell)	~€58k pro Server	48 Mo, ~€1.500/Mo	Phase A ✅
KfW ERP-Gründerkredit	bis €500k	Zinsgünstig, 80% Haftungsfreist.	Phase B ⭐
Revenue-Based Financing	€50–200k	5–10% vom Umsatz, 1,2–1,5× Rückzahlung	Phase B+ (nach 6 Mo Umsatz)
IPCEI / Gaia-X	variabel	Zuschüsse, als Konsortialpartner	Phase B+
Landesförderbank (NRW.BANK, IBB etc.)	€50–500k	Ergänzend zu KfW	Phase B

Empfehlung: KfW ist der wichtigste Hebel für Phase B. Die 80% Haftungsfreistellung bedeutet: bei €58k Hardware-Kredit haftet man persönlich nur für €11.600 statt €58.000. Das de-risked die Skalierung massiv.

6. Risiken & Warnsignale¶

Risiko	Betrifft	Mitigation
Kundenkonzentration (1 B2B-Kunde = 50%)	S2, S4	Max 40% pro Kunde, Marketplace als Fallback
Software-Entwicklung ohne Kunden (S3)	S3	Erst MVP, dann Kunden — nicht umgekehrt
Überfinanzierung (mehr Server als Nachfrage)	S5, S6	Gate-System aus BP §10 strikt einhalten
PCIE-Limitation für Training (kein NVLink)	S7	A100 PCIE = Inference/Fine-Tuning. Training-Cluster erst mit SXM4/H100
Sovereign-Washing ohne Substanz	S8	Zertifizierungen aufbauen, nicht nur Marketing

Dieses Dokument wird aktualisiert, sobald sich die Markt- oder Förderlage ändert. Letzte Aktualisierung: April 2026