GPU-Neubewertung (A100 40GB @ €12k vs. Plan-Basisannahme)¶

Datum: 2026-04-03
Abhaengig von: 002, 010
Status: Vollständig.

Zusammenfassung¶

Die Erkenntnis, dass ~€12k für eine A100 sehr oft die 40GB PCIe-Variante ist, nicht die 80GB. Das ist kein kleines Spec-Detail: Marketplace-Mietpreise für 40GB sind wesentlich niedriger als für 80GB, und 40GB beschränkt die möglichen Jobs (große Fine-Tunes, Big-Context-Inferenz, manche MIG-Splits).

Es entkräftet das Projekt nicht automatisch — es verändert das Optimierungsproblem von „wähle 80GB zu €12k" zu „wähle das (Preis, stündlicher Host-Umsatz, TDP, VRAM)-Tupel, das die Rendite unter deinen Energie- und Kapitalbeschränkungen maximiert."

Praktisches Fazit (Datenstand April 2026):

Ein Live-Vast-Angebotsabruf ist nun automatisiert — siehe §8 und tooling/marketplace/vast_gpu_price_snapshot.py. Am 2026-04-03 gab es null verifizierte A100 PCIE 40 GB Listings in der Stichprobe; A100 PCIE 80 GB zeigte einen implizierten Host-Floor von ~€0,58/Std. (unter dem Plan-Wert von €0,65), während A100 SXM4 40 GB median ~€0,57/Std. implizierte — vor der Beschaffung erneut abrufen; das Angebot ändert sich ständig.
Wenn echte gebrauchte A100 80GB PCIe bei €18k–24k+ liegen, während A100 40GB bei €10k–13k sind, dann kann 40GB beim Cash-Payback gewinnen, aber nur wenn der nachhaltige stündliche Host-Umsatz bei ~75–85% dessen bleibt, was man mit einer 80GB verdienen würde (siehe §5). Sie müssen auf Vast.ai mit aktuellen Listings in Ihrer Zielregion verifizieren, nicht auf Grundlage von Floor-Scrapes.
A100 80GB bleibt die bessere Umsatz-pro-Watt-Story bei gleichen Host-Preisen; die €12k × 80GB-Annahme des Plans ist die Schwachstelle, nicht die Wahl von Ampere über Ada.
L40S und H100 bleiben im Rennen: L40S ist in vielen Momentaufnahmen schlechter bei €/W, hat aber 48GB GDDR6 und starke Inferenz-Positionierung; H100 hat das beste €/W, aber den langsamsten Kapital-Payback bei typischen Gebrauchtpreisen.

1. Warum €12k „wie ein Problem aussieht"¶

Ihre Beobachtung	Interpretation
Nur 40GB nahe €12k	Entspricht EU-Listen-/Gebrauchtpreisbändern (z.B. Idealo / regionale Händler zeigen oft 40GB-SKUs im niedrigen fünfstelligen Bereich; 80GB neu in IT-Shops liegt bei €30k+ netto)
Plan verwendet €12k × A100 80GB	002 und BUSINESS-PLAN.md verwenden eine Arbeitsschätzung für Gebrauchtware für 80GB — im liquiden Großhandel erreichbar, aber nicht auf einer typischen kundenorientierten Produktseite

Das Problem ist also die Beschaffungsrealität, nicht „Ampere ist falsch."

2. GPU-Kandidaten (Hosting-relevant)¶

TDP aus NVIDIA- / ComputePrices-Spezifikationsseiten (PCIe Server-Karten). Kunden-$/Std. „Ab" ist die günstige Untergrenze des Marktes (oft unzuverlässige Hosts); Mitte ist ein grober On-Demand-Anker zum Vergleich — Ihr realisierter Host-Preis = Kunde × ~85% (Vast-Gebührenrichtwert) × FX.

FX: verwenden Sie USD × 0,92 ≈ EUR für schnelle Parität mit der Euro-Modellierung des Plans (auf Ihre Abrechnungswährung anpassen).

GPU	VRAM	TDP (W)	Typischer Gebrauchtpreis € (Apr 2026)	Kunden-$/Std. Ref. (niedrig → typisches Band)	Host-€/Std. @ 85% Kunde, ×0,92	€/W-Std. (Host÷TDP)
RTX 4090	24 GB	450	~€1.200–1.800 gebraucht	Vast-Liste ~$0,32	~€0,25–0,35	~0,55–0,78
A100 PCIe 40GB	40 GB	250	~€6k–13k (€12k plausibel)	Ab $0,29; Band bis ~$1,50 auf Marketplaces	~€0,23–0,40 (Floor) / ~€0,40–0,55 (wettbewerbsfähige Mitte — verifizieren)	~1,0–1,8
A100 PCIe 80GB	80 GB	300	~€12k–20k+ gebraucht (breit)	Aggregatoren z.B. $0,75+ „80GB"-Stufen; Plan verwendet €0,65 Host	€0,55–0,70 (Plan 0,65)	~1,8–2,3
A40	48 GB	300	variabel	Ab $0,41	~€0,32+	~1,1
L40S	48 GB	350	~€8k–12k (dünn gebraucht)	Ab $0,40; viele Listings ~$0,7–0,9	~€0,50–0,70	~1,4–2,0
RTX 6000 Ada	48 GB	300	hoch vs L40S	Ab $0,40; Mitte höher	~€0,50–0,65	~1,7–2,2
H100 PCIe	80 GB	350	~€22k–30k gebraucht	Ab $0,89; Vast/H100 oft >$1,2	~€0,93–1,20+	~2,7–3,4

Quellen (Momentaufnahmen 2026-04-03): ComputePrices.com GPU-Seiten; Awesome Agents März 2026 Anbietertabelle; Plan/002 Host €0,65 für A100 80GB.

Nicht empfohlen für redc Phase 0: RTX 4090 als primäre Flotten-GPU — starker Payback pro Euro, aber schlechtester Umsatz pro Watt unter den ernsthaften Beschleunigern; verbraucht Budget für erneuerbare Energie (siehe 002).

3. Formeln zur Neuberechnung (pro GPU)¶

Ausrichtung an 002-Struktur.

Definitionen:

(R) = Host-Umsatz (EUR/Std.) nach Marketplace-Gebühren
(U) = Auslastung (0–1), Kalenderstunden = 8.760
(P) = GPU-Kaufpreis (EUR)
(T) = TDP (kW); für Slot-Energieverbrauch ~0,4 kW effektiv pro A100-Klasse-GPU in 002 (GPU + Server-Anteil)
(E) = Stromkosten pro GPU-Jahr (Plan-Hybrid ~€196 für Solar+Biogas, oder €613 nur Netz aus 002)
(M) = Wartung €600/GPU/Jahr (Plan)
Abschreibung linear 3 J.: (P/3) pro Jahr

Jährlicher operativer Cash (vor neuem CAPEX):

$$\mathrm{Umsatz_{Jahr}} = R \times U \times 8760$$ $$\mathrm{Cash_{GPU}} = \mathrm{Umsatz_{Jahr}} - E - M$$

Cash-Payback (nur GPU, ohne Server-Zuordnung):

$$\mathrm{Jahre_{Payback}} \approx \frac{P}{\mathrm{Cash_{GPU}}}$$

Umsatz pro Watt (Marketingkennzahl, verwendet TDP in W):

$$\text{Umsatz pro W·h} = \frac{R}{T_{W}} \quad (T_{W} = \text{TDP in Watt})$$

Nach Abschreibung (buchhalterisch):

$$\mathrm{Marge_{buchh.}} = \mathrm{Cash_{GPU}} - \frac{P}{3} - \mathrm{Server\text{-}Anteil}$$

(Server-Anteil ~€333/GPU/Jahr in 002 für eine €4k-Plattform über 3 J.)

4. Numerische Szenarien (70% Ausl., Hybrid €196/GPU/Jahr, €600 Wartung)¶

Konfiguration	(P) (€)	(R) (€/Std.)	Umsatz/Jahr	Cash GPU/Jahr	Cash-Payback (J.)	€/W-Std.
A100 40GB	12 000	0,42	2 577	1 781	6,7	1,68
A100 40GB	12 000	0,50	3 066	2 270	5,3	2,00
A100 80GB (Plan)	12 000	0,65	3 986	3 190	3,8	2,17
A100 80GB	18 000	0,65	3 986	3 190	5,6	2,17
A100 80GB	24 000	0,65	3 986	3 190	7,5	2,17
L40S	10 000	0,55	3 372	2 576	3,9	1,57
H100 PCIe	27 000	1,05	6 434	5 638	4,8	3,00

Tabelle lesen: Wenn Ihr realistischer A100-40GB-Host-Preis ~€0,42/Std. beträgt, ist der Payback ~6,7 J. vs. 80GB @ €24k ebenfalls ~7,5 J. — 40GB ist wettbewerbsfähig beim Cash-Payback, aber schlechter bei €/W und VRAM. Wenn 40GB nur €0,42 erreicht, während 80GB €0,65 hält, gewinnt 80GB @ €18k trotzdem beim Payback vs. 40 @ €12k (5,6 vs. 6,7 J.).

„Überschuss" (Flotte): Multiplizieren Sie Cash pro GPU mit der GPU-Anzahl, subtrahieren Sie fixe Standortkosten (Internet, Versicherung, Miete, Gesellschaft) — wie in BUSINESS-PLAN.md §9, aber ersetzen Sie (R) und (P) pro SKU.

5. Kreuzungspunkt: Wann ist 40GB @ €12k rational vs. 80GB @ höherem Preis?¶

Sei (P_{40}, R_{40}) und (P_{80}, R_{80}). Ungefährer Cash-Payback ignoriert kleine TDP-Energieunterschiede (250 vs. 300 W ist ~€40–60/GPU/Jahr — zweite Ordnung).

40GB schnellerer Payback als 80GB wenn:

$$\frac{P_{40}}{R_{40} \cdot 6132 - 796} < \frac{P_{80}}{R_{80} \cdot 6132 - 796}$$

Mit Nenner (D_{80}) ≈ 3190 für (R_{80}=0,65), 796 = Hybridenergie + Wartung aus §4:

$$R_{40} > \frac{P_{40}}{P_{80}} \cdot R_{80} - \frac{796}{6132}\left(\frac{P_{40}}{P_{80}} - 1\right)$$

Beispiel: (P_{40}=12)k, (P_{80}=20)k, (R_{80}=0,65) → benötigt (R_{40} > 0,455 €/Std.) damit 40GB schneller zurückzahlt. Wenn der Marketplace nur 0,40 zahlt, gewinnt 80GB @ 20k.

6. Nicht-finanziell: VRAM und Nachfrage¶

VRAM	Grobe Einordnung
40 GB	Stark für viele Inferenz- und Fine-Tune-Jobs; eng für große LLMs bei langem Kontext, manche Trainingskonfigurationen
48 GB (L40S / RTX 6000 Ada)	Mittelweg; L40S ist inferenz-optimiert
80 GB	Breiteste Mieternachfrage auf Marketplaces für „seriöse" GPU

Operatives Risiko: 40GB könnte weniger ausgelastet sein zum gleichen Listenpreis, wenn Mieter nach 80GB filtern — modellieren Sie (U_{40} < U_{80}) in konservativen Szenarien.

7. Revidierte Empfehlung¶

Behandeln Sie €12k × A100 80GB als Hypothese, nicht als Fakt. Holen Sie zwei Angebote ein: A100 40GB und A100 80GB (gleiche Garantieklasse).
Führen Sie das Live-Snapshot-Skript (unten, §8) vor der Festlegung der Stückliste oder Listenpreise aus — es fragt die öffentliche Vast-Angebots-API jedes Mal auf die gleiche Weise ab. Ersetzen Sie (R) in §3–4 durch Ihren implizierten Host-€/Std. aus diesem Lauf (oder vom Host-Dashboard, sobald gelistet).
Setzen Sie (P, R, U) in §3 ein; wenn 40GB Ihre Mindestrendite und Verifizierung bei Ihrem Preispunkt erreicht, ist 40GB eine valide Phase-0-Karte — aktualisieren Sie BUSINESS-PLAN.md §6–9 mit dem neuen (R) und (P).
Wechseln Sie nicht auf 40GB ohne das Modell anzupassen: Umsatz, Payback und „Überschuss"-Monat verschieben sich alle mit (R) und (U).

8. Live-Vast-Momentaufnahme (reproduzierbar)¶

Skript: tooling/marketplace/vast_gpu_price_snapshot.py
Methode: POST https://cloud.vast.ai/api/v0/bundles/ (unauthentifiziert), filtert verified=true, rentable=true, rented=false, limit=3000, aufgeteilt nach gpu_name und gpu_ram (MB pro GPU).
Implizierter Host-€/Std.: dph_total (Kunden-$/Std.) × 0,85 × 0,92 — gleiche Größenordnung wie §2; ersetzen Sie mit Ihrer tatsächlichen Host-Auszahlung und FX, sobald Sie ein Vast-Host-Konto haben.

8.1 In diesem Dokument festgehaltene Momentaufnahme¶

Abrufdatum: 2026-04-03 (UTC, Einzelabruf unmittelbar vor Commit).

Filter (Vast `gpu_name` + VRAM MB)	Angebote n	Kunden-dph_total ($/Std.) min → median → max	Implizierter Host-€/Std. (min → median)
A100 SXM4, gpu_ram 38 000–50 000 (~40 GB)	3	0,668 → 0,724 → 0,789	0,522 → 0,566
A100 SXM4, gpu_ram 75 000–90 000 (~80 GB)	4	1,069 → 1,842 → 4,749	0,836 → 1,441
A100 PCIE, gpu_ram 38 000–50 000 (~40 GB)	0	—	—
A100 PCIE, gpu_ram 75 000–90 000 (~80 GB)	4	0,740 → 1,802 → 4,802	0,579 → 1,409

Wie diese Tabelle zu lesen ist:

A100 PCIE 40 GB: keine passenden verifizierten Angebote in diesem Abruf — Sie können (R_{40}) allein von Vast nicht festlegen. Verwenden Sie SXM4 40 GB-Zahlen nur als schwachen Proxy (anderer Formfaktor und Mietererwartungen vs. Ihr geplanter PCIe Server), oder führen Sie das Skript wöchentlich erneut aus, bis PCIe-40-Listings erscheinen.
A100 PCIE 80 GB: das günstigste verifizierte Angebot implizierte ~€0,58/Std. Host — unter dem Plan-Basisfall von €0,65/Std.; der Median implizierte ~€1,41/Std., getrieben von einer kleinen Stichprobe und hochpreisigen Regionen — planen Sie nicht mit dem Median als neuer Host. Für konservative Modellierung verwenden Sie etwas zwischen min und p25, bis Sie eigene Listing-Statistiken haben.
40 GB vs 80 GB (nur SXM4, gleiche Momentaufnahme): medianer implizierter Host-€/Std. ist ~0,57 (40 GB) vs. ~1,44 (80 GB) — eine ~2,5×-Lücke bei dieser winzigen Stichprobe. Extrapolieren Sie nicht auf PCIe ohne Daten.

8.2 Gleicher (R) für 40 und 80 — Payback-Illustration¶

Wenn (hypothetisch) ein PCIe 40 GB und ein PCIe 80 GB Listing beide (R \approx 0,57) €/Std. Host erzielen würden (nahe dem SXM4-40-GB-Median und dem PCIE-80-GB-Floor in §8.1), dominiert der Kaufpreis:

GPU	(P)	(R)	Cash/GPU/Jahr (§4 Hybrid)	Cash-Payback
40 GB	12 000 €	0,57	2 699	4,4 J.
80 GB	18 000 €	0,57	2 699	6,7 J.

Gleichgesetzter (R) macht also günstige 40 GB attraktiv — aber in der Praxis zahlen Mieter oft mehr für 80 GB und die Auslastung kann sich unterscheiden. Führen Sie §8 und Ihre eigenen Listing-Experimente erneut durch.

9. Referenzen & Quellen¶

Behauptung	Quelle
A100 40GB PCIe TDP 250 W	ComputePrices A100 PCIE (stimmt mit NVIDIA-Datenblatt überein)
A100 80GB PCIe TDP 300 W	002, NVIDIA-Spezifikationen
Cloud-Ab-Preise pro GPU	ComputePrices Seiten: A100 PCIE, L40S, H100 PCIe, RTX 6000 Ada, A40, Vast-Anbieterzeile
A100 80GB Mietpreisband	GPUPerHour A100 80GB, Awesome Agents März 2026
Marketplace-Gebühr ~15%	002, Vast Host-Dokumentation
Live-Angebotsmomentaufnahme	tooling/marketplace/vast_gpu_price_snapshot.py, Vast `POST /api/v0/bundles/` (Abruf 2026-04-03)