GPU-Neubewertung (A100 40GB @ €12k vs. Plan-Basisannahme)¶
Datum: 2026-04-03
Abhaengig von: 002, 010
Status: Vollständig.
Zusammenfassung¶
Die Erkenntnis, dass ~€12k für eine A100 sehr oft die 40GB PCIe-Variante ist, nicht die 80GB. Das ist kein kleines Spec-Detail: Marketplace-Mietpreise für 40GB sind wesentlich niedriger als für 80GB, und 40GB beschränkt die möglichen Jobs (große Fine-Tunes, Big-Context-Inferenz, manche MIG-Splits).
Es entkräftet das Projekt nicht automatisch — es verändert das Optimierungsproblem von „wähle 80GB zu €12k" zu „wähle das (Preis, stündlicher Host-Umsatz, TDP, VRAM)-Tupel, das die Rendite unter deinen Energie- und Kapitalbeschränkungen maximiert."
Praktisches Fazit (Datenstand April 2026):
- Ein Live-Vast-Angebotsabruf ist nun automatisiert — siehe §8 und tooling/marketplace/vast_gpu_price_snapshot.py. Am 2026-04-03 gab es null verifizierte A100 PCIE 40 GB Listings in der Stichprobe; A100 PCIE 80 GB zeigte einen implizierten Host-Floor von ~€0,58/Std. (unter dem Plan-Wert von €0,65), während A100 SXM4 40 GB median ~€0,57/Std. implizierte — vor der Beschaffung erneut abrufen; das Angebot ändert sich ständig.
- Wenn echte gebrauchte A100 80GB PCIe bei €18k–24k+ liegen, während A100 40GB bei €10k–13k sind, dann kann 40GB beim Cash-Payback gewinnen, aber nur wenn der nachhaltige stündliche Host-Umsatz bei ~75–85% dessen bleibt, was man mit einer 80GB verdienen würde (siehe §5). Sie müssen auf Vast.ai mit aktuellen Listings in Ihrer Zielregion verifizieren, nicht auf Grundlage von Floor-Scrapes.
- A100 80GB bleibt die bessere Umsatz-pro-Watt-Story bei gleichen Host-Preisen; die €12k × 80GB-Annahme des Plans ist die Schwachstelle, nicht die Wahl von Ampere über Ada.
- L40S und H100 bleiben im Rennen: L40S ist in vielen Momentaufnahmen schlechter bei €/W, hat aber 48GB GDDR6 und starke Inferenz-Positionierung; H100 hat das beste €/W, aber den langsamsten Kapital-Payback bei typischen Gebrauchtpreisen.
1. Warum €12k „wie ein Problem aussieht"¶
| Ihre Beobachtung | Interpretation |
|---|---|
| Nur 40GB nahe €12k | Entspricht EU-Listen-/Gebrauchtpreisbändern (z.B. Idealo / regionale Händler zeigen oft 40GB-SKUs im niedrigen fünfstelligen Bereich; 80GB neu in IT-Shops liegt bei €30k+ netto) |
| Plan verwendet €12k × A100 80GB | 002 und BUSINESS-PLAN.md verwenden eine Arbeitsschätzung für Gebrauchtware für 80GB — im liquiden Großhandel erreichbar, aber nicht auf einer typischen kundenorientierten Produktseite |
Das Problem ist also die Beschaffungsrealität, nicht „Ampere ist falsch."
2. GPU-Kandidaten (Hosting-relevant)¶
TDP aus NVIDIA- / ComputePrices-Spezifikationsseiten (PCIe Server-Karten). Kunden-$/Std. „Ab" ist die günstige Untergrenze des Marktes (oft unzuverlässige Hosts); Mitte ist ein grober On-Demand-Anker zum Vergleich — Ihr realisierter Host-Preis = Kunde × ~85% (Vast-Gebührenrichtwert) × FX.
FX: verwenden Sie USD × 0,92 ≈ EUR für schnelle Parität mit der Euro-Modellierung des Plans (auf Ihre Abrechnungswährung anpassen).
| GPU | VRAM | TDP (W) | Typischer Gebrauchtpreis € (Apr 2026) | Kunden-$/Std. Ref. (niedrig → typisches Band) | Host-€/Std. @ 85% Kunde, ×0,92 | €/W-Std. (Host÷TDP) |
|---|---|---|---|---|---|---|
| RTX 4090 | 24 GB | 450 | ~€1.200–1.800 gebraucht | Vast-Liste ~$0,32 | ~€0,25–0,35 | ~0,55–0,78 |
| A100 PCIe 40GB | 40 GB | 250 | ~€6k–13k (€12k plausibel) | Ab $0,29; Band bis ~$1,50 auf Marketplaces | ~€0,23–0,40 (Floor) / ~€0,40–0,55 (wettbewerbsfähige Mitte — verifizieren) | ~1,0–1,8 |
| A100 PCIe 80GB | 80 GB | 300 | ~€12k–20k+ gebraucht (breit) | Aggregatoren z.B. $0,75+ „80GB"-Stufen; Plan verwendet €0,65 Host | €0,55–0,70 (Plan 0,65) | ~1,8–2,3 |
| A40 | 48 GB | 300 | variabel | Ab $0,41 | ~€0,32+ | ~1,1 |
| L40S | 48 GB | 350 | ~€8k–12k (dünn gebraucht) | Ab $0,40; viele Listings ~$0,7–0,9 | ~€0,50–0,70 | ~1,4–2,0 |
| RTX 6000 Ada | 48 GB | 300 | hoch vs L40S | Ab $0,40; Mitte höher | ~€0,50–0,65 | ~1,7–2,2 |
| H100 PCIe | 80 GB | 350 | ~€22k–30k gebraucht | Ab $0,89; Vast/H100 oft >$1,2 | ~€0,93–1,20+ | ~2,7–3,4 |
Quellen (Momentaufnahmen 2026-04-03): ComputePrices.com GPU-Seiten; Awesome Agents März 2026 Anbietertabelle; Plan/002 Host €0,65 für A100 80GB.
Nicht empfohlen für redc Phase 0: RTX 4090 als primäre Flotten-GPU — starker Payback pro Euro, aber schlechtester Umsatz pro Watt unter den ernsthaften Beschleunigern; verbraucht Budget für erneuerbare Energie (siehe 002).
3. Formeln zur Neuberechnung (pro GPU)¶
Ausrichtung an 002-Struktur.
Definitionen:
- (R) = Host-Umsatz (EUR/Std.) nach Marketplace-Gebühren
- (U) = Auslastung (0–1), Kalenderstunden = 8.760
- (P) = GPU-Kaufpreis (EUR)
- (T) = TDP (kW); für Slot-Energieverbrauch ~0,4 kW effektiv pro A100-Klasse-GPU in 002 (GPU + Server-Anteil)
- (E) = Stromkosten pro GPU-Jahr (Plan-Hybrid ~€196 für Solar+Biogas, oder €613 nur Netz aus 002)
- (M) = Wartung €600/GPU/Jahr (Plan)
- Abschreibung linear 3 J.: (P/3) pro Jahr
Jährlicher operativer Cash (vor neuem CAPEX):
$$\mathrm{Umsatz_{Jahr}} = R \times U \times 8760$$ $$\mathrm{Cash_{GPU}} = \mathrm{Umsatz_{Jahr}} - E - M$$
Cash-Payback (nur GPU, ohne Server-Zuordnung):
$$\mathrm{Jahre_{Payback}} \approx \frac{P}{\mathrm{Cash_{GPU}}}$$
Umsatz pro Watt (Marketingkennzahl, verwendet TDP in W):
$$\text{Umsatz pro W·h} = \frac{R}{T_{W}} \quad (T_{W} = \text{TDP in Watt})$$
Nach Abschreibung (buchhalterisch):
$$\mathrm{Marge_{buchh.}} = \mathrm{Cash_{GPU}} - \frac{P}{3} - \mathrm{Server\text{-}Anteil}$$
(Server-Anteil ~€333/GPU/Jahr in 002 für eine €4k-Plattform über 3 J.)
4. Numerische Szenarien (70% Ausl., Hybrid €196/GPU/Jahr, €600 Wartung)¶
| Konfiguration | (P) (€) | (R) (€/Std.) | Umsatz/Jahr | Cash GPU/Jahr | Cash-Payback (J.) | €/W-Std. |
|---|---|---|---|---|---|---|
| A100 40GB | 12 000 | 0,42 | 2 577 | 1 781 | 6,7 | 1,68 |
| A100 40GB | 12 000 | 0,50 | 3 066 | 2 270 | 5,3 | 2,00 |
| A100 80GB (Plan) | 12 000 | 0,65 | 3 986 | 3 190 | 3,8 | 2,17 |
| A100 80GB | 18 000 | 0,65 | 3 986 | 3 190 | 5,6 | 2,17 |
| A100 80GB | 24 000 | 0,65 | 3 986 | 3 190 | 7,5 | 2,17 |
| L40S | 10 000 | 0,55 | 3 372 | 2 576 | 3,9 | 1,57 |
| H100 PCIe | 27 000 | 1,05 | 6 434 | 5 638 | 4,8 | 3,00 |
Tabelle lesen: Wenn Ihr realistischer A100-40GB-Host-Preis ~€0,42/Std. beträgt, ist der Payback ~6,7 J. vs. 80GB @ €24k ebenfalls ~7,5 J. — 40GB ist wettbewerbsfähig beim Cash-Payback, aber schlechter bei €/W und VRAM. Wenn 40GB nur €0,42 erreicht, während 80GB €0,65 hält, gewinnt 80GB @ €18k trotzdem beim Payback vs. 40 @ €12k (5,6 vs. 6,7 J.).
„Überschuss" (Flotte): Multiplizieren Sie Cash pro GPU mit der GPU-Anzahl, subtrahieren Sie fixe Standortkosten (Internet, Versicherung, Miete, Gesellschaft) — wie in BUSINESS-PLAN.md §9, aber ersetzen Sie (R) und (P) pro SKU.
5. Kreuzungspunkt: Wann ist 40GB @ €12k rational vs. 80GB @ höherem Preis?¶
Sei (P_{40}, R_{40}) und (P_{80}, R_{80}). Ungefährer Cash-Payback ignoriert kleine TDP-Energieunterschiede (250 vs. 300 W ist ~€40–60/GPU/Jahr — zweite Ordnung).
40GB schnellerer Payback als 80GB wenn:
$$\frac{P_{40}}{R_{40} \cdot 6132 - 796} < \frac{P_{80}}{R_{80} \cdot 6132 - 796}$$
Mit Nenner (D_{80}) ≈ 3190 für (R_{80}=0,65), 796 = Hybridenergie + Wartung aus §4:
$$R_{40} > \frac{P_{40}}{P_{80}} \cdot R_{80} - \frac{796}{6132}\left(\frac{P_{40}}{P_{80}} - 1\right)$$
Beispiel: (P_{40}=12)k, (P_{80}=20)k, (R_{80}=0,65) → benötigt (R_{40} > 0,455 €/Std.) damit 40GB schneller zurückzahlt. Wenn der Marketplace nur 0,40 zahlt, gewinnt 80GB @ 20k.
6. Nicht-finanziell: VRAM und Nachfrage¶
| VRAM | Grobe Einordnung |
|---|---|
| 40 GB | Stark für viele Inferenz- und Fine-Tune-Jobs; eng für große LLMs bei langem Kontext, manche Trainingskonfigurationen |
| 48 GB (L40S / RTX 6000 Ada) | Mittelweg; L40S ist inferenz-optimiert |
| 80 GB | Breiteste Mieternachfrage auf Marketplaces für „seriöse" GPU |
Operatives Risiko: 40GB könnte weniger ausgelastet sein zum gleichen Listenpreis, wenn Mieter nach 80GB filtern — modellieren Sie (U_{40} < U_{80}) in konservativen Szenarien.
7. Revidierte Empfehlung¶
- Behandeln Sie €12k × A100 80GB als Hypothese, nicht als Fakt. Holen Sie zwei Angebote ein: A100 40GB und A100 80GB (gleiche Garantieklasse).
- Führen Sie das Live-Snapshot-Skript (unten, §8) vor der Festlegung der Stückliste oder Listenpreise aus — es fragt die öffentliche Vast-Angebots-API jedes Mal auf die gleiche Weise ab. Ersetzen Sie (R) in §3–4 durch Ihren implizierten Host-€/Std. aus diesem Lauf (oder vom Host-Dashboard, sobald gelistet).
- Setzen Sie (P, R, U) in §3 ein; wenn 40GB Ihre Mindestrendite und Verifizierung bei Ihrem Preispunkt erreicht, ist 40GB eine valide Phase-0-Karte — aktualisieren Sie BUSINESS-PLAN.md §6–9 mit dem neuen (R) und (P).
- Wechseln Sie nicht auf 40GB ohne das Modell anzupassen: Umsatz, Payback und „Überschuss"-Monat verschieben sich alle mit (R) und (U).
8. Live-Vast-Momentaufnahme (reproduzierbar)¶
Skript: tooling/marketplace/vast_gpu_price_snapshot.py
Methode: POST https://cloud.vast.ai/api/v0/bundles/ (unauthentifiziert), filtert verified=true, rentable=true, rented=false, limit=3000, aufgeteilt nach gpu_name und gpu_ram (MB pro GPU).
Implizierter Host-€/Std.: dph_total (Kunden-$/Std.) × 0,85 × 0,92 — gleiche Größenordnung wie §2; ersetzen Sie mit Ihrer tatsächlichen Host-Auszahlung und FX, sobald Sie ein Vast-Host-Konto haben.
8.1 In diesem Dokument festgehaltene Momentaufnahme¶
Abrufdatum: 2026-04-03 (UTC, Einzelabruf unmittelbar vor Commit).
Filter (Vast gpu_name + VRAM MB) |
Angebote n | Kunden-dph_total ($/Std.) min → median → max | Implizierter Host-€/Std. (min → median) |
|---|---|---|---|
| A100 SXM4, gpu_ram 38 000–50 000 (~40 GB) | 3 | 0,668 → 0,724 → 0,789 | 0,522 → 0,566 |
| A100 SXM4, gpu_ram 75 000–90 000 (~80 GB) | 4 | 1,069 → 1,842 → 4,749 | 0,836 → 1,441 |
| A100 PCIE, gpu_ram 38 000–50 000 (~40 GB) | 0 | — | — |
| A100 PCIE, gpu_ram 75 000–90 000 (~80 GB) | 4 | 0,740 → 1,802 → 4,802 | 0,579 → 1,409 |
Wie diese Tabelle zu lesen ist:
- A100 PCIE 40 GB: keine passenden verifizierten Angebote in diesem Abruf — Sie können (R_{40}) allein von Vast nicht festlegen. Verwenden Sie SXM4 40 GB-Zahlen nur als schwachen Proxy (anderer Formfaktor und Mietererwartungen vs. Ihr geplanter PCIe Server), oder führen Sie das Skript wöchentlich erneut aus, bis PCIe-40-Listings erscheinen.
- A100 PCIE 80 GB: das günstigste verifizierte Angebot implizierte ~€0,58/Std. Host — unter dem Plan-Basisfall von €0,65/Std.; der Median implizierte ~€1,41/Std., getrieben von einer kleinen Stichprobe und hochpreisigen Regionen — planen Sie nicht mit dem Median als neuer Host. Für konservative Modellierung verwenden Sie etwas zwischen min und p25, bis Sie eigene Listing-Statistiken haben.
- 40 GB vs 80 GB (nur SXM4, gleiche Momentaufnahme): medianer implizierter Host-€/Std. ist ~0,57 (40 GB) vs. ~1,44 (80 GB) — eine ~2,5×-Lücke bei dieser winzigen Stichprobe. Extrapolieren Sie nicht auf PCIe ohne Daten.
8.2 Gleicher (R) für 40 und 80 — Payback-Illustration¶
Wenn (hypothetisch) ein PCIe 40 GB und ein PCIe 80 GB Listing beide (R \approx 0,57) €/Std. Host erzielen würden (nahe dem SXM4-40-GB-Median und dem PCIE-80-GB-Floor in §8.1), dominiert der Kaufpreis:
| GPU | (P) | (R) | Cash/GPU/Jahr (§4 Hybrid) | Cash-Payback |
|---|---|---|---|---|
| 40 GB | 12 000 € | 0,57 | 2 699 | 4,4 J. |
| 80 GB | 18 000 € | 0,57 | 2 699 | 6,7 J. |
Gleichgesetzter (R) macht also günstige 40 GB attraktiv — aber in der Praxis zahlen Mieter oft mehr für 80 GB und die Auslastung kann sich unterscheiden. Führen Sie §8 und Ihre eigenen Listing-Experimente erneut durch.
9. Referenzen & Quellen¶
| Behauptung | Quelle |
|---|---|
| A100 40GB PCIe TDP 250 W | ComputePrices A100 PCIE (stimmt mit NVIDIA-Datenblatt überein) |
| A100 80GB PCIe TDP 300 W | 002, NVIDIA-Spezifikationen |
| Cloud-Ab-Preise pro GPU | ComputePrices Seiten: A100 PCIE, L40S, H100 PCIe, RTX 6000 Ada, A40, Vast-Anbieterzeile |
| A100 80GB Mietpreisband | GPUPerHour A100 80GB, Awesome Agents März 2026 |
| Marketplace-Gebühr ~15% | 002, Vast Host-Dokumentation |
| Live-Angebotsmomentaufnahme | tooling/marketplace/vast_gpu_price_snapshot.py, Vast POST /api/v0/bundles/ (Abruf 2026-04-03) |