Zum Inhalt

GPU-Neubewertung (A100 40GB @ €12k vs. Plan-Basisannahme)

Datum: 2026-04-03
Abhaengig von: 002, 010
Status: Vollständig.

Zusammenfassung

Die Erkenntnis, dass ~€12k für eine A100 sehr oft die 40GB PCIe-Variante ist, nicht die 80GB. Das ist kein kleines Spec-Detail: Marketplace-Mietpreise für 40GB sind wesentlich niedriger als für 80GB, und 40GB beschränkt die möglichen Jobs (große Fine-Tunes, Big-Context-Inferenz, manche MIG-Splits).

Es entkräftet das Projekt nicht automatisch — es verändert das Optimierungsproblem von „wähle 80GB zu €12k" zu „wähle das (Preis, stündlicher Host-Umsatz, TDP, VRAM)-Tupel, das die Rendite unter deinen Energie- und Kapitalbeschränkungen maximiert."

Praktisches Fazit (Datenstand April 2026):

  • Ein Live-Vast-Angebotsabruf ist nun automatisiert — siehe §8 und tooling/marketplace/vast_gpu_price_snapshot.py. Am 2026-04-03 gab es null verifizierte A100 PCIE 40 GB Listings in der Stichprobe; A100 PCIE 80 GB zeigte einen implizierten Host-Floor von ~€0,58/Std. (unter dem Plan-Wert von €0,65), während A100 SXM4 40 GB median ~€0,57/Std. implizierte — vor der Beschaffung erneut abrufen; das Angebot ändert sich ständig.
  • Wenn echte gebrauchte A100 80GB PCIe bei €18k–24k+ liegen, während A100 40GB bei €10k–13k sind, dann kann 40GB beim Cash-Payback gewinnen, aber nur wenn der nachhaltige stündliche Host-Umsatz bei ~75–85% dessen bleibt, was man mit einer 80GB verdienen würde (siehe §5). Sie müssen auf Vast.ai mit aktuellen Listings in Ihrer Zielregion verifizieren, nicht auf Grundlage von Floor-Scrapes.
  • A100 80GB bleibt die bessere Umsatz-pro-Watt-Story bei gleichen Host-Preisen; die €12k × 80GB-Annahme des Plans ist die Schwachstelle, nicht die Wahl von Ampere über Ada.
  • L40S und H100 bleiben im Rennen: L40S ist in vielen Momentaufnahmen schlechter bei €/W, hat aber 48GB GDDR6 und starke Inferenz-Positionierung; H100 hat das beste €/W, aber den langsamsten Kapital-Payback bei typischen Gebrauchtpreisen.

1. Warum €12k „wie ein Problem aussieht"

Ihre Beobachtung Interpretation
Nur 40GB nahe €12k Entspricht EU-Listen-/Gebrauchtpreisbändern (z.B. Idealo / regionale Händler zeigen oft 40GB-SKUs im niedrigen fünfstelligen Bereich; 80GB neu in IT-Shops liegt bei €30k+ netto)
Plan verwendet €12k × A100 80GB 002 und BUSINESS-PLAN.md verwenden eine Arbeitsschätzung für Gebrauchtware für 80GB — im liquiden Großhandel erreichbar, aber nicht auf einer typischen kundenorientierten Produktseite

Das Problem ist also die Beschaffungsrealität, nicht „Ampere ist falsch."


2. GPU-Kandidaten (Hosting-relevant)

TDP aus NVIDIA- / ComputePrices-Spezifikationsseiten (PCIe Server-Karten). Kunden-$/Std. „Ab" ist die günstige Untergrenze des Marktes (oft unzuverlässige Hosts); Mitte ist ein grober On-Demand-Anker zum Vergleich — Ihr realisierter Host-Preis = Kunde × ~85% (Vast-Gebührenrichtwert) × FX.

FX: verwenden Sie USD × 0,92 ≈ EUR für schnelle Parität mit der Euro-Modellierung des Plans (auf Ihre Abrechnungswährung anpassen).

GPU VRAM TDP (W) Typischer Gebrauchtpreis € (Apr 2026) Kunden-$/Std. Ref. (niedrig → typisches Band) Host-€/Std. @ 85% Kunde, ×0,92 €/W-Std. (Host÷TDP)
RTX 4090 24 GB 450 ~€1.200–1.800 gebraucht Vast-Liste ~$0,32 ~€0,25–0,35 ~0,55–0,78
A100 PCIe 40GB 40 GB 250 ~€6k–13k (€12k plausibel) Ab $0,29; Band bis ~$1,50 auf Marketplaces ~€0,23–0,40 (Floor) / ~€0,40–0,55 (wettbewerbsfähige Mitte — verifizieren) ~1,0–1,8
A100 PCIe 80GB 80 GB 300 ~€12k–20k+ gebraucht (breit) Aggregatoren z.B. $0,75+ „80GB"-Stufen; Plan verwendet €0,65 Host €0,55–0,70 (Plan 0,65) ~1,8–2,3
A40 48 GB 300 variabel Ab $0,41 ~€0,32+ ~1,1
L40S 48 GB 350 ~€8k–12k (dünn gebraucht) Ab $0,40; viele Listings ~$0,7–0,9 ~€0,50–0,70 ~1,4–2,0
RTX 6000 Ada 48 GB 300 hoch vs L40S Ab $0,40; Mitte höher ~€0,50–0,65 ~1,7–2,2
H100 PCIe 80 GB 350 ~€22k–30k gebraucht Ab $0,89; Vast/H100 oft >$1,2 ~€0,93–1,20+ ~2,7–3,4

Quellen (Momentaufnahmen 2026-04-03): ComputePrices.com GPU-Seiten; Awesome Agents März 2026 Anbietertabelle; Plan/002 Host €0,65 für A100 80GB.

Nicht empfohlen für redc Phase 0: RTX 4090 als primäre Flotten-GPU — starker Payback pro Euro, aber schlechtester Umsatz pro Watt unter den ernsthaften Beschleunigern; verbraucht Budget für erneuerbare Energie (siehe 002).


3. Formeln zur Neuberechnung (pro GPU)

Ausrichtung an 002-Struktur.

Definitionen:

  • (R) = Host-Umsatz (EUR/Std.) nach Marketplace-Gebühren
  • (U) = Auslastung (0–1), Kalenderstunden = 8.760
  • (P) = GPU-Kaufpreis (EUR)
  • (T) = TDP (kW); für Slot-Energieverbrauch ~0,4 kW effektiv pro A100-Klasse-GPU in 002 (GPU + Server-Anteil)
  • (E) = Stromkosten pro GPU-Jahr (Plan-Hybrid ~€196 für Solar+Biogas, oder €613 nur Netz aus 002)
  • (M) = Wartung €600/GPU/Jahr (Plan)
  • Abschreibung linear 3 J.: (P/3) pro Jahr

Jährlicher operativer Cash (vor neuem CAPEX):

$$\mathrm{Umsatz_{Jahr}} = R \times U \times 8760$$ $$\mathrm{Cash_{GPU}} = \mathrm{Umsatz_{Jahr}} - E - M$$

Cash-Payback (nur GPU, ohne Server-Zuordnung):

$$\mathrm{Jahre_{Payback}} \approx \frac{P}{\mathrm{Cash_{GPU}}}$$

Umsatz pro Watt (Marketingkennzahl, verwendet TDP in W):

$$\text{Umsatz pro W·h} = \frac{R}{T_{W}} \quad (T_{W} = \text{TDP in Watt})$$

Nach Abschreibung (buchhalterisch):

$$\mathrm{Marge_{buchh.}} = \mathrm{Cash_{GPU}} - \frac{P}{3} - \mathrm{Server\text{-}Anteil}$$

(Server-Anteil ~€333/GPU/Jahr in 002 für eine €4k-Plattform über 3 J.)


4. Numerische Szenarien (70% Ausl., Hybrid €196/GPU/Jahr, €600 Wartung)

Konfiguration (P) (€) (R) (€/Std.) Umsatz/Jahr Cash GPU/Jahr Cash-Payback (J.) €/W-Std.
A100 40GB 12 000 0,42 2 577 1 781 6,7 1,68
A100 40GB 12 000 0,50 3 066 2 270 5,3 2,00
A100 80GB (Plan) 12 000 0,65 3 986 3 190 3,8 2,17
A100 80GB 18 000 0,65 3 986 3 190 5,6 2,17
A100 80GB 24 000 0,65 3 986 3 190 7,5 2,17
L40S 10 000 0,55 3 372 2 576 3,9 1,57
H100 PCIe 27 000 1,05 6 434 5 638 4,8 3,00

Tabelle lesen: Wenn Ihr realistischer A100-40GB-Host-Preis ~€0,42/Std. beträgt, ist der Payback ~6,7 J. vs. 80GB @ €24k ebenfalls ~7,5 J.40GB ist wettbewerbsfähig beim Cash-Payback, aber schlechter bei €/W und VRAM. Wenn 40GB nur €0,42 erreicht, während 80GB €0,65 hält, gewinnt 80GB @ €18k trotzdem beim Payback vs. 40 @ €12k (5,6 vs. 6,7 J.).

„Überschuss" (Flotte): Multiplizieren Sie Cash pro GPU mit der GPU-Anzahl, subtrahieren Sie fixe Standortkosten (Internet, Versicherung, Miete, Gesellschaft) — wie in BUSINESS-PLAN.md §9, aber ersetzen Sie (R) und (P) pro SKU.


5. Kreuzungspunkt: Wann ist 40GB @ €12k rational vs. 80GB @ höherem Preis?

Sei (P_{40}, R_{40}) und (P_{80}, R_{80}). Ungefährer Cash-Payback ignoriert kleine TDP-Energieunterschiede (250 vs. 300 W ist ~€40–60/GPU/Jahr — zweite Ordnung).

40GB schnellerer Payback als 80GB wenn:

$$\frac{P_{40}}{R_{40} \cdot 6132 - 796} < \frac{P_{80}}{R_{80} \cdot 6132 - 796}$$

Mit Nenner (D_{80})3190 für (R_{80}=0,65), 796 = Hybridenergie + Wartung aus §4:

$$R_{40} > \frac{P_{40}}{P_{80}} \cdot R_{80} - \frac{796}{6132}\left(\frac{P_{40}}{P_{80}} - 1\right)$$

Beispiel: (P_{40}=12)k, (P_{80}=20)k, (R_{80}=0,65) → benötigt (R_{40} > 0,455 €/Std.) damit 40GB schneller zurückzahlt. Wenn der Marketplace nur 0,40 zahlt, gewinnt 80GB @ 20k.


6. Nicht-finanziell: VRAM und Nachfrage

VRAM Grobe Einordnung
40 GB Stark für viele Inferenz- und Fine-Tune-Jobs; eng für große LLMs bei langem Kontext, manche Trainingskonfigurationen
48 GB (L40S / RTX 6000 Ada) Mittelweg; L40S ist inferenz-optimiert
80 GB Breiteste Mieternachfrage auf Marketplaces für „seriöse" GPU

Operatives Risiko: 40GB könnte weniger ausgelastet sein zum gleichen Listenpreis, wenn Mieter nach 80GB filtern — modellieren Sie (U_{40} < U_{80}) in konservativen Szenarien.


7. Revidierte Empfehlung

  1. Behandeln Sie €12k × A100 80GB als Hypothese, nicht als Fakt. Holen Sie zwei Angebote ein: A100 40GB und A100 80GB (gleiche Garantieklasse).
  2. Führen Sie das Live-Snapshot-Skript (unten, §8) vor der Festlegung der Stückliste oder Listenpreise aus — es fragt die öffentliche Vast-Angebots-API jedes Mal auf die gleiche Weise ab. Ersetzen Sie (R) in §3–4 durch Ihren implizierten Host-€/Std. aus diesem Lauf (oder vom Host-Dashboard, sobald gelistet).
  3. Setzen Sie (P, R, U) in §3 ein; wenn 40GB Ihre Mindestrendite und Verifizierung bei Ihrem Preispunkt erreicht, ist 40GB eine valide Phase-0-Karteaktualisieren Sie BUSINESS-PLAN.md §6–9 mit dem neuen (R) und (P).
  4. Wechseln Sie nicht auf 40GB ohne das Modell anzupassen: Umsatz, Payback und „Überschuss"-Monat verschieben sich alle mit (R) und (U).

8. Live-Vast-Momentaufnahme (reproduzierbar)

Skript: tooling/marketplace/vast_gpu_price_snapshot.py
Methode: POST https://cloud.vast.ai/api/v0/bundles/ (unauthentifiziert), filtert verified=true, rentable=true, rented=false, limit=3000, aufgeteilt nach gpu_name und gpu_ram (MB pro GPU).
Implizierter Host-€/Std.: dph_total (Kunden-$/Std.) × 0,85 × 0,92 — gleiche Größenordnung wie §2; ersetzen Sie mit Ihrer tatsächlichen Host-Auszahlung und FX, sobald Sie ein Vast-Host-Konto haben.

8.1 In diesem Dokument festgehaltene Momentaufnahme

Abrufdatum: 2026-04-03 (UTC, Einzelabruf unmittelbar vor Commit).

Filter (Vast gpu_name + VRAM MB) Angebote n Kunden-dph_total ($/Std.) min → median → max Implizierter Host-€/Std. (min → median)
A100 SXM4, gpu_ram 38 000–50 000 (~40 GB) 3 0,668 → 0,724 → 0,789 0,522 → 0,566
A100 SXM4, gpu_ram 75 000–90 000 (~80 GB) 4 1,069 → 1,842 → 4,749 0,836 → 1,441
A100 PCIE, gpu_ram 38 000–50 000 (~40 GB) 0
A100 PCIE, gpu_ram 75 000–90 000 (~80 GB) 4 0,740 → 1,802 → 4,802 0,579 → 1,409

Wie diese Tabelle zu lesen ist:

  • A100 PCIE 40 GB: keine passenden verifizierten Angebote in diesem Abruf — Sie können (R_{40}) allein von Vast nicht festlegen. Verwenden Sie SXM4 40 GB-Zahlen nur als schwachen Proxy (anderer Formfaktor und Mietererwartungen vs. Ihr geplanter PCIe Server), oder führen Sie das Skript wöchentlich erneut aus, bis PCIe-40-Listings erscheinen.
  • A100 PCIE 80 GB: das günstigste verifizierte Angebot implizierte ~€0,58/Std. Host — unter dem Plan-Basisfall von €0,65/Std.; der Median implizierte ~€1,41/Std., getrieben von einer kleinen Stichprobe und hochpreisigen Regionen — planen Sie nicht mit dem Median als neuer Host. Für konservative Modellierung verwenden Sie etwas zwischen min und p25, bis Sie eigene Listing-Statistiken haben.
  • 40 GB vs 80 GB (nur SXM4, gleiche Momentaufnahme): medianer implizierter Host-€/Std. ist ~0,57 (40 GB) vs. ~1,44 (80 GB) — eine ~2,5×-Lücke bei dieser winzigen Stichprobe. Extrapolieren Sie nicht auf PCIe ohne Daten.

8.2 Gleicher (R) für 40 und 80 — Payback-Illustration

Wenn (hypothetisch) ein PCIe 40 GB und ein PCIe 80 GB Listing beide (R \approx 0,57) €/Std. Host erzielen würden (nahe dem SXM4-40-GB-Median und dem PCIE-80-GB-Floor in §8.1), dominiert der Kaufpreis:

GPU (P) (R) Cash/GPU/Jahr (§4 Hybrid) Cash-Payback
40 GB 12 000 € 0,57 2 699 4,4 J.
80 GB 18 000 € 0,57 2 699 6,7 J.

Gleichgesetzter (R) macht also günstige 40 GB attraktiv — aber in der Praxis zahlen Mieter oft mehr für 80 GB und die Auslastung kann sich unterscheiden. Führen Sie §8 und Ihre eigenen Listing-Experimente erneut durch.


9. Referenzen & Quellen

Behauptung Quelle
A100 40GB PCIe TDP 250 W ComputePrices A100 PCIE (stimmt mit NVIDIA-Datenblatt überein)
A100 80GB PCIe TDP 300 W 002, NVIDIA-Spezifikationen
Cloud-Ab-Preise pro GPU ComputePrices Seiten: A100 PCIE, L40S, H100 PCIe, RTX 6000 Ada, A40, Vast-Anbieterzeile
A100 80GB Mietpreisband GPUPerHour A100 80GB, Awesome Agents März 2026
Marketplace-Gebühr ~15% 002, Vast Host-Dokumentation
Live-Angebotsmomentaufnahme tooling/marketplace/vast_gpu_price_snapshot.py, Vast POST /api/v0/bundles/ (Abruf 2026-04-03)