Current

RTX 4090

NVIDIA · triple-slot · Released octobre 2022

Le fleuron grand public de Ada Lovelace : 24 Go, 1 To/s de bande passante, 82,6 TFLOPS FP16. L'option pleb monocarte la plus rapide pour l'inférence.

Hardware spec sheet

Vendor	NVIDIA
Category	GPU
VRAM / memory	24 GB
Memory bandwidth	1008 GB/s
FP16 TFLOPS	82.6
INT8 TOPS	660
TDP	450 W
Architecture	Ada Lovelace
Form factor	triple-slot
Release date	octobre 2022
Street price (USD)	1600-1900 (new/used)
120V note	450 W sur 120V/15A est le plafond pratique pour une seule carte avec une alimentation de 1000 W ; une deuxième RTX 4090 exige réellement du 240V.

La RTX 4090 a été lancée en octobre 2022 sur l’architecture NVIDIA Ada Lovelace — successeure directe d’Ampere (RTX 3090) avec un saut de lithographie vers le TSMC 4N. Même quantité de VRAM que la 3090 (24 Go), mais nettement plus rapide : 1008 Go/s de bande passante, 82,6 TFLOPS FP16, et environ 2× le débit tensoriel pour l’INT8/FP8. Ada Lovelace a introduit les tensor cores de 4e génération et le support FP8, deux éléments qui comptent pour les charges de travail d’inférence quantifiée.

À qui elle s’adresse : aux prosumers qui veulent l’inférence monocarte la plus rapide sans passer aux cartes workstation. C’est aussi la carte de prédilection des utilisateurs sérieux de Stable Diffusion / ComfyUI.

Les modèles qu’elle fait tourner confortablement : même enveloppe de paramètres que la 3090 (jusqu’à environ 40B en Q4), mais environ 1,7 à 2× plus rapide en tok/s. Llama 3 70B en Q4 entre avec un contexte de 4K.

Notes Hashcenter : triple-slot, TDP de 450 W, connecteur 12VHPWR 16 broches (vérifiez la qualité du câble — les premiers câbles avaient des problèmes de connecteur que NVIDIA et ses partenaires ont depuis corrigés). 450 W sur 120V/15A est le plafond pratique pour une seule carte avec une alimentation de 1000 W ; une deuxième RTX 4090 exige réellement du 240V. Chapeau à Ada Lovelace — le produit phare 2022 qui a rendu les modèles de classe 70B réactifs sur un rig domestique.

Lecture complémentaire : Cette carte est un composant essentiel d’un AI Hashcenter de calibre pleb. Associez-la à l’argument de souveraineté développé dans le Manifeste de l’IA souveraine pour les Bitcoiners, ou examinez comment la même enveloppe 120V alimente un chauffage d’appoint Bitcoin dans notre catalogue de minage. Vous souhaitez exécuter les deux charges de travail sur un même rig ? Consultez Chauffer votre maison grâce à l’inférence.

Models that run on this hardware

Gemma 2 Gemma runs at Q5_K_M with headroom Gemma 3 Gemma runs at Q5_K_M with headroom Mistral Small 3 Mistral runs at Q5_K_M with headroom Phi-4 Phi runs at Q8 / FP16 comfortably FLUX.1 dev FLUX runs at Q8 / FP16 comfortably FLUX.1 schnell FLUX runs at Q8 / FP16 comfortably Stable Diffusion 3.5 Stable Diffusion runs at Q8 / FP16 comfortably Mistral 7B Mistral runs at Q8 / FP16 comfortably

Get it running

01 Install Ollama →
Ten-minute local LLM runtime. One binary, zero cloud.
02 Give it a UI →
Open-WebUI turns Ollama into a self-hosted ChatGPT.
03 Which runner? →
LM Studio vs Ollama vs llama.cpp — pick the right runtime for your rig.

Further reading: Heating your home with inference for turning this card into a winter-heat source, and the Sovereign AI for Bitcoiners Manifesto for the bigger picture on owner-operated AI.

RTX 4090

Hardware spec sheet

Models that run on this hardware

Get it running

Produits, réparations et guides connexes