Passer au contenu

Nous améliorons nos opérations pour mieux vous servir. Les commandes sont expédiées normalement depuis Laval, QC. Questions? Contactez-nous

Bitcoin accepté au paiement  |  Expédié depuis Laval, QC, Canada  |  Soutien expert depuis 2016

Current

RTX 4090

NVIDIA · triple-slot · Released octobre 2022

Le fleuron grand public de Ada Lovelace : 24 Go, 1 To/s de bande passante, 82,6 TFLOPS FP16. L'option pleb monocarte la plus rapide pour l'inférence.

Hardware spec sheet

VendorNVIDIA
CategoryGPU
VRAM / memory24 GB
Memory bandwidth1008 GB/s
FP16 TFLOPS82.6
INT8 TOPS660
TDP450 W
ArchitectureAda Lovelace
Form factortriple-slot
Release dateoctobre 2022
Street price (USD)1600-1900 (new/used)
120V note450 W sur 120V/15A est le plafond pratique pour une seule carte avec une alimentation de 1000 W ; une deuxième RTX 4090 exige réellement du 240V.

La RTX 4090 a été lancée en octobre 2022 sur l’architecture NVIDIA Ada Lovelace — successeure directe d’Ampere (RTX 3090) avec un saut de lithographie vers le TSMC 4N. Même quantité de VRAM que la 3090 (24 Go), mais nettement plus rapide : 1008 Go/s de bande passante, 82,6 TFLOPS FP16, et environ 2× le débit tensoriel pour l’INT8/FP8. Ada Lovelace a introduit les tensor cores de 4e génération et le support FP8, deux éléments qui comptent pour les charges de travail d’inférence quantifiée.

À qui elle s’adresse : aux prosumers qui veulent l’inférence monocarte la plus rapide sans passer aux cartes workstation. C’est aussi la carte de prédilection des utilisateurs sérieux de Stable Diffusion / ComfyUI.

Les modèles qu’elle fait tourner confortablement : même enveloppe de paramètres que la 3090 (jusqu’à environ 40B en Q4), mais environ 1,7 à 2× plus rapide en tok/s. Llama 3 70B en Q4 entre avec un contexte de 4K.

Notes Hashcenter : triple-slot, TDP de 450 W, connecteur 12VHPWR 16 broches (vérifiez la qualité du câble — les premiers câbles avaient des problèmes de connecteur que NVIDIA et ses partenaires ont depuis corrigés). 450 W sur 120V/15A est le plafond pratique pour une seule carte avec une alimentation de 1000 W ; une deuxième RTX 4090 exige réellement du 240V. Chapeau à Ada Lovelace — le produit phare 2022 qui a rendu les modèles de classe 70B réactifs sur un rig domestique.

Lecture complémentaire : Cette carte est un composant essentiel d’un AI Hashcenter de calibre pleb. Associez-la à l’argument de souveraineté développé dans le Manifeste de l’IA souveraine pour les Bitcoiners, ou examinez comment la même enveloppe 120V alimente un chauffage d’appoint Bitcoin dans notre catalogue de minage. Vous souhaitez exécuter les deux charges de travail sur un même rig ? Consultez Chauffer votre maison grâce à l’inférence.

Get it running

  1. 01 Install Ollama →

    Ten-minute local LLM runtime. One binary, zero cloud.

  2. 02 Give it a UI →

    Open-WebUI turns Ollama into a self-hosted ChatGPT.

  3. 03 Which runner? →

    LM Studio vs Ollama vs llama.cpp — pick the right runtime for your rig.

Further reading: Heating your home with inference for turning this card into a winter-heat source, and the Sovereign AI for Bitcoiners Manifesto for the bigger picture on owner-operated AI.