Current

RTX A5000

NVIDIA · dual-slot blower · Released avril 2021

Double-slot à soufflante avec 24 Go et ECC. La 3090 des professionnels — même VRAM, plus silencieuse, adaptée au rack.

Hardware spec sheet

Vendor	NVIDIA
Category	GPU
VRAM / memory	24 GB
Memory bandwidth	768 GB/s
FP16 TFLOPS	27.8
INT8 TOPS	222
TDP	230 W
Architecture	Ampere
Form factor	dual-slot blower
Release date	avril 2021
Street price (USD)	800-1100 (used)
120V note	230 W chacune signifie deux cartes sur 120V/15A avec une alimentation de 1000 W.

La RTX A5000 est la carte workstation Ampere à soufflante double-slot : 24 Go de GDDR6 ECC, 768 Go/s, TDP de 230 W. Lancée aux côtés de l’A4000 en avril 2021, elle s’intercale entre l’A4000 (16 Go, 140 W) et l’A6000 (48 Go, 300 W). Architecture Ampere identique à celle de la 3090 — même nombre de CUDA cores d’ailleurs — mais avec mémoire ECC, refroidisseur à soufflante et pile de pilotes professionnels NVIDIA.

À qui elle s’adresse : aux professionnels, studios et opérateurs de Hashcenter qui veulent la performance de classe 3090 dans un boîtier adapté au rack, avec l’ECC pour la fiabilité des charges de travail. Prix en occasion 800–1100 $ en 2026.

Les modèles qu’elle fait tourner confortablement : enveloppe de paramètres identique à celle de la RTX 3090 (Llama 3 70B en Q4, Qwen 2.5 32B en Q5_K_M), avec une bande passante légèrement inférieure (768 contre 936 Go/s), soit environ 20 % de tok/s en moins sur les charges limitées par la mémoire. L’ECC et le format à soufflante justifient généralement le compromis pour un usage en production.

Notes Hashcenter : soufflante double-slot — deux A5000 tiennent dans quatre slots et dissipent 460 W au total grâce au flux d’air avant-arrière, idéal pour un châssis 4U. Plus silencieuse qu’une 3090 à soufflante sous charge parce que les fréquences plus basses maintiennent le régime ventilateur bas. 230 W chacune signifie deux cartes sur 120V/15A avec une alimentation de 1000 W. Chapeau au lignage Quadro / RTX Pro de NVIDIA pour l’ingénierie.

Lecture complémentaire : Cette carte est un composant essentiel d’un AI Hashcenter de calibre pleb. Associez-la à l’argument de souveraineté développé dans le Manifeste de l’IA souveraine pour les Bitcoiners, ou examinez comment la même enveloppe 120V alimente un chauffage d’appoint Bitcoin dans notre catalogue de minage. Vous souhaitez exécuter les deux charges de travail sur un même rig ? Consultez Chauffer votre maison grâce à l’inférence.

Models that run on this hardware

Gemma 2 Gemma runs at Q5_K_M with headroom Gemma 3 Gemma runs at Q5_K_M with headroom Mistral Small 3 Mistral runs at Q5_K_M with headroom Phi-4 Phi runs at Q8 / FP16 comfortably FLUX.1 dev FLUX runs at Q8 / FP16 comfortably FLUX.1 schnell FLUX runs at Q8 / FP16 comfortably Stable Diffusion 3.5 Stable Diffusion runs at Q8 / FP16 comfortably Mistral 7B Mistral runs at Q8 / FP16 comfortably

Get it running

01 Install Ollama →
Ten-minute local LLM runtime. One binary, zero cloud.
02 Give it a UI →
Open-WebUI turns Ollama into a self-hosted ChatGPT.
03 Which runner? →
LM Studio vs Ollama vs llama.cpp — pick the right runtime for your rig.

Further reading: Heating your home with inference for turning this card into a winter-heat source, and the Sovereign AI for Bitcoiners Manifesto for the bigger picture on owner-operated AI.

RTX A5000

Hardware spec sheet

Models that run on this hardware

Get it running

Produits, réparations et guides connexes