Passer au contenu

Nous améliorons nos opérations pour mieux vous servir. Les commandes sont expédiées normalement depuis Laval, QC. Questions? Contactez-nous

Bitcoin accepté au paiement  |  Expédié depuis Laval, QC, Canada  |  Soutien expert depuis 2016

Current

RTX A5000

NVIDIA · dual-slot blower · Released avril 2021

Double-slot à soufflante avec 24 Go et ECC. La 3090 des professionnels — même VRAM, plus silencieuse, adaptée au rack.

Hardware spec sheet

VendorNVIDIA
CategoryGPU
VRAM / memory24 GB
Memory bandwidth768 GB/s
FP16 TFLOPS27.8
INT8 TOPS222
TDP230 W
ArchitectureAmpere
Form factordual-slot blower
Release dateavril 2021
Street price (USD)800-1100 (used)
120V note230 W chacune signifie deux cartes sur 120V/15A avec une alimentation de 1000 W.

La RTX A5000 est la carte workstation Ampere à soufflante double-slot : 24 Go de GDDR6 ECC, 768 Go/s, TDP de 230 W. Lancée aux côtés de l’A4000 en avril 2021, elle s’intercale entre l’A4000 (16 Go, 140 W) et l’A6000 (48 Go, 300 W). Architecture Ampere identique à celle de la 3090 — même nombre de CUDA cores d’ailleurs — mais avec mémoire ECC, refroidisseur à soufflante et pile de pilotes professionnels NVIDIA.

À qui elle s’adresse : aux professionnels, studios et opérateurs de Hashcenter qui veulent la performance de classe 3090 dans un boîtier adapté au rack, avec l’ECC pour la fiabilité des charges de travail. Prix en occasion 800–1100 $ en 2026.

Les modèles qu’elle fait tourner confortablement : enveloppe de paramètres identique à celle de la RTX 3090 (Llama 3 70B en Q4, Qwen 2.5 32B en Q5_K_M), avec une bande passante légèrement inférieure (768 contre 936 Go/s), soit environ 20 % de tok/s en moins sur les charges limitées par la mémoire. L’ECC et le format à soufflante justifient généralement le compromis pour un usage en production.

Notes Hashcenter : soufflante double-slot — deux A5000 tiennent dans quatre slots et dissipent 460 W au total grâce au flux d’air avant-arrière, idéal pour un châssis 4U. Plus silencieuse qu’une 3090 à soufflante sous charge parce que les fréquences plus basses maintiennent le régime ventilateur bas. 230 W chacune signifie deux cartes sur 120V/15A avec une alimentation de 1000 W. Chapeau au lignage Quadro / RTX Pro de NVIDIA pour l’ingénierie.

Lecture complémentaire : Cette carte est un composant essentiel d’un AI Hashcenter de calibre pleb. Associez-la à l’argument de souveraineté développé dans le Manifeste de l’IA souveraine pour les Bitcoiners, ou examinez comment la même enveloppe 120V alimente un chauffage d’appoint Bitcoin dans notre catalogue de minage. Vous souhaitez exécuter les deux charges de travail sur un même rig ? Consultez Chauffer votre maison grâce à l’inférence.

Get it running

  1. 01 Install Ollama →

    Ten-minute local LLM runtime. One binary, zero cloud.

  2. 02 Give it a UI →

    Open-WebUI turns Ollama into a self-hosted ChatGPT.

  3. 03 Which runner? →

    LM Studio vs Ollama vs llama.cpp — pick the right runtime for your rig.

Further reading: Heating your home with inference for turning this card into a winter-heat source, and the Sovereign AI for Bitcoiners Manifesto for the bigger picture on owner-operated AI.