Passer au contenu

Nous améliorons nos opérations pour mieux vous servir. Les commandes sont expédiées normalement depuis Laval, QC. Questions? Contactez-nous

Bitcoin accepté au paiement  |  Expédié depuis Laval, QC, Canada  |  Soutien expert depuis 2016

Dépannage

Correction surchauffe — Protection thermique Antminer

· D-Central Technologies · 9 min de lecture

Ce que cette erreur signifie

L’erreur « Temp Too High » — aussi affichée comme « Over Temperature Protection », « DANGER: Overheating », « PCB temp too high », ou « Chip temperature exceeds threshold » — signifie que votre Antminer a détecté des températures dépassant sa limite de fonctionnement sécuritaire et a soit réduit ses performances, soit s’est éteint complètement pour prévenir des dommages matériels permanents. Il s’agit d’un mécanisme de protection intégré à chaque modèle Antminer.

Les mineurs ASIC Bitmain possèdent deux capteurs de température : la température du PCB (carte) et la température des puces (jonction). La température des puces est toujours plus élevée que celle de la carte, généralement de 15 à 30 degrés Celsius. Lorsque l’une ou l’autre lecture dépasse le seuil spécifique au modèle — habituellement 80-85 °C pour la carte ou 100-115 °C pour les puces — le firmware déclenche la protection contre la surchauffe et arrête le minage.

Causes courantes

  • Flux d’air insuffisant ou évacuation bloquée — Le mineur est placé dans un espace confiné, trop près d’un mur, ou l’air chaud d’évacuation recircule vers l’admission. C’est la cause numéro un de surchauffe dans les installations de minage domestique.
  • Ventilateur défaillant ou dégradé — Un ou les deux ventilateurs sont tombés en panne, tournent à un régime réduit, ou ont accumulé de la poussière qui réduit le flux d’air. Même une réduction de 20 % de la vitesse du ventilateur peut pousser les températures au-dessus du seuil.
  • Température ambiante élevée — La pièce ou l’environnement où le mineur fonctionne est trop chaud. Les mineurs ASIC sont généralement conçus pour des températures ambiantes allant jusqu’à 35-40 °C (95-104 °F). La chaleur estivale sans refroidissement adéquat déclenchera cette erreur.
  • Accumulation de poussière et de débris — L’accumulation de poussière sur les dissipateurs thermiques, les hashboards et les ventilateurs agit comme un isolant, piégeant la chaleur et réduisant l’efficacité du refroidissement. Les mineurs dans des environnements poussiéreux peuvent surchauffer en quelques semaines sans nettoyage.
  • Dégradation de la pâte thermique — Le matériau d’interface thermique entre les puces ASIC et les dissipateurs s’est desséché, fissuré ou a perdu sa conductivité avec le temps. C’est courant sur les mineurs de plus de 18 à 24 mois.
  • Paramètres d’overclocking — Le mineur a été configuré pour fonctionner à une fréquence ou une tension plus élevée que les valeurs d’usine, générant plus de chaleur que le système de refroidissement ne peut dissiper.

Correction étape par étape

Sécurité d’abord : Si votre mineur s’est éteint à cause d’une surchauffe, laissez-le refroidir pendant au moins 15 à 20 minutes avant de le manipuler. Les dissipateurs et les hashboards peuvent conserver des températures suffisamment élevées pour causer des brûlures.

Étape 1 : Vérifier l’environnement

Mesurez la température ambiante à l’endroit où le mineur fonctionne. Utilisez un thermomètre à hauteur de l’admission d’air — pas à l’autre bout de la pièce. Si la température ambiante dépasse 35 °C (95 °F), vous devez soit améliorer le refroidissement de la pièce, ajouter un conduit d’évacuation, ou déplacer le mineur. Assurez un dégagement d’au moins 30 cm des côtés d’admission et d’évacuation, sans aucune obstruction.

Étape 2 : Inspecter les ventilateurs

Avec le mineur sous tension (s’il fonctionne), vérifiez que les deux ventilateurs tournent à pleine vitesse. Vous devriez sentir un flux d’air puissant du côté de l’évacuation. Dans l’interface web, vérifiez les lectures de RPM des ventilateurs — les deux devraient afficher des valeurs similaires dans la plage attendue pour votre modèle (généralement 4 000-6 000 RPM). Si un ventilateur affiche 0 ou significativement moins que l’autre, ce ventilateur doit être remplacé.

Étape 3 : Nettoyer le mineur

Éteignez et débranchez le mineur. Utilisez de l’air comprimé (60-100 PSI d’un compresseur, ou air en canette pour la poussière légère) pour souffler tous les dissipateurs, les pales des ventilateurs et les surfaces des cartes. Travaillez de l’admission vers l’évacuation pour pousser la poussière vers l’extérieur. Portez une attention particulière aux ailettes des dissipateurs sur chaque hashboard — même une fine couche de poussière affecte significativement le refroidissement.

Étape 4 : Vérifier le parcours d’air

Assurez-vous qu’aucun composant interne ne bloque le flux d’air. Sur certains modèles, un hashboard déplacé, un câble desserré ou un carénage déplacé peut obstruer le canal d’air. Le parcours d’air doit être dégagé du ventilateur d’admission à travers les trois dissipateurs de hashboard jusqu’au ventilateur d’évacuation.

Étape 5 : Vérifier les lectures de température

Rallumez le mineur et surveillez les températures dans l’interface web. Observez l’augmentation de la température sur 10 à 15 minutes. Les températures de fonctionnement saines varient selon le modèle, mais en général : la température du PCB devrait rester en dessous de 75 °C et la température des puces en dessous de 105 °C. Si une chaîne spécifique est significativement plus chaude que les autres (différence de 10 °C+), cette carte peut avoir un problème de pâte thermique ou de contact du dissipateur.

Étape 6 : Réduire la fréquence d’horloge (si overclocké)

Si vous avez appliqué des profils d’overclocking ou des paramètres de fréquence personnalisés, revenez aux paramètres d’usine. Dans l’interface web de l’Antminer, allez dans Configuration du mineur et réglez la fréquence à la valeur par défaut d’usine pour votre modèle. Cela réduit immédiatement la production de chaleur.

Étape 7 : Réappliquer la pâte thermique (avancé)

Si le mineur continue de surchauffer après le nettoyage et l’optimisation du flux d’air, le matériau d’interface thermique doit peut-être être remplacé. C’est une procédure plus complexe qui nécessite de retirer le dissipateur du hashboard, de nettoyer l’ancienne pâte thermique ou les pads, et d’appliquer un composé thermique frais. Utilisez une pâte thermique de haute qualité d’au moins 8 W/mK. Ceci est particulièrement efficace sur les mineurs de plus de 2 ans.

Diagnostic avancé

Pour des diagnostics plus approfondis via SSH :

ssh root@[miner-ip]
# Vérifier la température en temps réel de toutes les chaînes
cat /tmp/freq_config  # Affiche la température par chaîne sur certains modèles
cat /var/log/messages | grep -i "temp"
cat /var/log/messages | grep -i "overheat"

Imagerie thermique : Si vous avez accès à une caméra thermique (même un accessoire pour téléphone comme FLIR), scannez les hashboards en fonctionnement. Les points chauds significativement plus chauds que les zones environnantes indiquent un contact de pâte thermique défaillant, des puces mortes générant une chaleur excessive, ou des sections de dissipateur bloquées.

Test de courbe de ventilation : Certains firmwares tiers (comme Braiins OS+) permettent des courbes de ventilation personnalisées. Si vous utilisez un firmware personnalisé, vérifiez que la vitesse du ventilateur augmente correctement avec la température. Une courbe de ventilation mal configurée peut maintenir les ventilateurs à bas régime même lorsque les températures augmentent.

Quand demander l’aide d’un professionnel

Consultez un service professionnel de réparation ASIC si :

  • Un hashboard spécifique fonctionne constamment à 15 °C+ de plus que les autres après nettoyage et remplacement de la pâte thermique — cela suggère un défaut au niveau des puces générant une chaleur excessive
  • Le mineur surchauffe même à fréquence réduite avec des dissipateurs propres et un bon flux d’air — défaillance de composant interne
  • Vous voyez des dommages physiques aux dissipateurs, des cartes déformées, ou une décoloration des composants
  • La réapplication de la pâte thermique dépasse votre niveau de confort — une application incorrecte peut aggraver les choses

D-Central Technologies diagnostique et résout les problèmes thermiques sur tous les modèles Antminer. Nous effectuons la réapplication complète de pâte thermique, le resurfaçage des dissipateurs, le remplacement des ventilateurs et le diagnostic au niveau des puces des défauts générant de la chaleur. Soumettez une demande de réparation ici

Modèles affectés

Tous les modèles Antminer peuvent déclencher la protection contre la surchauffe. Les modèles particulièrement sujets aux problèmes thermiques comprennent : S17 et S17 Pro (dégradation connue de la pâte thermique), série T17, S19 et S19 Pro (haute densité de puissance), S19 XP, et tout modèle fonctionnant dans des environnements chauds. La série S9 est généralement plus robuste thermiquement grâce à une densité de puissance plus faible, mais surchauffera quand même dans de mauvaises conditions.

Codes d’erreur associés

Questions fréquemment posées

Quelle est la température maximale sécuritaire pour mon Antminer ?

La plupart des modèles Antminer ont une limite de température PCB de 80-85 °C et une limite de température de puce de 100-115 °C. Les seuils exacts varient selon le modèle et la version du firmware. Pour une longévité optimale, visez à maintenir les températures PCB en dessous de 70 °C et les températures de puce en dessous de 95 °C. Fonctionner constamment près de la limite raccourcit la durée de vie des composants même si la protection ne se déclenche pas.

La surchauffe peut-elle endommager mon mineur de façon permanente ?

Oui. Des températures élevées prolongées dégradent les joints de soudure, accélèrent la dégradation de la pâte thermique et peuvent endommager de façon permanente les puces ASIC. La protection contre la surchauffe existe pour prévenir les défaillances catastrophiques, mais les cycles thermiques répétés et le fonctionnement près des limites thermiques causent des dommages cumulatifs. Un mineur qui déclenche fréquemment la protection thermique développera probablement des défaillances de puces plus rapidement.

Est-il sécuritaire d’augmenter le seuil de température dans le firmware ?

Non. Augmenter le seuil de surchauffe dans les fichiers de configuration ou le firmware personnalisé est fortement déconseillé. Les limites fixées par le fabricant sont basées sur la conception thermique des dissipateurs et la température de jonction maximale des puces ASIC. Dépasser ces limites causera une usure accélérée et une défaillance permanente éventuelle. Corrigez plutôt la cause fondamentale de la surchauffe.

Ajouter plus de ventilateurs aidera-t-il ?

Ajouter des ventilateurs externes pour pousser plus d’air à travers le mineur ou améliorer la circulation de la pièce peut aider, mais cela dépend de la cause fondamentale. Si le problème est la température ambiante, une meilleure ventilation de la pièce ou un conduit d’évacuation est plus efficace. Si les ventilateurs internes fonctionnent correctement et les dissipateurs sont propres, le problème peut être la pâte thermique plutôt que le flux d’air. Ajouter des ventilateurs est un complément à un entretien adéquat, pas un substitut.

Quelle est la température maximale sécuritaire pour mon Antminer ?

La plupart des modèles Antminer ont une limite de température PCB de 80-85°C et une limite de température de puce de 100-115°C. Les seuils exacts varient selon le modèle et la version du firmware. Pour une longévité optimale, visez à maintenir les températures PCB en dessous de 70°C et les températures de puce en dessous de 95°C.

La surchauffe peut-elle endommager mon mineur de façon permanente ?

Oui. Des températures élevées prolongées dégradent les joints de soudure, accélèrent la dégradation de la pâte thermique et peuvent endommager de façon permanente les puces ASIC. Un mineur qui déclenche fréquemment la protection thermique développera probablement des défaillances de puces plus rapidement.

Est-il sécuritaire du2019augmenter le seuil de température dans le firmware ?

Non. Augmenter le seuil de surchauffe dans les fichiers de configuration ou le firmware personnalisé est fortement déconseillé. Les limites fixées par le fabricant sont basées sur la conception thermique des dissipateurs et la température de jonction maximale des puces ASIC. Corrigez plutôt la cause fondamentale de la surchauffe.

Ajouter plus de ventilateurs aidera-t-il ?

Ajouter des ventilateurs externes peut aider, mais cela dépend de la cause fondamentale. Si les ventilateurs internes fonctionnent correctement et les dissipateurs sont propres, le problème peut être la pâte thermique plutôt que le flux du2019air. Ajouter des ventilateurs est un complément à un entretien adéquat, pas un substitut.