Base de modeles IA locaux

Champs de modele

Les pages modeles doivent suivre cas d usage, famille, taille, quantification, longueur de contexte, licence, date de version, runtime, materiel requis, limite de confidentialite et limites connues.

Cadence de revision

Versions, licences, contextes et runtimes changent vite. Gardez les dates de version et reverifiez toute recommandation avant achat materiel ou traitement de donnees sensibles.

Derniere revision: 16 avril 2026.

Sources de donnees

Les pages IA doivent s appuyer sur les model cards, depots de projet, notes de version, specifications materiel, documentation pilotes/runtimes et experience infrastructure D-Central. Les benchmarks doivent conserver la version du modele, la quantification, le contexte, le materiel, le pilote, le runtime et la date.

Les ASICs ne font pas tourner des LLM. Le lien D-Central avec l IA reste l infrastructure pratique: electricite, chaleur, confidentialite, calcul local, maintenance et operations materiel.

Responsable de revision

Revision par l equipe D-Central avec un angle infrastructure Bitcoin, confidentialite, materiel et operations. Les cles, donnees client, secrets de production et documents sensibles ne doivent pas entrer dans une pile IA experimentale.

Politique de fraicheur

Versions de modeles, licences, prix GPU, pilotes, runtimes et classements changent vite. Les pages IA doivent conserver les versions utilisees, signaler les benchmarks possiblement perimes et separer les conseils de confidentialite des promesses de performance.

Derniere revision: 16 avril 2026. Equipe editoriale et atelier de reparation D-Central, Laval, Quebec.

40 local AI model profiles for sovereign compute planning: model families, context windows, quantization notes, hardware fit, and deployment considerations.

Profils de modeles

Qwen 3

La sortie de mai 2025 d Alibaba — première famille ouverte avec raisonnement hybride (chaîne de pensée activable), Apache 2.0 à travers toutes les tailles.

View Model

Llama 4 (Scout/Maverick)

La sortie MoE-et-multimodale de Meta d avril 2025, avec en tête la fenêtre de contexte 10M de Scout et le modèle de frontière Behemoth pré-annoncé.

View Model

Gemma 3

La famille Gemma de Google DeepMind de mars 2025 — capacité vision (4B+), contexte 128K, avec variantes officielles 4-bits conscientes de la quantification.

View Model

Mistral Small 3

Le modèle 24B de Mistral AI de janvier 2025 — Apache 2.0, compétitif avec Llama 3.3 70B, tient sur un seul GPU 24 Go.

View Model

DeepSeek R1

Le modèle de raisonnement de DeepSeek de janvier 2025 — qualité chaîne de pensée de frontière, plus six distills sous licence MIT de 1,5B à 70B.

View Model

DeepSeek V3

Le MoE à l échelle frontière de DeepSeek de décembre 2024 — 671B total, 37B actifs, entraîné pour ~5,6 M$ en compute.

View Model

Phi-4

Phi-4 de Microsoft Research de décembre 2024 — un modèle dense 14B sous licence MIT qui cogne bien au-dessus de sa catégorie en maths et raisonnement.

View Model

Llama 3.3

Un seul modèle 70B publié en décembre 2024, comblant la majeure partie de l écart avec Llama 3.1 405B par post-entraînement amélioré seul.

View Model

Stable Diffusion 3.5

Le navire-amiral MMDiT de Stability AI d octobre 2024 — variantes 2B (Medium) et 8B (Large) avec adhérence aux prompts dramatiquement améliorée sur SDXL.

View Model

Llama 3.2

La sortie Llama de Meta de septembre 2024 a ajouté les tailles edge (1B/3B) et les premiers modèles de vision Llama à poids ouverts (11B/90B).

View Model

Qwen 2.5

La famille Qwen de septembre 2024 d Alibaba s étend de 0,5B à 72B, plus des spécialistes coding et math — majoritairement Apache 2.0.

View Model

FLUX.1 schnell

La variante FLUX Apache 2.0 de Black Forest Labs d août 2024 — 12B distillé en 1-4 étapes pour une génération d images rapide et commercialement ouverte.

View Model

FLUX.1 dev

Le navire-amiral de Black Forest Labs d août 2024 — un transformer flow-matching rectifié 12B qui a fixé la nouvelle barre de qualité pour la génération d images ouverte.

View Model

Llama 3.1

La famille LLM ouverte phare de Meta de 2024 — 8B, 70B et 405B paramètres avec contexte 128K. Le 405B a été le premier modèle ouvert à une véritable échelle de frontière.

View Model

Gemma 2

La famille de modèles ouverts et légers de Google DeepMind lancée en juin 2024 — 2B, 9B et 27B avec attention locale/globale entrelacée.

View Model

Command R+

Le navire-amiral RAG-natif de Cohere d avril 2024 — 104B dense, citations ancrées et usage d outils de première classe, CC-BY-NC 4.0.

View Model

Mixtral 8x7B

Le modèle mixture-of-experts de Mistral AI de décembre 2023 — 8 experts, 2 actifs par token, Apache 2.0, tournant à la vitesse de Llama-13B avec la qualité de Llama-70B.

View Model

Whisper Large v3

Le modèle ASR ouvert d OpenAI de novembre 2023 — 1,55B paramètres, sous licence MIT, la référence ouverte pour la reconnaissance vocale multilingue.

View Model

Mistral 7B

Le début de Mistral AI en septembre 2023 — un modèle 7B Apache-2.0 qui a popularisé la Grouped-Query et la Sliding Window Attention.

View Model

Stable Diffusion XL

Le SDXL de Stability AI de juillet 2023 — ~3,5B paramètres, 1024×1024 natif, licence CreativeML-OpenRAIL-M, colonne vertébrale de l écosystème ouvert de génération d images.

View Model

Methodologie

Model data is maintained as a planning reference for local inference. Always verify license terms, model card updates, context length, quantization compatibility, and hardware memory requirements before deployment.

Revision editoriale et limites

Revise par l equipe editoriale D-Central avec un angle materiel, minage Bitcoin et reparation ASIC. Verifiez toujours le prix du materiel, la disponibilite, les frais, la difficulte du reseau, le tarif electrique et l etat reel de l appareil avant un achat ou une reparation.

Derniere revision: 16 avril 2026. D-Central, Laval, Quebec.

Related products, repair, and setup paths

Last reviewed 16 avril 2026.