Le nouveau modèle par défaut d'OpenAI pour ceux qui terminent réellement leur travail. Il ne se contente pas de répondre — il planifie, utilise des outils, vérifie sa propre production et achève la tâche complexe pendant que vous allez chercher un café. Le passage de chatbot utile à collègue numérique fiable est enfin tangible.
Écosystème du quotidien — Les trois grands assistants IA
Voir toutLe premier modèle de classe Mythos d'Anthropic rendu accessible à tous. La même architecture que le Mythos 5 restreint, mais avec des garde-fous conservateurs qui redirigent les requêtes sensibles vers Opus 4.8. Il délivre des performances frontière sur tous les benchmarks qui comptent — SWE-Bench Pro 80,3%, FrontierCode Diamond 29,3%, Hebbia Finance n°1 — et l'écart se creuse à mesure que les tâches se complexifient. Pour ceux qui peuvent assumer un tarif premium, c'est le modèle IA le plus puissant accessible au grand public.
Imaginez un partenaire de recherche d'une érudition profonde qui prend une minute pour réfléchir avant de répondre. Il échange la rapidité instantanée contre une analyse méthodique et rigoureuse. Quand votre problème exige une logique réelle et délibérée — pas juste une réponse à la va-vite — c'est la mise à niveau cérébrale phare de Google.
Le modèle frontière le plus serein et le plus honnête — désormais avec un jugement plus aiguisé et la capacité de mener de longs workflows d'agents autonomes sans perdre le fil. Opus 4.8 ne se contente pas de retenir un million de tokens de contexte, il sait vraiment quand il ne sait pas quelque chose. Calibration d'honnêteté améliorée, Dynamic Workflows coordonnant des centaines de travailleurs IA, et contrôle de l'effort pour choisir entre vitesse et profondeur. L'IA du professionnel, mise à niveau.
IA locale / privée — Votre cerveau, votre machine, vos règles
Voir toutLe modèle open-weight qui réécrit les règles de l'IA locale. Design Arena #1, SWE-bench Pro 62,1%, Terminal-Bench 82,7, AkitaOnRails 87/100 — le tout sous licence MIT. Contexte 1M tokens et premier modèle ouvert à rivaliser véritablement avec les leaders fermés sur les tâches d'ingénierie à long horizon.
Le dernier modèle dense de 27B d'Alibaba ne se contente pas de succéder au précédent roi de l'IA locale — il surpasse son propre flagship de 397B sur chaque benchmark de codage agentique majeur tout en tournant sur un seul GPU grand public. SWE-bench Verified 77,2, Terminal-Bench 2.0 59,3, vision et vidéo natifs, Apache 2.0.
Pas un modèle — cinq. Gemma 4 de Google DeepMind est une famille couvrant tout, d'un modèle de 2 milliards de paramètres qui tourne sur votre téléphone à un mastodonte dense de 31 milliards de paramètres pour serveurs. Chaque membre a une architecture différente, des forces différentes et des besoins matériels différents. Le E2B tient dans 1 Go de RAM. Le 12B Unified fait tourner une IA multimodale complète sur un GPU de laptop. Le 26B MoE n'active que 3,8B de paramètres par token. Tous Apache 2.0, tous open-weight, tous à vous. Ce guide passe en revue chacun pour que vous sachiez exactement quel Gemma correspond à votre matériel et votre utilisation.
Agents IA — Des logiciels qui travaillent pendant que vous dormez
Voir toutUn agent autonome open source qui vit sur votre machine, se connecte à vos apps de messagerie et exécute des tâches réelles — gestion de fichiers, navigation web, e-mails, calendrier — pendant que vous vous concentrez sur le travail qui nécessite vraiment un cerveau humain.
Un agent IA auto-améliorant de Nous Research qui n'exécute pas seulement des tâches — il en tire des leçons. Il construit des compétences réutilisables, maintient une mémoire persistante et devient mesurablementmeilleur dans vos workflows spécifiques au fil de l'utilisation.
L'outil agentique de bureau d'Anthropic qui transforme Claude d'un chatbot en collègue — il ouvre vos fichiers, utilise vos applications et accomplit du travail intellectuel complexe pendant que vous vérifiez les résultats. Pas de terminal, pas de configuration, pas de Docker.
Génération d'images — Quand les mots deviennent des images
Voir toutDu texte entre ; une infographie minutieusement recherchée, un mockup UI impeccable ou un manga de plusieurs pages en sort. Ce n'est pas un simple générateur de pixels — c'est un moteur de raisonnement qui réfléchit avant de dessiner.
Le modèle d'images Gemini 3.1 Flash de Google a atteint la première place de l'Arena d'Images à la moitié du prix de son concurrent le plus proche. Haute résolution native, upscaler 4K intégré et génération en 4-15 secondes.
Un prompt textuel entre ; une image digne d'une galerie en sort. C'est l'outil qu'on utilise quand on veut du « wow » plutôt que du « techniquement correct ».
Génération vidéo — Hollywood dans une zone de texte
Voir toutUn studio hollywoodien d'un milliard de dollars compressé dans un réseau de neurones. Génère de la vidéo cinématographique avec un audio parfaitement synchronisé — dialogues, musique, effets sonores — en une seule passe. Désormais officiellement lancé et accessible mondialement.
Le modèle vidéo de xAI vient de décrocher la première place dans les tests à l'aveugle image-vers-vidéo — rapide, abordable, et de plus en plus redoutable pour transformer des prompts ou des images en clips cohérents en 720p avec audio natif. Imaginez un labo créatif ultra-réactif qui se frotte à Hollywood.
Une centrale vidéo unifiée qui génère de l'audio synchronisé, des histoires multi-plans et du contenu 4K à partir de texte — un pipeline VFX hollywoodien comprimé dans un onglet de navigateur.
Génération d'Images Locale — Des Pixels Sans Permission
Voir toutLe champion poids lourd de la génération d'images open source. Une architecture de 27 milliards de paramètres qui fusionne un diffusion transformer avec un modèle vision-langage, produisant des humains photoréalistes et un rendu de texte bilingue qui rivalise avec les services cloud uniquement — le tout sous Apache 2.0, ce qui signifie que chaque pixel qu'il génère vous appartient.
Le générateur d'images du peuple. Construit par la même équipe qui a créé Stable Diffusion, FLUX.2 Klein concentre le photoréalisme de la lignée FLUX dans des modèles assez compacts pour tourner sur un laptop gaming milieu de gamme. La variante 4B ne nécessite que 8 Go de VRAM — ce qui signifie que la RTX 4060 de votre laptop d'étudiant peut désormais produire des images de qualité studio. Sous licence Apache 2.0.
Le bolide de la génération d'images locale. Un modèle de 6 milliards de paramètres qui génère des images en 8 étapes d'inférence — souvent en moins d'une seconde — sur du matériel si modeste que les autres modèles IA en sont jaloux. Tourne avec 6 Go de VRAM en quantifié. Sous licence Apache 2.0. Si FLUX.2 Klein a démocratisé la qualité, Z-Image a démocratisé la *vitesse*.
Génération Vidéo Locale — Votre GPU, Votre Fauteuil de Réalisateur
Voir toutLe modèle vidéo du peuple. Alibaba a mis en open source un générateur vidéo de qualité hollywoodienne sous la licence la plus permissive de l'IA — Apache 2.0 — et la communauté open source l'a transformé en un véritable écosystème cinématographique. Deux tailles : une pour votre laptop gaming, une pour votre station de travail.
Le bolide de la génération vidéo locale — et le seul modèle local qui génère de l'audio et de la vidéo synchronisés en une seule passe. Lightricks a construit un modèle de 22 milliards de paramètres qui produit de la vidéo 1080p avec dialogues, musique et effets sonores intégrés dès le départ, pas ajoutés après coup. Les données d'entraînement sous licence de Getty et Shutterstock réduisent l'anxiété liée au droit d'auteur.
Musique & Voix — Du son à partir de rien
Voir toutVous fredonnez une idée en mots, et Suno la transforme en chanson complète — mais maintenant il peut la chanter avec *votre* voix, entraîné sur *votre* style, façonné par *vos* goûts. Le groupe IA a un nouveau chanteur principal : vous.
Le doublage vocal sous forme de curseur : dites-lui « sons soulagé, puis soupçonneux » et il joue le rôle — pauses, accentuations et même les petites imperfections humaines.
Programmation — L'IA qui écrit du code de production
Voir toutLe nouveau roi du coding agentique. Le modèle de classe Mythos d'Anthropic ne se contente pas de dominer les benchmarks — il les réécrit. SWE-Bench Pro à 80,3% pulvérise le peloton. FrontierCode Diamond à 29,3%, c'est 5× GPT-5.5. Stripe a migré 50 millions de lignes de Ruby en une journée. Économe en tokens, natif en vision et conçu pour le genre de travail d'ingénierie à long horizon qui sépare les outils des coéquipiers.
Le modèle de programmation agentique qui ne se contente pas d'autocompléter — il planifie, utilise des outils, débogue entre les fichiers et termine la tâche du dépôt chaotique pendant que vous promenez le chien. Terminal-Bench 82,7 % n'est pas une faute de frappe.
Le nouveau standard d'excellence pour l'ingénierie logicielle agentique — plus rapide, plus honnête et radicalement meilleur pour rester sur les rails lors de tâches complexes et de longue durée. SWE-Bench Pro 69,2% ne bat pas seulement tous les autres modèles — il bat son propre prédécesseur de près de 5 points. Dynamic Workflows déploient des centaines d'agents parallèles. Et un système d'auto- vérification 4× moins susceptible de laisser passer du code buggé. Pas une mise à jour incrémentale — le modèle qu'Opus 4.7 aurait dû être.
Le modèle open-weight de Zhipu AI vient de prendre la place #1 sur Design Arena — le premier modèle ouvert à dominer ce classement. SWE-bench Pro 62,1%, Terminal-Bench 82,7, FrontierSWE 74,4% (1% derrière Opus 4.8). AkitaOnRails est passé de 46/100 à 87/100 — la plus grande amélioration intra-famille jamais enregistrée. Licence MIT, contexte 1M tokens, deux niveaux de raisonnement.
Créateurs d'applications — De l'idée au déploiement en une conversation
Voir toutDécrivez une application comme si vous l'expliquiez à un stagiaire futé ; il génère du code fonctionnel et peut le pousser vers un pipeline de déploiement réel. L'énergie « de l'idée au produit livré », moins trois semaines de galère d'installation.
Comme embaucher un développeur junior qui ne dort jamais et qui a déjà tout l'environnement de travail ouvert. Vous demandez quelque chose ; il construit, exécute, teste et itère — là où l'application vit.
Architectes numériques — L'IA qui conçoit pour vous
Voir toutVous vous souvenez de ces heures interminables à lutter avec des zones de texte mal alignées ? Cet outil fait office d'agence de design personnelle, transformant instantanément des notes brouillonnes en présentations visuelles époustouflantes et interactives.
Recherche — L'IA qui montre ses sources
Voir toutQuand vous ne voulez pas juste une réponse — mais le fil d'Ariane qui la prouve. L'assistant de recherche qui montre vraiment son travail.
La recherche classique vous donne dix liens bleus ; le mode IA tente de vous offrir une visite guidée avec des questions de suivi. Google Search coiffé d'une casquette de tuteur.
Mentors académiques — L'IA qui étudie vos sources
Voir toutUn partenaire d'études infatigable qui mémorise instantanément chaque manuel dense, chaque transcription de cours fleuve et chaque article de recherche complexe que vous lui confiez. Il construit un univers factuel à partir de vos propres notes pour les interroger, les résumer et en débattre.