Claude Sonnet 4.5 a travaillé de manière autonome pendant 30 heures
Anthropic a dévoilé son dernier modèle d'IA, Claude Sonnet 4.5, qui a enregistré des progrès remarquables en matière d'autonomie. Le modèle a fonctionné de manière autonome pendant 30 heures, développant une application de chat complète, similaire à des outils comme Slack ou Teams. Selon l'entreprise, il a créé environ 11 000 lignes de code au cours du processus, ne s'arrêtant qu'une fois la tâche terminée.
L'autonomie de 30 heures de la batterie représente un bond en avant significatif par rapport au modèle précédent, l'Opus 4, qui durait sept heures en mai.
Cette réussite constitue une étape importante dans la lutte d'Anthropic pour dominer le marché des agents IA et du codage IA. L'entreprise a qualifié Claude Sonnet 4.5 de « meilleur modèle au monde pour les agents, le codage et l'utilisation des ordinateurs dans le monde réel », et a souligné qu'il domine le marché en matière d'« utilisation des ordinateurs », en référence à la fonctionnalité « Utilisation des ordinateurs » lancée par Anthropic il y a près d'un an.
Ce modèle est spécialisé dans des domaines tels que la cybersécurité, les services financiers et la recherche. Canva a été l'un des premiers à tester le nouveau modèle, qui, selon l'entreprise, l'a aidé dans « des tâches complexes et de longue haleine, allant de l'ingénierie de notre base de code aux fonctionnalités intégrées aux produits et à la recherche ».
Anthropic a également annoncé que le nouveau modèle bénéficierait de mises à jour supplémentaires pour aider les développeurs à coder leurs propres agents d'interface utilisateur. Cela inclut l'accès aux machines virtuelles, la mémoire, la gestion du contexte et la prise en charge multi-agents. L'entreprise affirme ainsi fournir les mêmes composants que Claude Code, permettant ainsi aux développeurs de créer leurs propres agents haut de gamme.
Dianne Penn, responsable de la gestion des produits chez Anthropic, a été surprise par la nouvelle puissance de leur modèle, malgré tout le battage médiatique. Elle a ajouté qu'elle l'utilisait elle-même pour faciliter le recrutement, effectuer des recherches web approfondies, définir les paramètres des profils et créer une feuille de calcul des candidats potentiels et de leurs profils LinkedIn.