IA : le français H entre directement dans la cour des grands

IA : le français H entre directement dans la cour des grands La scale-up présente trois agents d'IA à la pointe des benchmarks en navigation web et publie Holo-1, un modèle open source agentique à l'état de l'art.

On ne pourra pas lui reprocher de céder aux effet de mode avec l'IA agentique. Et pour cause : H, ou H Company, a été pensée comme agentique par nature dès sa création. Fondée fin 2023 par quatre ex-employés de Google DeepMind et Charles Kantor, un ancien de CentraleSupélec et Stanford, la start-up française annonce aujourd'hui trois nouveaux agents de navigation autonome capables de rivaliser avec les meilleures solutions américaines. La scale-up publie également en open source sur Hugging Face Holo-1, son premier vision language model, capable de naviguer en toute autonomie.

3 agents, 3 usages différents

H présente donc 3 agents : Runner H, Surfer H et Tester H. Chacun répond à des cas d'usage bien particuliers. Ces derniers se destinent aux professionnels mais également aux particuliers curieux de tester la navigation agentique autonome.

Runner H : un agent d'actions basé sur des connecteurs

Runner H fonctionne comme une plateforme d'orchestration intelligente qui transforme une instruction en langage naturel en une séquence d'actions coordonnées sur plusieurs applications et services. L'agent pilote des sous-agents spécialisés et s'appuie sur un système de connecteurs pré-configurés pour interagir directement avec des outils collaboratifs. La plateforme permet déjà de se connecter à Gmail pour la gestion des emails, Google Workspace (Docs, Calendar, Drive, Sheets) pour la bureautique, Notion, Slack pour la communication d'équipe, et Zapier pour étendre les possibilités d'automatisation.

Runner H et ses sous-agents en fonctionnement. © Capture d'écran / JDN

H cite plusieurs cas d'usage concrets : la synchronisation de données entre plusieurs plateformes, la génération automatique de rapports à partir de sources multiples, ou encore l'orchestration de workflows marketing complexes impliquant plusieurs outils. L'utilisateur n'a qu'à saisir son prompt et le VLM de H se charge d'orchestrer les différentes actions entre les outils.

Surfer H : un agent de navigation web

Operator chez OpenAI, Computer User chez Anthropic, Projet Mariner chez Google… Surfer H se positionne dans la lignée des agents web autonomes. Surfer H simule le comportement d'un utilisateur humain : il "voit" la page web grâce à son modèle de vision (Holo-1), identifie les éléments interactifs (boutons, formulaires, menus), et exécute les actions demandées en cliquant, saisissant du texte ou naviguant entre les pages.

Surfer H en action. © Capture d'écran / JDN


Surfer H est excellent en navigation autonome. L'agent obtient un score SOTA sur le benchmark WebVoyager avec un score de 92,2 % contre 89,1% pour Browser Use (concurrent direct de H) et 87% pour Operator d'OpenAI. Chaque tâche coûte en ressources matérielles environ 0,13 dollar, ce qui en fait l'une des solutions les plus accessibles du marché.

Tester H : un agent d'automatisation de scripts web

Tester H permet aux équipes non-techniques de créer des campagnes de test web simplement en décrivant les actions à effectuer : "vérifier que le bouton de connexion fonctionne", "tester le processus de commande jusqu'au paiement", ou "s'assurer que les formulaires de contact envoient bien les emails". Tester H se charge ensuite de convertir ces instructions en scripts automatisés compatibles web et mobile. L'agent fonctionne comme un testeur QA automatisé : il vérifie de manière autonome le bon fonctionnement des interfaces web et mobiles.

© Capture d'écran / JDN

Holo-1 disponible en open source, sur Hugging Face

Parallèlement au lancement de ses trois agents, H publie Holo-1, son modèle moteur (sans toutefois dévoiler la version actuellement en production), en open source sur Hugging Face.  "Traditionnellement, un agent utilise deux composants séparés : un LLM pour planifier les étapes, aller sur un site, cliquer, scroller, et un modèle visuel, VLM, pour localiser les éléments. Les agents actuellement sur le marché sont chers car il faut orchestrer ces deux systèmes. Avec Holo 1, nous avons créé un modèle unique qui fait à la fois la planification et la localisation, ce qui permet des réductions de coûts considérables", explique Charles Kantor, CEO. 

Le modèle est disponible en 3 et 7 milliards de paramètres. Les poids du 7B sont publiés sous licence Apache 2.0, la plus permissive. Cette dernière version atteint le meilleur taux de précision sur les tâches de navigation UX parmi les modèles de petite taille.  Enfin H publie également un dataset (WebClick) contenant 1 639 scénarios d'interaction réels avec des interfaces utilisateur. Dans le même temps, Amazon, présent au capital de H, annonce l'intégration de Holo-1 sur la marketplace AWS. Les entreprises peuvent ainsi déployer en un clic le modèle sur leur cloud.

Côté disponibilité, Runner H et Surfer H sont d'ores et déjà accessibles au public avec un déploiement progressif. Tester H, lui, est disponible uniquement pour les entreprises souhaitant industrialiser leurs tests logiciels à grande échelle. Avec ses trois agents et la publication d'Holo-1, H Company s'impose doucement mais sûrement dans un secteur au potentiel explosif.