Si la conférence Google IO 2024 a révélé quelque chose cette semaine, c’est que le géant de la recherche refuse de céder du terrain dans la course à l’intelligence artificielle, en déployant ses modèles Gemini avancés dans presque tous les produits de son écosystème. Lors de cette conférence annuelle pour développeurs, Google a dévoilé une multitude de fonctionnalités d’IA visant à rattraper ou dépasser des concurrents comme OpenAI et Microsoft.
L’entreprise de Mountain View a présenté « Project Astra », un nouveau système d’IA multimodal démontrant une remarquable conscience de l’environnement physique à travers les caméras des téléphones intelligents. Lors d’une démonstration en direct, le système a identifié des objets, répondu à des questions sur l’environnement et fait preuve d’une compréhension intuitive des relations spatiales qui a impressionné même les observateurs les plus sceptiques.
« Ce que Google démontre n’est pas seulement une amélioration progressive—c’est une tentative d’établir un nouveau paradigme d’interaction avec l’IA« , explique Elad Gil, investisseur technologique et ancien dirigeant de Google. « Le défi sera de transformer ces démonstrations impressionnantes en outils fiables pour une utilisation quotidienne. »
Au-delà des démonstrations spectaculaires, Google a annoncé des extensions pratiques à ses produits existants. La fonction Gemini Live mise à jour permet désormais des conversations vocales naturelles avec l’assistant IA de l’entreprise tout en prenant en charge 40 langues. Parallèlement, Gemini acquiert des capacités élargies dans les applications Google Workspace, promettant de transformer la façon dont les utilisateurs interagissent avec Docs, Sheets et d’autres outils de productivité.
Pour les développeurs, Google a dévoilé d’importantes mises à niveau de son infrastructure d’IA, notamment le modèle Gemini 1.5 Flash, qui, selon l’entreprise, offre des performances comparables à son modèle Pro mais à un coût nettement inférieur. Cela pourrait attirer les développeurs soucieux des coûts qui construisent actuellement sur les plateformes concurrentes.
Les marchés financiers ont réagi avec prudence aux annonces. Les actions d’Alphabet ont augmenté d’environ 1,2 % après la présentation, reflétant l’incertitude des investisseurs quant à la traduction de ces innovations en croissance significative des revenus. « La question fondamentale reste de savoir si Google peut monétiser efficacement ces capacités d’IA tout en maintenant sa domination dans la publicité liée aux recherches », note Mark Mahaney, directeur général senior chez Evercore ISI.
Les entrepreneurs technologiques canadiens considèrent les annonces de Google avec un optimisme mesuré. Gabriel Woo, fondateur de Kyber Systems, une startup d’IA basée à Toronto, me confie : « Les réalisations techniques de Google sont impressionnantes, mais ce sont les aspects économiques pour les développeurs qui détermineront l’adoption. De nombreuses startups dans notre réseau surveillent les modèles de tarification aussi attentivement que les fonctionnalités. »
Le paysage concurrentiel a considérablement évolué depuis la conférence de l’année dernière. Les modèles GPT-4 d’OpenAI ont établi de nouveaux standards de performance, tandis que Microsoft a agressivement intégré des fonctionnalités d’IA dans toute sa gamme de produits. La réponse de Google positionne Gemini non pas comme un produit autonome, mais comme une couche intelligente omniprésente dans tout son écosystème.
Google a également tenté de répondre aux préoccupations croissantes concernant la sécurité de l’IA en annonçant des outils améliorés d’authentification de contenu. La fonction « À propos de cette image » fournira des informations sur la provenance des images, tandis que le filigrane SynthID vise à aider les utilisateurs à identifier le contenu généré par l’IA. Cependant, les défenseurs de la vie privée maintiennent que ces mesures pourraient ne pas répondre suffisamment aux risques de deepfake et aux défis d’authenticité du contenu.
Pour les utilisateurs quotidiens, les changements les plus tangibles apparaîtront probablement dans l’expérience de Recherche Google, qui acquiert des capacités de recherche compositionnelle permettant aux utilisateurs d’affiner leurs requêtes par la conversation. L’entreprise a également présenté des améliorations à Circle to Search qui permettent aux utilisateurs de rechercher des objets dans des images en dessinant simplement autour d’eux.
Des chercheurs de la Banque du Canada ont noté que des innovations en IA comme celles-ci pourraient contribuer à des gains de productivité dans tous les secteurs, affectant potentiellement les prévisions de croissance économique. Un récent document de travail de la Banque suggère que l’adoption généralisée de l’IA pourrait ajouter de 0,3 à 0,7 point de pourcentage à la croissance annuelle de la productivité au cours de la prochaine décennie.
Le côté matériel n’a pas été négligé non plus. Le lancement du téléphone intelligent Pixel 8a de Google comprend des capacités Gemini, confirmant la stratégie de l’entreprise d’utiliser les fonctionnalités d’IA comme différenciateurs clés sur le marché mobile concurrentiel.
Ce qui reste incertain, c’est si les consommateurs percevront des différences substantielles entre les offres d’IA concurrentes. Des enquêtes récentes dans l’industrie suggèrent que de nombreux utilisateurs ont du mal à distinguer entre les résultats de ChatGPT, Claude et Gemini pour des tâches courantes.
« La réalité est que la plupart des gens ne se soucient pas des modèles sous-jacents—ils veulent simplement accomplir leurs tâches efficacement », remarque Amber Vora, directrice de l’expérience numérique à la Banque Scotia. « L’avantage de Google réside dans l’intégration de l’IA dans des produits que les gens utilisent déjà quotidiennement. »
Pour les investisseurs, la question devient de savoir si Google peut transformer ses capacités techniques en avantages concurrentiels durables. L’entreprise fait face au dilemme classique de l’innovateur : son activité principale de recherche génère d’énormes profits mais pourrait être vulnérable à la perturbation par de nouvelles interfaces centrées sur l’IA.
L’action de Google a augmenté d’environ 16 % depuis le début de l’année, derrière la hausse de 21 % de Microsoft pendant la même période—reflétant peut-être cette incertitude.
Comme me l’a confié en privé un capital-risqueur présent à la conférence : « Les démos sont impressionnantes, mais n’oublions pas que les démos sont conçues pour impressionner. Le vrai test sera ce qui sera livré aux utilisateurs dans les 6 à 12 prochains mois et si cela change réellement les comportements. »
Pour l’écosystème canadien de l’IA, les mouvements de Google sont très importants. La présence substantielle de l’entreprise en recherche à Montréal et Toronto signifie que les talents locaux et les startups s’engageront probablement tôt avec ces nouvelles capacités. Plusieurs fondateurs canadiens de l’IA présents ont exprimé leur enthousiasme à construire sur les nouvelles API annoncées.
Alors que la poussière retombe sur Google IO 2024, une chose est claire : l’intelligence artificielle n’est plus une catégorie de produits séparée mais devient intégrée dans l’ensemble de l’expérience informatique. La question à un milliard de dollars reste de savoir si l’approche de Google trouvera un écho plus efficace auprès des utilisateurs et des développeurs que celle de ses concurrents.