Google a présenté un certain nombre d’innovations en matière d’IA à I/O 2023


Google_logo-min
Google_logo-min

Lors de la conférence des développeurs I/O 2023, Google a présenté de nouvelles fonctionnalités d’IA pour ses services.

Modèle multimodal PaLM 2

Google a introduit une version mise à jour du modèle de langage PaLM 2, qui s’appelle désormais multimodal. Les développeurs n’ont pas divulgué les détails techniques de l’algorithme.

Cependant, ils ont noté que le modèle avait été formé sur l’architecture Google JAX et TPU v4. Ils ont également utilisé des corpus de textes scientifiques, ce qui rend PaLM 2 plus productif dans la résolution de problèmes mathématiques et logiques, affirme la société.

Le modèle a reçu des capacités améliorées pour générer du code. PaLM 2 a été formé dans 20 langages de programmation, dont JavaScript et Python.

De plus, lors du développement de l’algorithme, des corpus de textes en 100 langues ont été utilisés. La société affirme que cela améliorera les performances du modèle dans les “tâches multilingues”.

PaLM 2 est maintenant disponible via APIainsi que dans les services Colab et Firebase.

Chatbot Barde

L’IA conversationnelle de Bard fonctionne désormais sur le modèle multimodal PaLM 2. Le chatbot est désormais capable de traiter des images et de les fournir en réponse. Bard a également appris à travailler avec des cartes et à créer des tableaux.

Les développeurs ont déclaré que l’outil recevra bientôt un support pour les extensions. Parmi ceux annoncés figurent les propres services de Google tels que Docs, Sheets et Mail. Les partenaires tiers incluent le générateur d’images Adobe Firefly et la base de connaissances Wolfram Alpha.

De plus, les développeurs ont étendu les capacités de programmation de Bard à l’aide de “Lens” et ajouté la possibilité d’exporter du code Python vers Replit.

Google a également annulé la liste d’attente du chatbot et en a ouvert l’accès dans 180 pays. Jusqu’à présent, l’outil prend en charge l’anglais, le coréen et le japonais, mais dans un avenir proche, l’entreprise en augmentera le nombre à 40, y compris le russe et l’ukrainien.

Recherche Google

Au cours de la présentation, l’entreprise a fait la démonstration d’une IA conversationnelle intégrée directement dans le champ de recherche. Cette approche permettra aux utilisateurs de comprendre rapidement le sujet, d’ouvrir de nouveaux points de vue et d’étudier plus facilement les informations, selon les développeurs.

La société a donné un exemple de la façon dont la nouvelle recherche pourrait gérer une requête complexe comme “Quel est le meilleur pour une famille avec un enfant de moins de trois ans et un chien : Bryce Canyon ou Arches National Park.”

L'IA générative dans la recherche Google
IA générative dans Poisk. Données : Google.

En conséquence, l’IA générative a fourni un aperçu synthétisable des emplacements demandés, ainsi que des liens vers d’autres recherches.

Après cela, le moteur de recherche vous proposera les étapes suivantes ou vous conseillera d’affiner la demande en passant en mode dialogue. Dans ce cas, le système se souvient de tout le contexte de la conversation.

Les développeurs ont montré le potentiel d’une nouvelle recherche lors de vos achats. L’outil peut trouver un produit, le comparer avec d’autres offres et aider l’utilisateur à faire son choix.

IA générative dans la recherche Google lors de la navigation dans les produits0
AI générative dans “Recherche” lors de la navigation dans les produits. Données : Google.

L’IA générative génère un résumé des facteurs importants à prendre en compte lors de l’achat, ainsi que des offres pertinentes.

La fonction est basée sur la base de données Shopping Graph, qui contient plus de 35 milliards de produits.

Jusqu’à présent, la fonctionnalité est disponible dans l’application expérimentale. Laboratoires de recherche pour iOS et Android, et pour les utilisateurs de Google Chrome PC aux États-Unis.

Duet AI pour l’espace de travail

La boîte à outils Duet AI permettra aux utilisateurs de Workspace d’utiliser l’IA générative dans les applications bureautiques :

  • Rédiger des textes dans “Documents” et Gmail ;
  • Analyse et remplissage des tableaux dans “Tables” ;
  • Génération d’images et sommation des présentations en “Slides” ;
  • Résumé automatique des appels vidéo dans Meet.

Les développeurs ont noté séparément l’importance de la fonction Aidez-moi à écrire pour les appareils mobiles. Selon eux, avec son aide, les utilisateurs pourront créer rapidement des textes volumineux sans utiliser un clavier complet dans les applications Documents ou Gmail.

La société a également introduit la fonctionnalité Sidekick, qui est une barre latérale pour analyser un document ouvert. Elle peut répondre à des questions basées sur le contenu et générer des suggestions.

Certaines fonctionnalités sont déjà disponibles pour les utilisateurs enregistrés de Workspace Labs. L’entreprise a également ouvert une liste d’attente pour tout le monde.

IA responsable

L’entreprise a consacré une partie du discours à l’approche de la création d’une IA responsable. L’une des innovations du « Search » sera l’étiquetage des images générées par des algorithmes.

Spécifiez AI comme auteur de l'image
Spécifier AI comme auteur de l’image. Données : Google.

L’entreprise commencera également à fournir des informations sur le moment et sur quelle ressource l’image demandée est apparue pour la première fois. Tel que conçu par les ingénieurs de Google, cela peut conduire les utilisateurs vers des sites de vérification des faits et les aider à déterminer la crédibilité des images.

Les fonctionnalités commenceront à être déployées dans les semaines à venir.

Android 14

La prochaine version du système d’exploitation mobile Android 14 recevra également un certain nombre de fonctionnalités d’IA. Parmi eux se trouve un générateur de fonds d’écran pour votre bureau et votre écran de verrouillage.

Les utilisateurs pourront créer des images à partir d’emoji en choisissant les symboles et la palette de couleurs nécessaires. Dans ce cas, les émoticônes répondront au toucher.

La fonctionnalité Cinematic Wallpapers vous permet de créer des fonds d’écran 3D à partir de photos d’utilisateurs. L’intelligence artificielle analysera automatiquement l’image sélectionnée et générera de la profondeur avec un effet de parallaxe.

Les développeurs ont également annoncé la fonction de génération de fonds d’écran selon une description textuelle.

Les fonds d’écran cinématiques arriveront sur les appareils Pixel en juin, avec des fonds d’écran génératifs à l’automne 2023.

De plus, Android 14 recevra un certain nombre d’améliorations dans le domaine de la sécurité et de la personnalisation de l’écran de verrouillage. La version bêta du système d’exploitation est déjà disponible pour les appareils Pixel et un petit nombre de fournisseurs. La version finale est prévue pour août-septembre 2023.

Appareils Pixel

Lors de la présentation, Google a montré plusieurs nouveaux appareils de la gamme Pixel. Parmi eux:

  • smartphone économique Pixel 7a ;
  • une tablette avec une station d’accueil pour tablette Pixel ;
  • smartphone pliable Pixel Fold.

Les trois appareils sont basés sur une puce propriétaire Google Tenseur G2. La société a noté que les propriétaires de nouveaux appareils auront accès à toutes les fonctionnalités présentées lors de la conférence d’automne avec l’annonce du Pixel 7.

Le Pixel 7a est déjà en vente à partir de 499 $. La tablette Pixel et le Pixel Fold sont disponibles en précommande et seront expédiés en juin. Le coût des appareils est de 499 $ et 1799 $ respectivement.

Autres nouveautés

En outre, la société a introduit un certain nombre de nouveaux produits pour d’autres applications et services :

  • liste d’attente pour le service de génération de musique à partir de la description textuelle de MusicLM ;
  • l’effet d’immersion lors de la pose d’itinéraires dans les “Cartes” ;
  • Magic Editor dans l’application Photos pour les retouches assistées par l’IA ;
  • technologie de doublage vidéo automatique;
  • L’IA générative pour simplifier la publication d’applications dans le Play Store ;
  • Project Starline pour créer des images 3D de personnes ;
  • Prise en charge de WebGPU dans Chrome pour accélérer les applications Web d’IA.

Rappelons qu’en avril Google Brain et DeepMind ont fusionné à une seule équipe.

Abonnez-vous à ForkLog sur les réseaux sociaux

Vous avez trouvé une erreur dans le texte ? Sélectionnez-le et appuyez sur CTRL + ENTRÉE

Newsletters ForkLog : Gardez le doigt sur le pouls de l’industrie du bitcoin !



Lien des sources