
DolphinGemma : une IA pour explorer le langage des dauphins
DolphinGemma est un modèle d’intelligence artificielle audio développé par Google DeepMind avec le Wild Dolphin Project et le Georgia Institute of Technology. En s’appuyant sur un immense corpus de données audio et vidéo, il analyse et reproduit les vocalisations de dauphins pour en identifier les structures et tester des interactions simples avec eux.
Pourquoi DolphinGemma est une avancée importante
Le projet s’appuie sur plus de cinquante ans d’enregistrements couplant sons et comportements des dauphins tachetés de l’Atlantique. Grâce à un modèle d’environ 400 millions de paramètres, DolphinGemma peut analyser les vocalisations en temps réel sur un appareil portable.
Il fait partie du projet CHAT, où l’on apprend aux dauphins qu’un son précis correspond à un objet. S’ils reproduisent ce son, ils peuvent ainsi « demander » cet objet aux chercheurs.
Comment fonctionne DolphinGemma
L’IA transforme les sons des dauphins en données numériques qu’elle peut analyser.
Elle repère des motifs qui reviennent souvent, comme certains sifflements propres à chaque dauphin ou des sons produits pendant le jeu ou la chasse.
Un peu comme un outil de prédiction de texte, elle peut deviner le son qui devrait suivre et créer un son ressemblant.
L’usage du système CHAT
CHAT (Cetacean Hearing Augmentation Telemetry) est un dispositif expérimental qui crée un vocabulaire partagé entre chercheurs et dauphins. Certains sons artificiels sont associés à des objets précis. Lorsque le dauphin imite un son, le système détecte la demande et le chercheur donne l’objet correspondant. DolphinGemma améliore la détection et la réactivité de ce système.
Les limites actuelles
Pour l’instant, aucun sens précis n’a été attribué aux sons analysés. DolphinGemma identifie des structures statistiques, mais cela ne signifie pas qu’il comprend un langage. Les chercheurs mettent en garde contre l’anthropomorphisme : reproduire un son ne prouve pas la compréhension de son sens.
Un projet bientôt ouvert à tous
Google prévoit de rendre DolphinGemma open source en 2025. Cela permettra à d’autres équipes de l’adapter à d’autres espèces de dauphins, à condition de disposer de données bien étiquetées. L’objectif est de stimuler la recherche mondiale sur la communication animale grâce à l’IA.
Pourquoi cette recherche est stratégique
DolphinGemma automatise l’analyse bioacoustique, un travail long et complexe. Il peut révéler des motifs imperceptibles pour l’oreille humaine et faciliter l’étude du comportement animal.
Le projet illustre aussi l’importance croissante de l’IA dans les sciences de la nature, en associant écologie, technologie et éthique animale.
Sources principales
- Blog Google – DolphinGemma : How Google AI is helping decode dolphin communication
Présentation officielle de DolphinGemma, son fonctionnement, ses objectifs et les partenaires scientifiques impliqués.
- Scientific American – DolphinGemma Could Enable AI Communication with Dolphins
Analyse des enjeux scientifiques et éthiques du projet, avec des explications accessibles sur la technologie employée.
- InfoQ – DolphinGemma: AI for Decoding Dolphin Communication
Article technique détaillant les caractéristiques du modèle et les perspectives pour la recherche en bioacoustique.
Qu’est-ce que DolphinGemma ?
C’est un modèle d’intelligence artificielle de Google DeepMind conçu pour analyser, prédire et reproduire les vocalisations des dauphins à partir d’un vaste corpus audio et vidéo.
DolphinGemma comprend-il réellement le langage des dauphins ?
Non. Le modèle identifie des motifs et des régularités statistiques, mais aucun sens précis ni syntaxe n’a encore été confirmé par les chercheurs.
À quoi sert le système CHAT lié au projet DolphinGemma?
CHAT associe certains sons artificiels à des objets. Les dauphins peuvent imiter ces sons pour demander un objet. DolphinGemma améliore la détection et la réactivité de ce système expérimental.
Quand DolphinGemma sera-t-il disponible ?
Google prévoit de publier DolphinGemma en open source au cours de l’année 2025 afin de permettre aux chercheurs du monde entier de l’utiliser et de l’adapter.