El Wild Dolphin Project busca comprender y generar patrones sonoros similares a los que emiten los delfines.

En el marco del Día Nacional del Delfín, el gigante Google anunció un avance revolucionario en la comunicación entre especies: se trata de DolphinGemma, un modelo de inteligencia artificial diseñado para comprender y generar patrones sonoros similares a los que emiten los delfines.
El proyecto, desarrollado en conjunto con investigadores del Georgia Institute of Technology y el Wild Dolphin Project (WDP), abre nuevas puertas para el estudio de la comunicación marina.
Durante décadas, las señales acústicas de los delfines —como chasquidos, silbidos y pulsos explosivos— fueron objeto de estudio sin que se pudiera descifrar del todo su estructura. Con DolphinGemma, Google busca ir más allá de escuchar: intenta entender y responder con sonidos realistas generados artificialmente, lo que representa un paso hacia la posible interacción directa con estos mamíferos marinos. “Este enfoque en la búsqueda de la comunicación interespecies lleva los límites de la inteligencia artificial a nuevas fronteras”, explicó Google en su presentación oficial.
La base del proyecto es un archivo sonoro: el WDP lleva más de 40 años recolectando sonidos e imágenes de delfines manchados del Atlántico en su hábitat natural en las Bahamas. Este registro no invasivo permite vincular vocalizaciones específicas con comportamientos sociales observados, como silbidos exclusivos de cada individuo para el reencuentro entre madres y crías, o sonidos asociados a cortejos o conflictos.
DolphinGemma, entrenado con este corpus, funciona como un modelo de audio de entrada y salida: interpreta secuencias sonoras de delfines y predice los sonidos siguientes, del mismo modo en que los modelos de lenguaje prevén la próxima palabra en una oración. El modelo fue optimizado para correr en teléfonos Pixel —como los que usa WDP en el mar— y se basa en la tecnología SoundStream Tokenizer, que permite representar sonidos complejos con gran precisión.
Además del análisis, el proyecto apunta a una comunicación bidireccional. Para esto, se utiliza el sistema CHAT (Cetacean Hearing Augmentation Telemetry), un ordenador subacuático desarrollado junto al Georgia Tech que emite silbidos artificiales asociados a objetos preferidos por los delfines, como algas o pañuelos. La idea es que los delfines imiten estos sonidos para pedir objetos, y que los investigadores respondan en tiempo real mediante auriculares de conducción ósea. “Con este sistema, esperamos crear un vocabulario compartido que permita una forma simple de interacción”, señaló Google.
La próxima fase del proyecto, que se probará con Pixel 9 en el verano de 2025, incorporará funciones avanzadas de micrófono y altavoz, permitiendo que los teléfonos ejecuten modelos de IA y algoritmos de reconocimiento simultáneamente. Esto reducirá costos, mejorará la eficiencia energética y facilitará el mantenimiento del equipo en el océano abierto.
Finalmente, Google anunció que DolphinGemma será liberado como modelo abierto durante el próximo verano, para que otros investigadores puedan adaptarlo al estudio de diferentes especies de cetáceos. “Al compartir herramientas como DolphinGemma, esperamos acelerar la búsqueda de patrones y profundizar colectivamente nuestro entendimiento de estos inteligentes mamíferos marinos”, concluyó la compañía. La ciencia está más cerca que nunca de tender un puente entre los humanos y una de las especies más fascinantes del océano.



