Una vez más, los avances tecnológicos derriban los muros que separan la realidad de la ficción. Muchos recordamos las habilidades de Jim Carrey en Ace Ventura: Detective de mascotas, una película en la que el protagonista tiene la singular capacidad de comunicarse con los animales. Ahora, una inteligencia artificial que traduce ladridos de perros convierte esa idea alocada en una realidad, que algún día podría estar disponibles para los dueños de mascotas.

Hacia la decodificación de ladridos de perros con aprovechamiento del procesamiento del habla humana. Tal es el título de la publicación científica que aborda los detalles del ingenio a cargo de investigadores de la Universidad de Michigan, en Estados Unidos. El sistema que desarrollan, del cual hablamos anteriormente en este portal, procura identificar la raza, el género y las emociones de los perros con un ladrido como único dato. La eficacia del modelo será una gran noticia para los que alguna vez desearon entender lo que estos animalitos quieren decir en cada “guau” que sale de sus bocas.

Para conocer más a fondo los detalles del invento basado en inteligencia artificial, Hipertextual conversó con los investigadores a cargo del estudio. ¿Es posible identificar emociones como la alegría o la agresividad, partiendo de un ladrido? Además, ¿cuáles son los beneficios que traería un sistema como aquel, en caso de que sea lanzado a nivel general?

Una inteligencia artificial que traduce ladridos de perros, auxiliada por el habla humana

inteligencia artificial que traduce ladridos de perros
Los investigadores identificaron 14 tipos diferentes de expresiones y se enfocaron en cuatro de ellas. (Crédito: OpenAI DALL-E)

Para dar forma al algoritmo de IA se ingresaron ladridos de 74 perros de razas diferentes. Los investigadores realizaron una serie de acciones para generar emociones en los animales. Por ejemplo, al jugar con ellos grabaron sus reacciones y las etiquetaron como “locuciones” asociadas a la alegría y el bienestar. Con este método, identificaron 14 tipos diferentes de expresiones en los canes, positivas, negativas y neutras.

Tal como señalamos en nuestro repaso anterior sobre la inteligencia artificial que traduce ladridos, uno de los aspectos más interesantes de la investigación es el empleo de grabaciones de habla humana. Siendo que nuestro lenguaje es sustancialmente diferente al de los perros, ¿en qué sentido es útil para comprender qué quieren comunicar estos animales? Un dato relevante: la tasa de aciertos fue notablemente más alta al emplear el algoritmo que incluye vocalizaciones humanas.

Según comenta en diálogo con Hipertextual Artem Abzaliev, autor principal y estudiante de doctorado en informática e ingeniería de la Universidad de Michigan, aún no han dilucidado por qué el sistema mejora al incluir esos patrones en la base de datos. “El hecho de que el preentrenamiento del habla humana ayude a decodificar los ladridos de los perros no nos resulta exactamente claro. Creemos que podría deberse a que la red neuronal aprende algunas señales sonoras abstractas del habla y estos sonidos ayudan a comprender a los animales”, explica.

“Nuestro sistema podría ayudar a los perros”, dice Artem Abzaliev

inteligencia artificial que traduce ladridos de perros
Artem Abzaliev es estudiante de doctorado en la Universidad de Michigan. (Crédito: Cortesía)

La imagen junto a este párrafo muestra a Abzaliev en una de las calles de Nuremberg, en Alemania, junto a su perro Nova. “En términos de logística, las vocalizaciones de los animales son difíciles de solicitar y registrar”, observa. En este caso, tal como hemos indicado, los investigadores forzaron emociones para incitar ladridos. Por ejemplo, jugaron con los canes y simularon discusiones entre humanos, para asociar expresiones —los “guau”— con emociones.

¿Cómo surgió el interés para desarrollar una inteligencia artificial que traduce ladridos de perros, decodificándolos para que comprendamos el mensaje?

Personalmente, me interesé cuando escuché por primera vez que los perritos de las praderas codifican formas y colores. Este estudio me inspiró a probar algo similar en otros animales. Elegí a los perros porque los amo. Más importante aún, porque Humberto Pérez-Espinosa, colaborador del Instituto Nacional de Astrofísica, Óptica y Electrónica (INAOE) de México, en Puebla, ya había recopilado los datos y los puso a disposición de todos. Humberto dirigió el equipo encargado de la recolección de datos.

Luego del entrenamiento del sistema llegaron las pruebas. ¿Qué tipo de emociones identificaron en los perros?

En total encontramos 14 estímulos diferentes, que no necesariamente son emociones. En este trabajo en particular solo nos centramos en cuatro de ellos. Ladrido muy agresivo a un extraño, ladrido normal a un extraño, chillido negativo (en presencia de un extraño) y gruñido negativo (en presencia de un extraño). Nos enfocamos en ese grupo porque tienen la mayor cantidad de datos y los sistemas de inteligencia artificial modernos requieren mucha información. También experimentamos con la detección de ladridos positivos/negativos, pero no pudimos hacerlo funcionar.

¿Cuál fue el principal obstáculo con el que se encontraron al crear la inteligencia artificial que reconoce ladridos?

El mayor desafío para nosotros siempre son los datos. Ocurre que no existe algo así como un "Internet para perros", donde estos animales se comunicarían de forma natural. Por lo tanto, todo debe recopilarse, anotarse y etiquetarse manualmente.

Cuando el sistema sea pulido, ¿qué beneficios ofrecería, más allá de la calmar la curiosidad de aquellos a los que nos encantaría saber qué dicen nuestros perros cuando ladran?

Creo que a corto plazo el mayor beneficio sería comprender la ansiedad en ellos y cómo tratarla. Los ladridos juguetones son geniales. Pero creo que nuestro sistema podría ayudar a mitigar los efectos negativos en la vida de los perros.

Los paralelismos con el traductor de llantos de bebés

IA como traductor: anteriormente, hablamos de un algoritmo que identifica patrones en el llanto de los bebés. (Crédito: DALL-E)

El empleo de inteligencia artificial para decodificar códigos que no comprendemos no surgió con el aquí repasado desarrollo en la Universidad de Michigan, encabezado por Rada Mihalcea, profesora de Ciencias de la Computación en esa institución. Por mencionar un caso, el año pasado circularon informes de un sistema algorítmico que identifica patrones de comunicación en el cacareo de las gallinas. Uno más reciente: esta semana, Reuters reseñó una aplicación muy popular en Japón que usa IA para identificar malestares en los gatos.

La inteligencia artificial que traduce ladridos de perros en un paso hacia adelante en este ánimo de decodificación. Por lo demás, los planes de esa especie no se restringen al reino animal. De hecho, en diciembre Hipertextual entrevistó a Ana Laguna Pradas, una científica de datos española que trabaja en un sistema que identifica el tipo de emoción en el llanto de los bebés, en muchos casos también son de interpretación compleja.

“La clave es el Big Data”, comentó Laguna Pradas. “Es necesaria una gran cantidad de datos. Estas redes neuronales no dejan de ser cerebritos artificiales que aprenden a base de experiencia. En nuestro caso, llevamos años recopilando muestras. Hay un proceso muy exhaustivo a la hora de proporcionar el dato al modelo. No solo lo validan expertos, sino también clínicos y los papás. Además, hay unas normas muy estrictas para estar seguros de que lo que está viendo el algoritmo se trata de un llanto asociado a una emoción o necesidad específica. Entonces, esto es bastante laborioso, pues hace falta mucha cantidad de datos, mucho preprocesado y grandes algoritmos”, añadió.

Cuando dialogamos con Abzaliev, uno de los investigadores detrás de la inteligencia artificial que traduce ladridos, mencionamos el caso del algoritmo para identificar llantos de niños que aún no han dicho palabra. “¡Esto es realmente genial!”, celebró. “Creo que comprender a los bebés es un problema muy similar.  Según tengo entendido, los patrones deberían ser bastante simples: hambrientos, felices, molestos, enojados, etcétera. Con suficientes datos, nuestro sistema también debería poder aprender esto”, señaló.

En el epílogo de la conversación, consultamos a Abzaliev si el algoritmo que desarrollan llegará algún día a manos de los usuarios finales. Imaginamos que sería de agrado para muchísimos dueños de mascotas, que podrían interpretar a los animales tomando muestras desde el móvil. “Es difícil decirlo por ahora. Nos gustaría que estuviera disponible, pero siento que actualmente la precisión no es lo suficientemente alta como para implementarla en el mundo real. Creo que con más datos podemos mejorar el sistema y eventualmente hacerlo disponible”, cierra.

El trabajo realizado en la Universidad de Michigan contó con la colaboración del mencionado INAOE, de México. Los resultados se presentaron recientemente, en la Conferencia Internacional Conjunta sobre Lingüística Computacional, Recursos Lingüísticos y Evaluación. Es importante mencionar que el estudio se encuentra a la espera de la revisión por pares. En tanto, hasta esa validación, debemos coger con pinzas los resultados. Como fuere, parece evidente que los avances en inteligencia artificial, entre sus muchos encantos, en algún momento mejorarán nuestra comprensión del mundo animal. ¡Es seguro que Ace Ventura estallaría de celos cuando todos puedan saber qué nos dicen los perros!