Cuando traducimos un idioma con pronombres de género neutro como el euskera o el húngaro, Google asume el masculino o femenino

El sesgo de los algoritmos es un fenómeno bien estudiado. Lo hemos visto por ejemplo en la búsqueda de imágenes al escribir «cocinar» donde los resultados son principalmente de mujeres. Ahora, a través de Reddit, vemos otro llamativo caso donde el algoritmo de Google toma la decisión de asumir el género.

Cuando nos vamos a Google Translate y decidimos traducir una frase de un idioma con elementos gramaticales neutros, como es el caso del euskera, el húngaro o el checo, Google coloca en nuestro idioma el pronombre «él» o «ella» en función del contexto. Algo que también ocurre con el inglés y el resto de idiomas donde hay un pronombre diferente para el masculino y el femenino.


Cuál es la explicación detrás del sesgo del traductor de Google

En el ejemplo del húngaro que vemos en Reddit se escribe un párrafo construido alrededor del pronombre neutro «ő», que sirve para referirse de manera genérica a los dos sexos. Sin embargo, tanto en la traducción al español como al inglés se ve que «ellas son bellas» y «ellos inteligentes». De igual manera que «ella cocina» y «él es profesor». Una particularidad que no tiene por qué ser cierta en el idioma original.


La traducción es simplemente un ejemplo y cualquier usuario puede abrir Google Translate y probar su propia frase. El algoritmo de Google Translate elegirá masculino o femenino y asumirá en cada momento lo más apropiado. También ocurre con el euskera, donde los nombres y los adjetivos no llevan marca de género.

Euskera En lenguas como el euskera, que también disponen de pronombres neutros, también ocurre esta diferenciación de género en el momento de traducir.

El caso es llamativo, pero no debería sorprendernos. Simplemente estamos ante un caso directo de cómo los algoritmos únicamente son un reflejo de la sociedad.

La inteligencia artificial de Google Translate, así como la de la mayoría de sistemas, se basa en la correlación. En este caso, únicamente están mostrando el género más habitual que han encontrado en la red. Si Google decide colocar el masculino junto a profesor es porque detecta que en el idioma donde se está traduciendo ese es el caso más habitual.

La posición de Google respecto a los sesgos de su algoritmo es que sus «resultados de búsqueda son un reflejo del contenido de toda la web, incluida la frecuencia con la que aparecen este tipo de términos y la forma en que se describen en la web», aunque apuntan que «estos resultados no reflejan las propias opiniones o creencias de Google».

En el caso de pronombres neutros individuales, el traductor de Google sí ofrece una bifurcación para mostrar las dos posibilidades. Sin embargo, al encadenar varias oraciones donde el algoritmo tenga que decidir, esta información añadida desaparece y el traductor opta por un género u otro. Un «bug», según describen fuentes de Google, que esperan «solucionar en el futuro».

En respuesta a Xataka, desde Google explican que «Google Translate funciona aprendiendo patrones a partir de millones de ejemplos de traducciones que aparecen en la web. Lamentablemente, esto significa que el modelo puede replicar de forma involuntaria los prejuicios de género que ya existen. Hemos estado trabajando en la actualización del producto para proporcionar una traducción tanto femenina como masculina de una sola palabra para múltiples idiomas, y aunque todavía se está trabajando para implementarlo de manera más amplia, esperamos llevar la experiencia a más funciones y comenzar a abordar el género no binario en las traducciones».

En Xataka | Google entiende lo imposible: por qué cuando buscamos «Aguanchu bi fri» sale el vídeo que queríamos de Queen


La noticia

Cuando traducimos un idioma con pronombres de género neutro como el euskera o el húngaro, Google asume el masculino o femenino

fue publicada originalmente en

Xataka

por
Enrique Pérez

.