Saltear al contenido principal
Translator
Esta página ha sido traducida automáticamente por el servicio de traducción automática de Microsoft Translator. Aprende más

Microsoft Translator blog

Las traducciones con perspectiva de género de Bing abordan los prejuicios en la traducción

Desigualdad de género
Representación en 3D de los símbolos de género.

Nos complace anunciar que, a partir de hoy, las traducciones alternativas masculinas y femeninas están disponibles para cuando se traduce del inglés al español, francés o italiano. Puede probar esta nueva función en Bing Search Y Bing Translator verticales.

En los últimos años, el campo de la traducción automática (TA) se ha visto revolucionado por la llegada de los modelos transformadores, lo que ha dado lugar a enormes mejoras en la calidad. Sin embargo, los modelos optimizados para captar las propiedades estadísticas de los datos recogidos del mundo real aprenden inadvertidamente o incluso amplifican los sesgos sociales que se encuentran en esos datos.

Nuestro último lanzamiento supone un paso adelante en la reducción de uno de estos sesgos, concretamente el sesgo de género que prevalece en los sistemas de traducción automática. Bing Translator siempre ha producido una única traducción para una frase de entrada, incluso cuando las traducciones podrían haber tenido otras variaciones de género, incluidas variantes femeninas y masculinas. De acuerdo con la Principios de IA responsable de Microsoftqueremos asegurarnos de ofrecer traducciones alternativas correctas y más inclusivas para todos los géneros. Como parte de este viaje, nuestro primer paso es ofrecer variantes de traducción femeninas y masculinas.

El género se expresa de forma diferente en las distintas lenguas. Por ejemplo, en inglés, la palabra lawyer puede referirse tanto a un hombre como a una mujer, pero en español, abogada se referiría a una abogada, mientras que abogado se referiría a un varón. A falta de información sobre el género de un sustantivo como "abogado" en una frase de origen, los modelos de TA pueden recurrir a seleccionar un género arbitrario para el sustantivo en la lengua de destino. A menudo, estas asignaciones arbitrarias de género se alinean con los estereotipos, perpetuando prejuicios sociales perjudiciales (Stanovsky et al., 2019; Ciora et al., 2021) y dando lugar a traducciones que no son del todo precisas.

En el ejemplo siguiente, se observa que al traducir frases de género neutro del inglés al español, el texto traducido sigue el rol de género estereotipado, es decir, abogado se traduce como masculino.

Traducción con sesgo de género
Captura de pantalla de la traducción del texto en inglés "Let's get our lawyer's opinion on this issue." al español con sesgo de género.

Como no hay ningún contexto en la frase original que implique el género del abogado, producir una traducción con la suposición de un abogado masculino o femenino sería válido. Ahora, Bing Translator produce traducciones con formas tanto femeninas como masculinas.

Traducción al español de un texto inglés de género ambiguo
Captura de pantalla de la traducción del texto en inglés "Let's get our lawyer's opinion on this issue." al español con traducciones específicas de género.

Diseño del sistema

Nos propusimos diseñar nuestro sistema de modo que cumpliera los siguientes criterios clave para ofrecer alternativas con perspectiva de género:

  1. Las variantes femenina y masculina deben presentar diferencias mínimas, salvo las necesarias para transmitir el género.
  2. Queríamos abarcar una amplia gama de frases en las que fueran posibles múltiples alternativas de género.
  3. Queríamos asegurarnos de que las traducciones conservaran el significado de la frase original.

Detectar la ambigüedad de género

Para detectar con precisión la ambigüedad de género en el texto fuente, utilizamos un modelo de coreferencia para analizar las entradas que contienen sustantivos animados. Por ejemplo, si un texto de entrada contiene una palabra profesional de género neutro, sólo queremos ofrecer alternativas de género para ella cuando su género no pueda determinarse por otra información de la frase. Por ejemplo: Al traducir al francés una frase inglesa "The lawyer met her driver at the hotel lobby." podemos determinar que la abogada es mujer, mientras que el sexo del conductor es desconocido.

Traducción al francés de un texto inglés con ambigüedad de género
Captura de pantalla de la traducción del texto inglés "The lawyer met her driver at the hotel lobby." al francés.

Generar una traducción alternativa

Cuando la frase original tiene un género ambiguo, examinamos el resultado de nuestro sistema de traducción para decidir si es posible una interpretación alternativa del género. En caso afirmativo, procedemos a determinar la mejor manera de revisar la traducción. Empezamos por construir un conjunto de traducciones de destino candidatas reescribiendo la traducción original. Aplicamos restricciones lingüísticas basadas en relaciones de dependencia para garantizar la coherencia de las alternativas propuestas y eliminamos las candidatas erróneas.

Sin embargo, en muchos casos, incluso después de aplicar nuestras restricciones, nos quedamos con múltiples reescrituras candidatas para la traducción alternativa de género. Para determinar cuál es la mejor opción, evaluamos cada candidata puntuándola con nuestro modelo de traducción. Al aprovechar el hecho de que una buena reescritura del género también será una traducción exacta de la frase original, podemos garantizar una gran precisión en nuestro resultado final.

Diseño del sistema de reinflexión de género
Un diagrama que muestra el diseño del sistema de reinflexión de género.

Aprovechamiento de los puntos finales en línea gestionados en Azure Machine Learning

La función alternativa de género en Bing está alojada en puntos finales en línea gestionados en Azure Machine Learning. Los endpoints online gestionados proporcionan una interfaz unificada para invocar y gestionar despliegues de modelos en computación gestionada por Microsoft de forma llave en mano. Nos permiten aprovechar endpoints escalables y fiables sin preocuparnos de la gestión de la infraestructura. Este entorno de inferencia también permite procesar un gran número de solicitudes con baja latencia. Nuestra capacidad para crear y desplegar el servicio de género debias con los últimos marcos y tecnologías ha mejorado enormemente gracias al uso de las funciones de inferencia gestionada en Azure Machine Learning. Al aprovechar estas características, hemos podido mantener un bajo COGS (coste de los bienes vendidos) y garantizar el cumplimiento directo de la seguridad y la privacidad.

¿Cómo puede contribuir?

Para facilitar los avances en la reducción de los prejuicios de género en la traducción automática, publicamos un corpus de prueba con ejemplos de traducción del inglés al español, francés e italiano sin ambigüedad de género. Cada frase original en inglés va acompañada de varias traducciones que cubren todas las variaciones de género posibles.

Nuestro conjunto de pruebas se ha construido para que sea exigente, morfológicamente rico y lingüísticamente diverso. Este corpus ha sido fundamental en nuestro proceso de desarrollo. Ha sido desarrollado con la ayuda de lingüistas bilingües con una gran experiencia en traducción. También vamos a publicar un documento técnico en el que se analiza en detalle el corpus de prueba, así como la metodología y las herramientas de evaluación.

GATE: un reto para los ejemplos de traducción con ambigüedad de género - Ponencia

GATE: un reto para los ejemplos de traducción con ambigüedad de género - Conjunto de pruebas

Camino a seguir

Con este trabajo pretendemos mejorar la calidad de los resultados de la traducción automática en casos de género fuente ambiguo, así como facilitar el desarrollo de herramientas de procesamiento del lenguaje natural (PLN) mejores y más inclusivas en general. Nuestra versión inicial se centra en la traducción del inglés al español, francés e italiano. En el futuro, tenemos previsto ampliarlo a nuevos pares de idiomas, así como cubrir otros escenarios y tipos de sesgos.

Créditos:

Ranjita Naik, Spencer Rarrick, Sundar Poudel, Varun Mathur, Jeshwanth Kumar Chandrala, Charan Mohan, Lee Schwartz, Steven Nguyen, Amit Bhagwat, Vishal Chowdhary.