بالإلى الحلوة والخاصة
Translator
تمت ترجمة هذه الصفحة تلقائيًا بواسطة خدمة الترجمة الآلية الخاصة بـ Microsoft Translator. التعرف على المزيد

مايكروسوفت المترجم مدونه

ترجمات Bing الجندرية تعالج التحيز في الترجمة

نزع التحيز الجنساني
3D تقديم رموز الجنس.

يسعدنا أن نعلن أنه اعتبارا من اليوم ، تتوفر ترجمات بديلة للمذكر والمؤنث عند الترجمة من الإنجليزية إلى الإسبانية أو الفرنسية أو الإيطالية. يمكنك تجربة هذه الميزة الجديدة في كليهما بحث بنج و بنج المترجم الراسيه.

على مدى السنوات القليلة الماضية ، أحدث ثورة في مجال الترجمة الآلية (MT) من خلال ظهور نماذج المحولات ، مما أدى إلى تحسينات هائلة في الجودة. ومع ذلك ، فإن النماذج المحسنة لالتقاط الخصائص الإحصائية للبيانات التي تم جمعها من العالم الحقيقي تتعلم عن غير قصد أو حتى تضخم التحيزات الاجتماعية الموجودة في تلك البيانات.

أحدث إصدار لدينا هو خطوة نحو الحد من أحد هذه التحيزات ، وتحديدا التحيز الجنساني السائد في أنظمة الترجمة الآلية. لطالما أنتج Bing Translator ترجمة واحدة لجملة إدخال حتى عندما كان من الممكن أن تحتوي الترجمات على اختلافات أخرى بين الجنسين بما في ذلك المتغيرات المؤنثة والمذكرة. وفقا ل مبادئ الذكاء الاصطناعي المسؤولة عن Microsoft، نريد التأكد من أننا نقدم ترجمات بديلة صحيحة وأكثر شمولا لجميع الأجناس. كجزء من هذه الرحلة ، تتمثل خطوتنا الأولى في توفير متغيرات الترجمة الأنثوية والذكورية.

يتم التعبير عن الجنس بشكل مختلف عبر لغات مختلفة. على سبيل المثال ، في اللغة الإنجليزية ، يمكن أن تشير كلمة محام إلى فرد ذكر أو أنثى ، ولكن باللغة الإسبانية ، أبوجادا سيشير إلى محامية ، بينما أبوجادو سيشير إلى ذكر. في حالة عدم وجود معلومات حول جنس اسم مثل "المحامي" في جملة المصدر ، قد تلجأ نماذج MT إلى اختيار جنس تعسفي للاسم في اللغة الهدف. في كثير من الأحيان ، تتوافق هذه التعيينات الجنسانية التعسفية مع الصور النمطية ، مما يديم التحيز المجتمعي الضار (Stanovsky et al.، 2019; Ciora et al. ، 2021) وتؤدي إلى ترجمات غير دقيقة تماما.

في المثال أدناه ، تلاحظ أنه أثناء ترجمة الجمل المحايدة بين الجنسين من الإنجليزية إلى الإسبانية ، يتبع النص المترجم الدور النمطي للجنسين ، أي أن المحامي يترجم على أنه ذكر.

الترجمة مع التحيز الجنساني
لقطة شاشة لترجمة النص الإنجليزي "دعونا نحصل على رأي محامينا في هذه المسألة." إلى اللغة الإسبانية التي تحتوي على تحيز جنساني.

نظرا لعدم وجود سياق في الجملة المصدر يشير إلى جنس المحامي ، فإن إنتاج ترجمة بافتراض وجود محام أو محامية سيكون صحيحا. الآن ، ينتج Bing Translator ترجمات بأشكال مؤنثة ومذكرة.

ترجمة النص الإنجليزي الغامض بين الجنسين إلى الإسبانية
لقطة شاشة لترجمة النص الإنجليزي "دعنا نحصل على رأي محامينا في هذه المسألة." إلى اللغة الإسبانية مع وجود ترجمات خاصة بالجنس.

تصميم النظام

لقد سعينا إلى تصميم نظامنا لتلبية المعايير الرئيسية التالية لتوفير بدائل جنسانية:

  1. يجب أن يكون للمتغيرات الأنثوية والذكورية اختلافات طفيفة باستثناء تلك اللازمة للتعبير عن الجنس.
  2. أردنا تغطية مجموعة واسعة من الجمل حيث تكون البدائل الجنسانية المتعددة ممكنة.
  3. أردنا التأكد من أن الترجمات تحافظ على معنى الجملة المصدر الأصلية.

كشف الغموض بين الجنسين

من أجل الكشف بدقة عن الغموض بين الجنسين في النص المصدر ، نستخدم نموذج المرجع المشترك لتحليل المدخلات التي تحتوي على أسماء متحركة. على سبيل المثال ، إذا كان نص إدخال معين يحتوي على كلمة مهنة محايدة بين الجنسين ، فنحن نريد فقط توفير بدائل جنسانية لها عندما لا يمكن تحديد جنسها من خلال معلومات أخرى في الجملة. على سبيل المثال: عند ترجمة جملة إنجليزية "قابلت المحامية سائقها في بهو الفندق" إلى الفرنسية ، يمكننا تحديد أن المحامي أنثى ، في حين أن جنس السائق غير معروف.

ترجمة النص الإنجليزي الغامض بين الجنسين إلى الفرنسية
لقطة شاشة لترجمة النص الإنجليزي "التقت المحامية بسائقها في بهو الفندق" إلى اللغة الفرنسية.

توليد ترجمة بديلة

عندما تكون الجملة المصدر غامضة بين الجنسين ، فإننا نفحص مخرجات نظام الترجمة لدينا لتحديد ما إذا كان من الممكن وجود تفسير بديل للجنس. إذا كان الأمر كذلك ، فإننا ننتقل إلى تحديد أفضل طريقة لمراجعة الترجمة. نبدأ ببناء مجموعة من الترجمات المستهدفة المرشحة عن طريق إعادة كتابة الترجمة الأصلية. نحن نطبق القيود اللغوية على أساس علاقات التبعية لضمان الاتساق في البدائل المقترحة وتقليم المرشحين الخاطئين.

ومع ذلك ، في كثير من الحالات ، حتى بعد تطبيق قيودنا ، يتبقى لنا إعادة كتابة متعددة للمرشحين للترجمة البديلة الجنسانية. لتحديد الخيار الأفضل ، نقوم بتقييم كل مرشح من خلال تسجيله باستخدام نموذج الترجمة الخاص بنا. من خلال الاستفادة من حقيقة أن إعادة الكتابة الجيدة بين الجنسين ستكون أيضا ترجمة دقيقة للجملة المصدر ، يمكننا ضمان دقة عالية في مخرجاتنا النهائية.

تصميم نظام إعادة انعطاف الجنس
رسم تخطيطي يوضح تصميم نظام إعادة انعطاف الجنس.

الاستفادة من نقاط النهاية المدارة عبر الإنترنت في التعلم الآلي من Azure

يتم استضافة الميزة البديلة الجنسانية في Bing على نقاط النهاية المدارة عبر الإنترنت في التعلم الآلي من Azure. توفر نقاط النهاية المدارة عبر الإنترنت واجهة موحدة لاستدعاء عمليات نشر النماذج وإدارتها على الحوسبة المدارة من قبل Microsoft بطريقة جاهزة. إنها تمكننا من الاستفادة من نقاط النهاية القابلة للتطوير والموثوقة دون القلق بشأن إدارة البنية التحتية. تتيح بيئة الاستدلال هذه أيضا معالجة أعداد كبيرة من الطلبات ذات زمن انتقال منخفض. تم تحسين قدرتنا على إنشاء ونشر خدمة إزالة التحيز الجنساني بأحدث الأطر والتقنيات بشكل كبير من خلال استخدام ميزات الاستدلال المدارة في Azure التعلم الآلي. من خلال الاستفادة من هذه الميزات ، تمكنا من الحفاظ على COGS منخفضة (تكلفة البضائع المباعة) وضمان الامتثال المباشر للأمان والخصوصية.

كيف يمكنك المساهمة؟

لتسهيل التقدم في الحد من التحيز الجنساني في الترجمة الآلية ، نقوم بإصدار مجموعة اختبار تحتوي على أمثلة ترجمة غامضة بين الجنسين من الإنجليزية إلى الإسبانية والفرنسية والإيطالية. كل جملة مصدر باللغة الإنجليزية مصحوبة بترجمات متعددة تغطي كل اختلاف محتمل بين الجنسين.

تم تصميم مجموعة الاختبار الخاصة بنا لتكون صعبة وغنية من الناحية الشكلية ومتنوعة لغويا. وقد كان لهذه المجموعة دور فعال في عملية التنمية لدينا. تم تطويره بمساعدة لغويين ثنائيي اللغة يتمتعون بخبرة كبيرة في الترجمة. كما أننا بصدد إصدار ورقة فنية تناقش مجموعة الاختبارات بالتفصيل ومنهجية وأدوات التقييم.

GATE: تحد محدد لأمثلة الترجمة الغامضة بين الجنسين - ورقة

GATE: مجموعة تحد لأمثلة الترجمة الغامضة بين الجنسين - مجموعة الاختبار

الطريق إلى الأمام

من خلال هذا العمل ، نهدف إلى تحسين جودة مخرجات الترجمة الآلية في حالات جنس المصدر الغامض ، بالإضافة إلى تسهيل تطوير أدوات معالجة اللغة الطبيعية (NLP) بشكل عام والأكثر شمولا. يركز إصدارنا الأولي على الترجمة من الإنجليزية إلى الإسبانية والفرنسية والإيطالية. من الآن فصاعدا ، نخطط للتوسع في أزواج لغوية جديدة ، بالإضافة إلى تغطية سيناريوهات وأنواع إضافية من التحيزات.

الائتمانات:

رانجيتا ، سبنسر راريك ، سوندار بودل ، فارون ماثور ، جيشوانت كومار شاندرالا ، تشاران موهان ، لي شوارتز ، ستيفن نجوين ، أميت باغوات ، فيشال شودري.