الترجمة اليه
ما هي الترجمة اليه ؟
ونظم الترجمة اليه هي تطبيقات أو خدمات علي الإنترنت تستخدم تكنولوجيات التعلم الألى لترجمه كميات كبيره من النصوص من والي اي من لغاتها المعتمدة. يترجم الخدمة نص "مصدر" من لغة واحده إلى لغة "هدف" مختلفه.
علي الرغم من ان المفاهيم وراء تكنولوجيا الترجمة اليه والواجات لاستخدامها بسيطه نسبيا ، والعلوم والتكنولوجيات وراء ذلك معقده للغاية والجمع بين العديد من التكنولوجيات الرائدة ، ولا سيما التعلم العميق ( الذكاء الاصطناعي) ، والبيانات الكبيرة ، واللغويات ، سحابه الحوسبة ، واجات برمجه التطبيقات علي شبكه الإنترنت.
منذ أوائل 2010s ، وتكنولوجيا الذكاء الاصطناعي الجديدة ، والشبكات العصبية العميقة (ويعرف أيضا باسم التعلم العميق) ، وسمح للتكنولوجيا من التعرف علي الكلام للوصول إلى مستوي الجودة التي سمحت لفريق مايكروسوفت المترجم للجمع بين التعرف علي الكلام مع به الاساسيه لترجمه النصوص التكنولوجيا لإطلاق جديده لترجمه خطاب التكنولوجيا.
ومن الناحية التاريخية ، كانت تقنيه التعلم الاساسيه المستخدمة في هذه الصناعة هي الترجمة اليه الاحصائيه (smt). smt يستخدم التحليل الإحصائي المتقدم لتقدير أفضل ترجمات ممكنة للكلمة نظرا لسياق بضع كلمات. وقد تم استخدام smt منذ منتصف 2000s من قبل جميع مقدمي خدمات الترجمة الرئيسية ، بما في ذلك مايكروسوفت.
وادي ظهور الترجمة اليه العصبية (nmt) إلى تحول جذري في تكنولوجيا الترجمة ، مما ادي إلى المزيد من الترجمات ذات الجودة العالية. بدات تقنيه الترجمة هذه في النشر للمستخدمين والمطورين في الجزء الأخير من 2016.
كلا smt و nmt تقنيات الترجمة لديها عنصرين في المشتركة:
- وكلاهما يتطلب كميات كبيره من المحتوي المترجمة قبل البشرية (حتى ملايين الجمل المترجمة) لتدريب النظم.
- لا تعمل كقواميس ثنائيه اللغة ، تترجم الكلمات استنادا إلى قائمه من الترجمات المحتملة ، ولكن تترجم استنادا إلى سياق الكلمة المستخدمة في جمله.
ما هو المترجم؟
خدمات المترجم والكلام، وهي جزء من الخدمات المعرفية مجموعه من واجات برمجه التطبيقات ، هي خدمات الترجمة اليه من مايكروسوفت.
ترجمة النص
تم استخدام المترجم من قبل مجموعات Microsoft منذ عام 2007 وهو متاح كواجهة برمجة تطبيقات للعملاء منذ عام 2011. يستخدم المترجم على نطاق واسع داخل Microsoft. وهي مدمجة عبر فرق توطين المنتجات والدعم والاتصال عبر الإنترنت. هذه الخدمة نفسها يمكن الوصول إليها أيضا ، دون أي تكلفة إضافية ، من داخل منتجات Microsoft المألوفة مثل بينغ, Cortana, مايكروسوفت ايدج, مكتب, sharepoint, سكايب، ياممير.
يمكن استخدام المترجم في تطبيقات الويب أو العميل على أي نظام أساسي للأجهزة ومع أي نظام تشغيل لتنفيذ الترجمة اللغوية والعمليات الأخرى المتعلقة باللغة مثل الكشف عن اللغة أو النص إلى الكلام أو القاموس.
الاستفادة من تقنيه الراحة القياسية للصناعة ، يقوم المطور بإرسال النص المصدر (أو الصوت لترجمه الكلام) إلى الخدمة باستخدام معلمه تشير إلى اللغة المستهدفة ، وتقوم الخدمة بإرسال النص المترجم للعميل أو تطبيق ويب لاستخدامه.
خدمة المترجم هي خدمة Azure مستضافة في مراكز بيانات Microsoft وتستفيد من الأمان والقابلية للتحجيم والموثوقية والتوفر دون توقف الذي تتلقاه خدمات Microsoft السحابية الأخرى أيضًا.
ترجمه الكلام
تم إطلاق تقنية ترجمة كلمات المترجم في أواخر عام 2014 بدءًا من مترجم Skype ، وهي متاحة كواجهة برمجة تطبيقات مفتوحة للعملاء منذ أوائل عام 2016. وهي مدمجة في ميزة مترجم مايكروسوفت الحية، سكايب، سكايب بث الاجتماع، وتطبيقات مترجم مايكروسوفت لالروبوت ودائرة الرقابة الداخلية.
ترجمه الكلام متاحه الآن من خلال خطاب Microsoft ، ومجموعه من نهاية إلى نهاية لخدمات قابله للتخصيص بالبالكامل للتعرف علي الكلام ، وترجمه الكلام ، وتوليف الكلام (تحويل النص إلى كلام).
كيف تعمل ترجمه النصوص ؟
هناك اثنين من التكنولوجيات الرئيسية المستخدمة لترجمه النص: تراث واحد ، والترجمة اليه الاحصائيه (smt) ، وأحدث جيل واحد ، والترجمة اليه العصبية (nmt).
الترجمة اليه الاحصائيه
ويستند تطبيق المترجم للترجمة الآلية الإحصائية (SMT) على أكثر من عقد من البحوث اللغوية الطبيعية في مايكروسوفت. وبدلا ً من كتابة قواعد مكتوبة يدوياً للترجمة بين اللغات، فإن نظم الترجمة الحديثة تتناول الترجمة كمشكلة تتمثل في تعلم تحويل النص بين اللغات من الترجمات البشرية القائمة والاستفادة من التطورات الأخيرة في الإحصاءات التطبيقية والتعلم الآلي.
يعمل ما يسمى بـ "الشركات الموازية" كحجر رشيد حديث بنسب هائلة ، حيث يوفر الكلمة والعبارة والترجمات الاصطلاحية في سياق العديد من أزواج اللغات والمجالات. تساعد تقنيات النمذجة الإحصائية والخوارزميات الفعالة الكمبيوتر على معالجة مشكلة فك التشفير (الكشف عن المراسلات بين المصدر واللغة المستهدفة في بيانات التدريب) وفك التشفير (العثور على أفضل ترجمة لجملة إدخال جديدة). يجمع المترجم بين قوة الأساليب الإحصائية والمعلومات اللغوية لإنتاج نماذج تعمم بشكل أفضل وتؤدي إلى ترجمات أكثر فهمًا.
وبسبب هذا النهج ، الذي لا يعتمد علي القواميس أو القواعد النحوية ، فانه يوفر أفضل ترجمات العبارات حيث يمكن استخدام السياق حول كلمه معينه مقابل محاولة لأداء ترجمه كلمه واحده. ولترجمه الكلمات المفردة ، وضع القاموس الثنائي اللغة ويمكن الوصول اليه من خلال www.bing.com/translator.
الجهاز العصبي الترجمة
التحسينات المستمرة على الترجمة مهمة. ومع ذلك ، استقرت تحسينات الأداء مع تكنولوجيا SMT منذ منتصف عام 2010. من خلال الاستفادة من حجم وقوة الكمبيوتر العملاق الذكاء الاصطناعي من Microsoft ، وعلى وجه التحديد مجموعة أدوات Microsoft المعرفية ، يقدم المترجم الآن الشبكة العصبية ([م]) علي أساس الترجمة التي تمكن عقد جديد من تحسين نوعيه الترجمة.
تتوفر نماذج الشبكة العصبية هذه لجميع لغات الكلام من خلال خدمة الكلام على Azure ومن خلال واجهة برمجة تطبيقات النص باستخدام معرف فئة "generalnn".
ترجمه الشبكة العصبية تختلف اختلافا جوهريا في كيفيه تنفيذها بالمقارنة مع تلك التقليدية smt.
الرسوم المتحركة التالية يصور الخطوات المختلفة ترجمات الشبكة العصبية من خلال الذهاب إلى ترجمه الجملة. وبسبب هذا النهج ، والترجمة سوف تاخذ في سياق الجملة الكاملة ، مقابل فقط بضع كلمات انزلاق النافذة التي تستخدم تكنولوجيا smt وسوف تنتج المزيد من السوائل والترجمة التي تترجم الإنسان يبحث.
واستنادا إلى التدريب علي الشبكة العصبية ، يتم ترميز كل كلمه علي طول المتجه 500-ابعاد (ا) يمثل خصائصه الفريدة داخل زوج معين من اللغات (مثل الانكليزيه والصينية). واستنادا إلى أزواج اللغات المستخدمة في التدريب ، فان الشبكة العصبية ستحدد بنفسها ما ينبغي ان تكون عليه هذه الابعاد. فانها يمكن ان ترميز مفاهيم بسيطه مثل الجنس (المؤنث ، المذكر ، محايده) ، ومستوي المداراة (عاميه ، عارضه ، مكتوبه ، رسميه ، الخ) ، ونوع من كلمه (الفعل ، الاسم ، الخ) ، ولكن أيضا اي خصائص أخرى غير واضحة كما هو مستمد من بيانات التدريب.
الخطوات ترجمه الشبكة العصبية من خلال الذهاب هي التالية:
- كل كلمه ، أو أكثر تحديدا 500-البعد الناقل يمثلها ، ويمر من خلال طبقه اولي من "الخلايا العصبية" التي من شانها ان ترميز في 1000-البعد المتجه (ب) الذي يمثل الكلمة في سياق الكلمات الأخرى في الجملة.
- وبمجرد ترميز كل الكلمات مره واحده في هذه المتجات البعد 1000 ، وتتكرر هذه العملية عده مرات ، وكل طبقه تسمح بتحسين صقل هذا التمثيل 1000-البعد للكلمة في سياق الجملة الكاملة (علي عكس smt التكنولوجيا التي يمكن ان تاخذ في الاعتبار فقط من 3 إلى 5 كلمات النافذة)
- ثم يتم استخدام مصفوفة الناتج النهائي من قبل طبقه الاهتمام (اي خوارزميه البرمجيات) التي سوف تستخدم كل من هذه المصفوفة النهائية الناتج وإخراج الكلمات المترجمة سابقا لتحديد اي كلمه ، من الجملة المصدر ، ينبغي ان تترجم المقبل. وسوف تستخدم هذه الحسابات أيضا لإسقاط الكلمات غير الضرورية في اللغة المستهدفة.
- تترجم طبقه وحده فك الترميز (الترجمة) الكلمة المحددة (أو بشكل أكثر تحديدا متجه البعد 1000 الذي يمثل هذه الكلمة في سياق الجملة الكاملة) في مكافئ اللغة المستهدفة الأكثر ملاءمة. ثم يتم تغذيه ناتج هذه الطبقة الاخيره (ج) مره أخرى في طبقه الاهتمام لحساب اي الكلمة التالية من الجملة المصدر ينبغي ترجمتها.
في المثال المبينة في الرسوم المتحركة ، والسياق--علم 1000--نموذج البعد من "ال"سوف ترميز ان الاسم (المنزل) هي كلمه انثويه باللغة الفرنسية (لا ميزون). سيتيح ذلك الترجمة المناسبة ل "ال"ان تكون"لا"وليس"لو"(المفرد ، الذكور) أو"ليه"(بصيغه الجمع) بمجرد وصولها إلى طبقه فك التشفير (الترجمة).
خوارزميه الانتباه سوف تحسب أيضا ، استنادا إلى كلمه (ق) ترجمت سابقا (في هذه الحالة "ال") ، بان الكلمة التالية التي ستترجم ينبغي ان تكون الموضوع ("المنزل") وليس نعت ("الازرق"). في يمكن تحقيق ذلك لان النظام علم ان الانجليزيه والفرنسية عكس ترتيب هذه الكلمات في الجمل. كان يمكن ان يحسب أيضا انه إذا كانت الصفة "كبيره"بدلا من لون ، وانه لا ينبغي عكس لهم ("البيت الكبير"= >"لا غراندي ميزون").
وبفضل هذا النهج ، فان الناتج النهائي ، في معظم الحالات ، أكثر طلاقه وأقرب إلى الترجمة البشرية من الترجمة المستندة إلى smt يمكن ان يكون من اي وقت مضي.
كيف تعمل ترجمه الكلام ؟
المترجم قادر أيضا على ترجمة الكلام. يتم الكشف عن هذه التكنولوجيا في ميزة مترجم لايف (http://translate.it) ، وتطبيقات المترجم ، سكايب مترجم وأيضا في البداية متاحه فقط من خلال ميزه سكايب مترجم وفي تطبيقات مايكروسوفت المترجم علي دائره الرقابة الخاصة والروبوت ، وهذه الوظيفة متاحه الآن للمطورين مع أحدث نسخه من فتح المستندة إلى بقية API المتاحة علي بوابه أزور.
علي الرغم من انه قد يبدو وكانه عمليه مستقيمة إلى الامام في الوهلة الاولي لبناء خطاب الترجمة التكنولوجيا من الطوب التكنولوجيا القائمة ، فانه يتطلب الكثير من العمل من مجرد سد "التقليدية" القائمة الإنسان إلى اله التعرف علي الكلام المحرك إلى ترجمه النص الموجودة واحد.
لترجمه الخطاب "المصدر" بشكل صحيح من لغة واحده إلى لغة "هدف" مختلفه ، يمر النظام بعمليه من أربع خطوات.
- التعرف علي الكلام ، لتحويل الصوت إلى نص
- truetext: تكنولوجيا مايكروسوفت التي تطبيع النص لجعله أكثر ملاءمة للترجمة
- الترجمة من خلال محرك ترجمه النص الموصوفة أعلاه ولكن علي نماذج الترجمة وضعت خصيصا لمحادثات الحياة الحقيقية المنطوقة
- نص إلى كلام ، عند الضرورة ، لإنتاج الصوت المترجمة.
التعرف التلقائي علي الكلام (ASR)
يتم تنفيذ التعرف التلقائي علي الكلام (ASR) باستخدام نظام الشبكة العصبية (NN) الذي تم تدريبه علي تحليل آلاف الساعات من خطاب الصوت الوارد. يتم تدريب هذا النموذج علي التفاعلات بين البشر بدلا من الأوامر من الإنسان إلى الجهاز ، مما ينتج التعرف علي الكلام الذي يتم تحسينه للمحادثات العادية. لتحقيق ذلك ، هناك حاجه إلى المزيد من البيانات ، فضلا عن dnn أكبر من التقليدية asrs الإنسان إلى اله.
معرفه المزيد حول خطاب مايكروسوفت لخدمات النصوص.
truetext
كما البشر التحدث مع البشر الآخرين ، ونحن لا نتحدث تماما ، بوضوح أو بدقه كما نعتقد في كثير من الأحيان نحن نفعل. مع التكنولوجيا truetext ، يتم تحويل النص الحرفي إلى أكثر دقه تعكس نية المستخدم عن طريق أزاله الكلام التمويه (حشو الكلمات) ، مثل "ام" ليالي ، "آه" ليالي ، "و" s ، "مثل" ق ، stutters ، والتكرار. كما يتم جعل النص أكثر قابليه للقراءة وقابل للترجمة عن طريق أضافه فواصل الجمل وعلامات التنقيط المناسبة والرسملة. لتحقيق هذه النتائج ، ونحن استخدمت عقود من العمل علي تقنيات اللغة ، ونحن وضعت من مترجم لإنشاء truetext. الرسم البياني التالي يصور ، من خلال مثال الحياة الحقيقية ، والتحول truetext المختلفة تعمل علي تطبيع هذا النص الحرفي.
الترجمه
ثم يترجم النص إلى اي من اللغات واللهجات بدعم من المترجم.
ترجمات باستخدام ترجمه الكلام API (كمطور) أو في التطبيق ترجمه الكلام أو الخدمة ، وتعمل مع أحدث الشبكات العصبية التي تستند إلى ترجمه لجميع اللغات المعتمدة علي الكلام المدخلات (انظر هنا للقائمة الكاملة). وقد بنيت هذه النماذج أيضا عن طريق توسيع نماذج الترجمة الحالية ، ومعظمها مكتوبه النص ، مع المزيد من النصوص المنطوقة لبناء نموذج أفضل لأنواع المحادثة المنطوقة من الترجمات. وهذه النماذج متاحه أيضا من خلال "خطاب" الفئة القياسية من الترجمة النص التقليدي API.
لأي لغات غير معتمده من قبل الترجمة العصبية ، يتم تنفيذ الترجمة smt التقليدية.
نص إلى كلام
إذا كانت اللغة المستهدفة هي واحده من النص إلى خطاب المدعومة 18 اللغات، وحاله الاستخدام يتطلب إخراج الصوت ، ثم يتم تحويل النص إلى إخراج الكلام باستخدام توليف الكلام. يتم حذف هذه المرحلة في سيناريوهات ترجمه الكلام إلى نص.
معرفه المزيد حول مايكروسوفت النص إلى خدمات الكلام.