Azure AI Custom Translator Neural Dictionary: มอบคุณภาพการแปลคําศัพท์ที่สูงขึ้น
วันนี้เรารู้สึกตื่นเต้นมากที่จะประกาศเปิดตัวพจนานุกรมประสาทซึ่งเป็นการปรับปรุงคุณภาพการแปลที่สําคัญในแพลตฟอร์มของเรา ในบล็อกโพสต์นี้เราจะสํารวจคุณลักษณะพจนานุกรมประสาท
แนะ นำ
พจนานุกรมประสาทเป็นส่วนขยายของเรา พจนานุกรมแบบไดนามิก และ พจนานุกรมวลี คุณลักษณะใน Azure AI Translator ทั้งสองอนุญาตให้ผู้ใช้ของเราปรับแต่งผลลัพธ์การแปลโดยให้การแปลของตนเองสําหรับคําศัพท์หรือวลีเฉพาะ วิธีการก่อนหน้านี้ของเราใช้พจนานุกรมคําต่อคําซึ่งเป็นการดําเนินการค้นหาและแทนที่ที่แน่นอน พจนานุกรมประสาทปรับปรุงคุณภาพการแปลสําหรับประโยคซึ่งอาจรวมถึงการแปลคําอย่างน้อยหนึ่งคําโดยให้รูปแบบการแปลด้วยเครื่องปรับทั้งคําและบริบทเพื่อสร้างการแปลที่คล่องแคล่วยิ่งขึ้น ในขณะเดียวกันก็รักษาความแม่นยําในการแปลคําศัพท์สูง
ตัวอย่างภาษาอังกฤษ-เยอรมันต่อไปนี้แสดงให้เห็นถึงความแตกต่างในผลลัพธ์การแปลระหว่างทั้งสองวิธีเมื่อมีการร้องขอการแปลคําศัพท์ที่กําหนดเอง:
อินพุต: | Basic Knowledge of <mstrans:dictionary translation=”regelmäßiges Testen”>Periodic Maintenance</mstrans:dictionary> |
พจนานุกรมคําต่อคํา: | Grundkenntnisse แดร์ RegelmäßigEs ทดสอบen |
พจนานุกรมประสาท: | Grundkenntnisse DES Regelmäßigen ทดสอบens |
การปรับปรุงคุณภาพ
แผนภูมิด้านล่างแสดงให้เห็นถึงการปรับปรุงที่สําคัญที่คุณลักษณะใหม่นําเสนอในชุดทดสอบคําศัพท์ทั่วไปที่เปิดเผยต่อสาธารณะในยานยนต์ (https://aclanthology.org/2021.eacl-main.271), สุขภาพ (https://aclanthology.org/2021.emnlp-main.477) และโดเมน Covid-19 (https://aclanthology.org/2021.wmt-1.69) โดยใช้โมเดลการแปลทั่วไปของเรา
นอกจากนี้เรายังดําเนินการประเมินลูกค้าหลายชุดบนแพลตฟอร์ม Custom Translator และแบบจําลองพจนานุกรมประสาท เราวัดคุณภาพการแปลที่ได้รับจากข้อมูลลูกค้าระหว่างแบบจําลองที่มีและไม่มีส่วนขยายพจนานุกรมประสาท ลูกค้าห้ารายเข้าร่วมครอบคลุมภาษาเยอรมันสเปนและฝรั่งเศสในโดเมนธุรกิจที่แตกต่างกัน
แผนภูมิด้านล่างแสดงการปรับปรุงโดยเฉลี่ยของ ดาวหาง ในโดเมนการศึกษาสําหรับภาษาอังกฤษ - เยอรมันอังกฤษ - สเปนและอังกฤษ - ฝรั่งเศส สําหรับรุ่นทั่วไปทางด้านซ้ายและสําหรับรุ่นที่กําหนดเองทางด้านขวา แถบสีน้ําเงินแสดงถึงคุณภาพการแปลทั่วไปโดยไม่มีพจนานุกรมประสาทและแถบสีส้มแสดงถึงคุณภาพการแปลโดยใช้พจนานุกรมประสาท นี่คือการปรับปรุงเฉลี่ยโดยรวมในชุดทดสอบทั้งหมด สําหรับเซ็กเมนต์ที่มีรายการพจนานุกรมของลูกค้าอย่างน้อยหนึ่งรายการ (ระหว่าง 19% ถึง 63%) การปรับปรุงจะสูงถึง +6.3 ถึง +12.9 จุดดาวหาง
ภาษาที่รองรับ
- ปัจจุบันพร้อมให้บริการ (ณ วันที่ 6 ธันวาคม 2023): จีนตัวย่อ ฝรั่งเศส เยอรมัน อิตาลี ญี่ปุ่น เกาหลี โปแลนด์ รัสเซีย สเปน และสวีเดน – ไปและกลับจากภาษาอังกฤษ
- เรากําลังเพิ่มมากขึ้นในอนาคต สําหรับการอัปเดต โปรดดูที่ บันทึกประจํารุ่นตัวแปลแบบกําหนดเอง.
พจนานุกรมประสาททํางานอย่างไร
พจนานุกรมประสาทไม่ได้ใช้การดําเนินการค้นหาและแทนที่ที่แน่นอนเมื่อจัดการการแปลคําศัพท์ที่กําหนดเอง แต่จะแปลคําหรือวลีจากพจนานุกรมในลักษณะที่เหมาะสมกับบริบททั้งหมดมากที่สุด ซึ่งหมายความว่าคํานี้สามารถผันแปรหรือมีปลอกที่แตกต่างกันหรือสามารถปรับคําโดยรอบได้ทําให้เกิดการแปลที่คล่องแคล่วและสอดคล้องกันมากขึ้น
ตัวอย่างเช่นเรามีประโยคอินพุตต่อไปนี้เป็นภาษาอังกฤษและการแปลเป็นภาษาโปแลนด์โดยไม่มีวลีพจนานุกรมใด ๆ มีดังนี้:
อินพุต: | เราต้องการวิธีแก้ปัญหาที่รวดเร็วซึ่งจะเข้าใจได้ |
การแปลมาตรฐาน: | Potrzebujemy szybkiego rozwiązania, które będzie zrozumiałe. |
หากคุณต้องการตรวจสอบให้แน่ใจว่า "โซลูชัน" แปลว่า "อัลเทอร์นาทิวา" ("ทางเลือก" ในภาษาอังกฤษ) คุณสามารถเพิ่มคําอธิบายประกอบพจนานุกรมแบบไดนามิกเพื่อให้บรรลุสิ่งนั้น:
อินพุต: | We need a fast <mstrans:dictionary translation=”อัลเทอร์นาทิวา“>solution</mstrans:dictionary> that will be understandable. |
พจนานุกรมคําต่อคํา: | Potrzebujemy szybkiอัตตา อัลเทอร์นาทิวา, który Będzie Zrozumiały. |
พจนานุกรมประสาท: | Potrzebujemy szybkiEJ สลับกันwy, którราคา Będzie Zrozumiałราคา. |
ผลลัพธ์ที่ผลิตโดยวิธีการก่อนหน้านี้ไม่คล่องแคล่วเนื่องจากความสอดคล้องของเพศทางไวยากรณ์ถูกละเมิด พจนานุกรมประสาทให้ผลลัพธ์ที่คล่องแคล่วโดย a) ผันการแทนที่ที่ร้องขอและ b) เปลี่ยนคําโดยรอบเมื่อจําเป็น นอกจากนี้ยังสามารถเปลี่ยนปลอกในบางกรณีเช่นในตัวอย่างต่อไปนี้:
อินพุต: | This company’s <mstrans:dictionary translation=”Akcje“>stock</mstrans:dictionary> is cheap. |
พจนานุกรมคําต่อคํา: | Akcje Tej firmy เรื่องขบขัน ขอบคุณนิ. |
พจนานุกรมประสาท: | Akcje Tej firmy Są ขอบคุณนี. |
พจนานุกรมประสาทคาดหวังว่าการแปลคําที่ร้องขอมีให้ในรูปแบบไวยากรณ์พื้นฐาน คําหลายคํายังได้รับการสนับสนุนและควรให้เป็นคํานามวลีเช่นคําไม่ควรถูกทําให้เป็นคําหลักอย่างอิสระ (ตัวอย่างเช่น "การเลือกตั้งรัฐสภาเอสโตเนีย" จะดีกว่า "การเลือกตั้งรัฐสภาเอสโตเนีย")
วิธีเปิดใช้งานพจนานุกรมประสาท
สําหรับภาษาที่รองรับทั้งหมดที่ระบุไว้ข้างต้นพจนานุกรมประสาทจะพร้อมใช้งานทันทีสําหรับลูกค้าทุกคนที่ใช้แพลตฟอร์ม Custom Translator ด้วย พจนานุกรมวลี. จําเป็นต้องมีการฝึกอบรมโมเดลแบบกําหนดเองแบบเต็ม (หรือเฉพาะพจนานุกรมเท่านั้น) เพื่อเปิดใช้งานพจนานุกรมประสาท
คำ แนะ นำ
- หากคุณต้องการให้แน่ใจว่ารายการพจนานุกรมวลีถูกใช้บ่อยขึ้นเมื่อทํางานกับพจนานุกรมประสาทคุณอาจพิจารณาเพิ่มรายการวลีด้วยส่วนแหล่งที่มาในรูปแบบต่างๆ ในตัวอย่างด้านบน ถัดจาก "โซลูชัน _ อัลเทอร์นาทิวา"คุณอาจต้องการเพิ่มรายการต่อไปนี้เช่นกัน: "โซลูชัน _ อัลเทอร์นาทิวา", "โซลูชั่น_ อัลเทอร์นาทิวี", "โซลูชั่น _ อัลเทอร์นาทิวี".
- หากเป้าหมายคือเพื่อให้แน่ใจว่าคําหรือวลีเฉพาะถูกคัดลอก "ตามที่เป็นอยู่" จากข้อความที่ป้อนไปยังการแปลเอาต์พุตเมื่อใช้พจนานุกรมวลีให้พิจารณาบังคับใช้พจนานุกรมคําต่อคําเนื่องจากอาจสอดคล้องกันมากขึ้น
- หลีกเลี่ยงการเพิ่มคําแปลของคําหรือวลีทั่วไปหรือบ่อยครั้งลงในพจนานุกรมวลี
หากต้องการเรียนรู้เพิ่มเติมเกี่ยวกับ Custom Translator และวิธีที่จะช่วยให้ธุรกิจของคุณเติบโตในตลาดโลกให้เริ่มต้นด้วย คู่มือสําหรับผู้เริ่มต้นนักแปลแบบกําหนดเอง.
สิ่งที่คุณสามารถทําได้กับ Microsoft แปลที่กําหนดเอง
สร้างโมเดลที่กําหนดเองด้วยคําศัพท์เฉพาะโดเมนของคุณและแปลแบบเรียลไทม์โดยใช้ Microsoft นักแปล API.
ใช้ ตัวแปลแบบกําหนดเองของ Microsoft ด้วยโซลูชันการแปลของคุณเพื่อช่วยทําให้ธุรกิจของคุณเป็นสากลและปรับปรุงการโต้ตอบกับลูกค้า
สําหรับข้อมูลเพิ่มเติม โปรดเยี่ยมชม โซลูชันทางธุรกิจของ Microsoft Translator และ บันทึกประจํารุ่นตัวแปลแบบกําหนดเอง.