นี่จะไม่ใช่คำตอบที่เป็นคำอธิบายมากนัก
คุณภาพขึ้นอยู่กับหลายสิ่งรวมถึง (ตามที่แอรอนกล่าวไว้ข้างต้น) 1) คู่ภาษาและ 2) หัวข้อ แต่ยัง 3) สกุลและ 4) รูปแบบของต้นฉบับและ 5) จำนวนข้อความขนานที่คุณมี เพื่อฝึกอบรมระบบ MT
ในการกำหนดเวทีนั้น MT ทุกวันนี้มีพื้นฐานมาจากข้อความคู่ขนานนั่นคือข้อความในสองภาษาที่แตกต่างกันโดยมีคนหนึ่งน่าจะเป็นผู้แปลอีกคนหนึ่ง (หรือทั้งคู่แปลเป็นภาษาที่สาม) และอาจใช้พจนานุกรม (อาจช่วยโดยกระบวนการทางสัณฐานวิทยา) เป็น backoff เมื่อตำราขนานไม่ได้มีคำเฉพาะ
ยิ่งไปกว่านั้นอย่างที่คนอื่น ๆ พูดกันมาระบบของ MT ก็ไม่เข้าใจข้อความที่กำลังแปลอยู่ มันเพิ่งเห็นสตริงของตัวละครและลำดับของคำที่ประกอบขึ้นจากตัวละครและมันจะมองหาสตริงและลำดับที่คล้ายกันในข้อความที่แปลก่อนหน้านี้ (ตกลงมันซับซ้อนกว่านั้นเล็กน้อยและมีความพยายามที่จะให้ความหมายในระบบคอมพิวเตอร์ แต่ตอนนี้ส่วนใหญ่เป็นสตริง)
1) ภาษาแตกต่างกันไป บางภาษามีสัณฐานวิทยาจำนวนมากซึ่งหมายความว่าพวกเขาทำสิ่งต่าง ๆ ด้วยคำเดียวที่ภาษาอื่น ๆ ทำได้หลายคำ ตัวอย่างง่ายๆคือภาษาสเปน 'cantaremos' = อังกฤษ "เราจะร้องเพลง" และภาษาหนึ่งอาจทำสิ่งต่าง ๆ ที่ภาษาอื่นไม่ได้ใส่ใจด้วยเช่นความแตกต่างอย่างไม่เป็นทางการ / เป็นทางการ (tu / usted) ในภาษาสเปนซึ่งภาษาอังกฤษไม่เทียบเท่า หรือภาษาหนึ่งอาจทำสิ่งต่าง ๆ ด้วยสัณฐานวิทยาที่ภาษาอื่นใช้กับการเรียงลำดับคำ หรือสคริปต์ที่ภาษาใช้อาจไม่ได้ทำเครื่องหมายขอบเขตของคำ (ภาษาจีนและอื่น ๆ ) ยิ่งภาษาทั้งสองแตกต่างกันมากเท่าใดระบบการแปลก็จะยากขึ้นสำหรับ MT การทดลองครั้งแรกในสถิติ MT ได้กระทำระหว่างภาษาฝรั่งเศสและภาษาอังกฤษ
2) หัวข้อ: หากคุณมีข้อความคู่ขนานในพระคัมภีร์ (ซึ่งเป็นเรื่องจริงสำหรับเกือบทุกภาษาที่เขียน) และคุณฝึกฝนระบบ MT ของคุณให้ออกจากสิ่งเหล่านั้น (คัมภีร์ไบเบิลเป็นข้อความที่ค่อนข้างเล็กตามมาตรฐานของระบบการฝึกอบรมของ MT แต่ทำท่า :-)) คำศัพท์ในพระคัมภีร์นั้นแตกต่างจากตำราทางวิศวกรรมมากและความถี่ของไวยากรณ์ต่าง ๆ การก่อสร้าง (ไวยากรณ์เป็นหลักเหมือนกัน แต่ในภาษาอังกฤษคุณจะได้รับเสียงพูดเรื่อย ๆ และคำนามผสมในตำราวิทยาศาสตร์และวิศวกรรม)
3) Genera: ถ้าข้อความคู่ขนานของคุณคือข้อความทั้งหมด (เช่นคู่มือรถแทรกเตอร์, พูด), การพยายามใช้ระบบ MT ที่เกิดขึ้นบนกล่องโต้ตอบจะไม่ทำให้คุณได้รับผลลัพธ์ที่ดี
4) สไตล์: คิดฮิลารีกับโดนัล; ขยันและเป็นที่นิยม การฝึกอบรมอย่างใดอย่างหนึ่งจะไม่ได้รับผลลัพธ์ที่ดีในที่อื่น ๆ ในทำนองเดียวกันการฝึกอบรมระบบ MT ในนวนิยายระดับผู้ใหญ่และใช้ในหนังสือเด็ก
5) คู่ภาษา: ภาษาอังกฤษมีข้อความมากมายและโอกาสในการค้นหาข้อความในภาษาอื่น ๆ ที่ขนานกับข้อความภาษาอังกฤษนั้นสูงกว่าโอกาสในการค้นหาข้อความคู่ขนานในการพูดภาษารัสเซียและภาษาอิกโบ (ที่กล่าวว่าอาจมีข้อยกเว้นเช่นภาษาของอินเดีย) ในฐานะที่เป็นลักษณะทั่วไปขั้นต้นยิ่งข้อความแบบขนานที่คุณต้องฝึกอบรมระบบ MT ผลลัพธ์ที่ดีกว่า
โดยรวมแล้วภาษามีความซับซ้อน (ซึ่งเป็นเหตุผลที่ฉันรักมัน - ฉันเป็นนักภาษาศาสตร์) ดังนั้นจึงไม่แปลกที่ระบบ MT จะทำงานได้ไม่ดีนัก
BTW นักแปลมนุษย์ก็ทำได้ไม่ดีเช่นกัน ทศวรรษที่ผ่านมาฉันได้รับการแปลเอกสารจากนักแปลมนุษย์เป็นภาษาอังกฤษเพื่อใช้เป็นสื่อการฝึกอบรมสำหรับระบบ MT การแปลบางอย่างยากที่จะเข้าใจและในบางกรณีเราได้รับการแปลจากนักแปลสองคนขึ้นไปมันยากที่จะเชื่อว่านักแปลได้อ่านเอกสารเดียวกัน
และในที่สุดก็มี (เกือบ) ไม่เคยแปลที่ถูกต้องเพียงหนึ่งเดียว มีหลายวิธีในการแปลข้อความซึ่งอาจจะมากหรือน้อยขึ้นอยู่กับว่าคุณลักษณะใด (ความถูกต้องทางไวยากรณ์สไตล์ความสอดคล้องของการใช้ ... ) ที่คุณต้องการ "ความแม่นยำ" ไม่ง่ายเลย