- עמוד הבית
-
אודותינו
-
שפות
-
שירותים
-
תרגום משפטי
- לקוחות
-
יצירת קשר
IL: +972 72 2200700
- כניסה לאתר
צור אתנו קשר
הכנס את הפרטים שלך ונחזור אליך בעוד מספר דקות
איך מעריכים איכות תרגום מכונה?
זמן קריאה : 12 דק'
איך ניתן להעריך איכות של תרגום מכונה?
עקב הביקוש הגובר לתרגום מכונה, הצורך בבקרת איכות של החומר המתורגם הוא הכרחי. זאת כיוון שהסתמכות על התוצאות של כלי תרגום אוטומטיים בלבד לא מבטיחה איכות גבוהה ללא פגמים.
הערכה של איכות תרגום כוללת בתוכה בדיקת איכות לטקסט שתורגם על ידי מכונה. דוברי שפת אם בוחנים את החומר המתורגם ומתקנים כל שגיאה שהם מגלים.
המתרגמים המומחים הללו מוכשרים ביותר והם יתקנו כל פגם כדי להפוך את תוצר התרגום הסופי לבהיר, מדויק וחופשי מטעויות.
בנוסף למילים מומחי השפה בוחנים גם את התחביר ואת המונחים הנדרשים וגם שימוש נכון בקול, בהנחה והמסמך כולל קטעי קול, ואת הטון הכללי של המסרים בשפת היעד.
במאמר זה ניכנס לעומק תרגום המכונה ונבחן את הדרכים בהן איכות התרגום משפיעה על התעשייה.
מהו תרגום מכונה?
תרגום מכונה הופיע בתודעה הציבורית ביישומי בינה מלאכותית כמו גוגל טרנסלייט. אך כמובן במבט ממעוף הציפור מגלים שתעשיית התרגום מכונה הרבה יותר גדולה ומורכבת. בתרגום מכונה מתרגמים טקסט ותוכן משפה אחת לאחרת בעזרת כלים ממוחשבים שונים.
תרגום מכונה הוא כלי נוסף בתחום השפה הממוחשבת. תחום המבוסס על מדע המחשבים, בינה מלאכותית, תיאוריית המידע ויכולות סטטיסטיות. במשך הרבה זמן בשל האיכות הנמוכה של התרגומים שהופקו התחום נחשב לנישה מדעת פגומה.
ובכל זאת בעשורים האחרונים חלה התפתחות אדירה בטכנולוגיות תרגום המכונה. השיפור המתמיד באיכותן בנה תעשייה ששווה כיום מיליארד דולר.
אומנם תרגום מכונה לבדו אינו מושלם, אך השילוב של מתרגמים אנושיים מומחים יחד עם למידת מכונה, יוצר הרבה מאד הזדמנויות פרקטיות לתעשיית התרגום.
לפני עידן הבינה המלאכותית, חברות תרגום ומתרגמים מומחים שעשו תרגומים באופן ידני היו הנורמה. הם עשו את עבודתם לאט וביוקר, בשל העבודה העצומה שנדרשה כדי להפיק תרגום איכותי.
כיום, שוק תרגום המכונה משגשג, תוך שילוב יכולות העריכה האנושיות עם תרגומי מכונה מהירים. התוצרים זולים יותר ומתקבלים מהר יותר.
קראו עוד: מהי ההיסטוריה של תרגום מכונה?
הפגמים של תרגום מכונה
למרות ההתקדמות המשמעותית והזינוק בביקוש לתרגום מכונה, התחום עדיין נשאר שולי לעומת תרגום אנושי ממתרגמים מומחים. הטיה מגדרית, עיוותים ותרגומים לא מדוייקים של מילים וביטויים ונוסחים מתורגמים מוזרים הם תופעה שכיחה בתרגום מכונה. במיוחד באפליקציות שמתרגמות אוטומטית בזמן אמת.
הפגם המרכזי בתרגום מכונה הוא חוסר היכולת של תרגום מכונה לבטא בצורה מדוייקת ונקיה מחשבות ורגשות. אך יש לו פיתרון.
פיקוח אנושי ממתרגמים ועורכים מומחים על תרגום המכונה מתקן את הפגם הזה. העריכה האנושית מאפשרת למתרגמים לאתר ולתקן טעויות שהמכונה לא עולה עליהן.
תרגום מכונה לא יעיל בהרבה צמדי שפות, ככל שהשפה עשירה ומורכבת יותר כך היא יותר מאתגרת לבינה מלאכותית. במיוחד כאשר בינה מלאכותית צריכה לתרגם משפה בעלת חוקים פשוטים לשפה יותר מורכבת.
האתגר הזה דורש שהבחנות לשוניות שנעדרות בשפת המקור יופיעו בכל זאת בשפת היעד. כדי לפתור זאת כלים עשירי ידע לשוני חייבים להיות בשימוש. כלים מורכבים שלא תמיד נכללים בתרגומי מכונה טהורים.
הרבה פעמים חסר מידע על סדר המילים הנדרש בשפת היעד לעומת המשפטים או הביטויים בשפת המקור. מתרגם אנושי מומחה משלים פעמים רבות את הקונטקסט החסר.
אתגר נפוץ שחוזר על עצמו בשפות גמישות הוא תרגום לא מדויק של כינויי גוף, ישנן שפות שבהן הנושא אפילו מושמט לחלוטין. (לדוגמא השפות הסלאביות מפגינות את התכונה הזאת לא פעם).
תרגום מכונה גם נוטה להיות לא מיומן בהבנת הבדלים בין ביטויי שלילה שונים. מה שגורם בעיות רבות כאשר מנסים להשתמש בו לצמדי שפות מורכבים ועשירים.
כדי לפתור את בעיית הדיוק בתרגום מכונה, המעורבות האנושית בשלב העריכה מגשרת על הפערים. ועדיין שיפור ביכולת בקרת האיכות של תרגום מוכנה חיוני יותר ככל שתעשיית התרגום צומחת.
בקרת איכות לתרגום מכונה
ככל שהשוק הופך גלובלי ומתעורר בו ביקוש הולך וגובר לתרגומים איכותיים, דיוק בתרגום הופך ליותר ויותר חשוב. שוק הבלוקצ'יין החדש לדוגמא מכיל לקוחות מכל העולם ומחייב תרגום מסמכים פיננסיים למאות שפות שונות.
שיפוט האיכות של תרגום מכונה נקרא גם הערכת איכות תרגום, אנו נדון בשני הסוגים המרכזיים של הערכת תרגום ואז נצלול לתחום העריכה לאחר תרגום מכונה.
הערכה ידנית
הדרך הטובה ביותר למדוד את רמת האיכות של תרגום מכונה היא בעזרת הערכה אנושית מגורמים מקצועיים בתחום. בשיטה זו מומחי שפה בוחנים את תוצרי תרגום המכונה משני כיוונים שונים.
הכיוון הראשון בודק שטף ובקיאות בשפה. לפי גישה זו נמדד הדיוק בטקסט בשפת היעד הן מבחינה דיקדוקית והן מבחינת בהירות הטקסט. למתרגמים יש גישה רק לתרגום ולא למקור. לכן בגישה זו בחינת השטף דורשת רק מתרגם המומחה לשפת היעד.
הגישה השנייה בוחנת את הדיוק בטקסט דרך המשמעות שלו. כלומר באיזו מידה התרגום אכן מייצג את הטקסט המקורי. כאשר מעריכים את רמת הדיוק בטקסט שוקלים את הקונטקסט בין המשפטים בו.
המתרגם חייב לשלוט הן בשפת המקור והן בשפת היעד בשביל בדיקה מוצלחת לפי גישה זו.
בדיקות איכות ידניות בידי בני אדם לתרגום מכונה צורכות הרבה מאד זמן וכסף. בנוסף לכך מדובר בבדיקות סובייקטיביות. כדי להפחית את הסובייקטיביות, משתמשים בכמה מתרגמים מומחים שעושים יחד את בקרת האיכות.
כמובן, כדי לבנות נוסח המשלב את כל התיקונים שלהם יחד משתמשים באמצעים סטטיסטיים.
בקרת איכות אוטומטית
בקרת איכות אוטומטית נעשית על ידי שימוש באלגוריתמיים. האלגוריתמים הללו משולבים בבקרת האיכות וגורמים למחשב לתת ניקוד למדידת רמת האיכות של טקסטים.
הניקוד הזה אומר למשתמש כמה התרגום איכותי ומעניק לו ספירת מילים, מספר הטעויות במשפטים ואת הקונטקסט הכולל של המשפטים המתורגמים בשפת היעד.
בקרת איכות אוטומטית לא מושלמת ויש לבצע מספר רב של בקרות איכות עד שמקבלים מידע מדויק. בטכנולוגיה הזאת משתפרת באופן מתמיד ככל שהבאגים בבקרת האיכות האוטומטית מתוקנים.
שיטות בקרת איכות הן שיטות זולות לעומת בקרת איכות אנושית ומשתמשים בהן כדי לשפר את מערכות תרגום המכונה.
שיטות בקרת האיכות האוטומטיות מבוססות על הרעיון שתוצרי תרגום מכונה חייבים להיות קרובים במידת האפשר לתרגום אנושי. כדי לממש את השאיפה הזאת התוכנות הללו תלויות בזמינות של תוצרי תרגום אנושיים.
הסיבה לכך היא שבקרת איכות אוטומטית משתפרת ככל שהיא משווה את התרגומים שלה לתרגומים מעשה ידי אדם.
בגלל שמגוון התרגומים הנכונים גדול אפילו כאשר מדובר בבקרת איכות אנושית, כל תוכנה שמבצעת בקרת איכות אוטומטית לתרגום חייבת להתבסס על מגוון תרגומים אנושיים.
עריכה אנושית לאחר תרגום מכונה לעומת הערכת איכות
תרגום מכונה משולב עם עריכה אנושית אחריו הוא שיטה פופולארית נוספת בתעשיית התרגום. שיטה זו גם יצרה משרות חדשות למתרגמים שהפכו לפיתרון יעיל לעריכת תרגומי מכונה ושמירת איכותם.
עריכה לאחר תרגום מכונה היא שיטה יעילה לשמור על איכות תרגום גבוהה של התוכן המתורגם, אך ככל שיטה, גם לה יש פגמים.
במקום רק לעבוד עם טקסט המקור, למתרגם יש הן את המקור והן תרגום מלא שגיאות. הנוהג הוא להתייחס לתרגום מכונה כגרסת טיוטא כאשר מתרגם אנושי מומחה עורך אותו.
כלים לעריכת תרגום לאחר תרגום מכונה נפוצים בתעשיית התרגום. המחקרים מצביעים על כך ש- 30% מחברות התרגום עושות שימוש בתרגום מכונה ו- 70% מהחברות עושות שימוש בעריכה לאחר תרגום מכונה מפעם לפעם.
עריכה לאחר תרגום מכונה הוכחה כמהירה מתרגום אנושי. היא גם הוכחה כמשתלמת מאד כלכלית לתעשייה המבוססת על דיוק ואיכות גבוהה. שיטה זו גם מהירה יותר מתרגום מאפס או מתרגום המבוסס על זיכרון תרגומי.
למעט מהירות מחקרים כבר הוכיחו את השיפור הקוגניטיבי, הטכני ואת השיפור בהספק שהתוכנות הללו הביאו. שיפור בהספק מוגדר כשיפור בזמן שלוקח לבצע עריכה לאחר תרגום מכונה לטקסט.
השיפור הקוגניטיבי מתייחס לשיפור מתמיד בתהליכים הקוגניטיביים במהלך תרגום מכונה. ההיבט הטכני של עריכה לאחר תרגום מכונה הוא מתי וכיצד עושים מחיקות ותוספות לחומר המתורגם? כל הדברים הללו ביחד משפיעים על איכות התרגום.
אומנם עדיין לא ברור עד הסוף האם עריכה אנושית לאחר תרגום מכונה אכן משפרת באופן גורף את איכות התרגום או פוגעת בו. אך כמה שיטות בדיקה כבר מפותחות כדי לענות על השאלה הזאת.
שיעור טעויות האנוש בתרגום ((HTER
המשתנה האנושי בשיעור טעויות התרגום הוא שיעור טעויות התרגום שעוברות תיווך אנושי. בעזרת שיעור זה בודקים אלו צעדי עריכה נעשים כדי להעביר את התרגום עריכה מוצלחת אחרי תרגום מכונה.
שיעור טעויות זה מחושב על ידי היחס בין מספר המילים במסמך למספר העריכות הנדרש להן על מנת להפיק מהן נוסח איכותי אחרי עריכה לאחר תרגום מכונה. שיטת מדידה זו גם יכולה לשמש כדי למדוד את היכולת הטכנית של עריכה לאחר תרגום מכונה.
ככל שנדרשים פחות שינויים כדי ליצור גרסה איכותית בעריכה לאחר תרגום מכונה פחות מאמץ נדרש מהמתרגם. שיעור טעויות האנוש בתרגום מתמקד בתוצר הסופי של התרגום ולא בתהליך התרגום.
קצב עריכה בפועל (AER)
עצב עריכה בפועל הוא שיטת המדידה שמודדת את פעולות העריכה של המתרגם. שיטה זו יכולה לכלול הליכים מורכבים כמו עריכה קודמת לתוכן שכבר עבר עריכת תרגום מכונה.
מחקר חדש על עריכה לאחר תרגום מכונה, מצא קשר בינה לבין שיפור באיכות של תרגום מכונה.
ככל שאיכות תרגום המכונה ירדה נמצאה עליה גבוהה יותר בשיעור טעויות האנוש בתרגום. יחד עם זאת לא נמצא כל קשר בין כמות העריכות לבין איכותו של התרגום מכונה.
כמו כן, המחקר מצא שמשתנים כמו ריבוי הלחיצות על המקלדת לא יוצרים איכות תרגום גבוהה יותר בתרגום מכונה, או בעריכה לאחר תרגום מכונה. כלומר ריבוי שינויים לא בהכרח גורם לתוצאות יותר טובות.
כן נמצא קשר מסוים בין איכותו של תרגום המכונה לבין השיפור במהירות העריכה לאחר תרגום מכונה. מן הסתם מסיבות מובנות לחלוטין.
כמובן, המחקר הראה קשר בין איכות תוצרי תרגום המכונה הסופיים לאיכות העריכה שלאחר תרגום המכונה. לפי המחקר אנחנו יודעים בוודאות שתרגום גרוע תמיד יהפוך לגרוע יותר לאחר עריכה-אחרי- תרגום-מכונה.
העתיד של הערכת איכות תרגום מכונה
תרגום מכונה עוזר למיליונים בתעשיות שונות מסביבי לעולם על בסיס יומי. חברות תרגום כמו טומדס מספקים את הביקוש לשירותים הללו על ידי מתן שירותי תרגום מדוייקים לחברות בעולם.
טכנולוגיות תרגום מכונה מבוססות נוירונים משתפרות באופן מתמיד על בסיס יומי ואיתן עולה איכות התרגום המופק מהן. חוקרים ומדענים ממשיכים לפתור את החולשות בתהליכי תרגום, כדי ליצור שירותי תרגום איכותיים ללא שום פגם.
ככל שתעשיית התרגום ממשיכה להתפתח כך הביקוש לשירותי תרגום מכונה ושירותי עריכה לאחר תרגום מכונה גובר. עם העליה בצורך זה עולה גם הביקוש למומחי עריכה לאחר תרגום מכונה.
ככל שהצרכים הללו עולים, מחקרים, כמו המחקר שהוזכר במאמר הזה, ימשיכו למלא תפקיד חיוני בשיפור תעשיית התרגום. טכנולוגיות השולטות באיכות של תרגום המכונה חייבות גם הן להמשיך להשתפר ולהיות בשימוש נפוץ על מנת לשפר את האיכות של תרגומים בכלל.
המאמר המקורי כאן.
תורגם על ידי גילי קימור
מאמרים נוספים שעשויים לעניין אותך
תגובות