- עמוד הבית
-
אודותינו
-
שפות
-
שירותים
-
תרגום משפטי
- לקוחות
-
יצירת קשר
IL: +972 72 2200700
- כניסה לאתר
צור אתנו קשר
הכנס את הפרטים שלך ונחזור אליך בעוד מספר דקות
האם תוכנות תרגום מכונה מתגברות כיום על מכשול הקונטקסט?
זמן קריאה : 8 דק'
תוכנות תרגום מכונה ידועות לשמצה בתעשיית התרגום כחסרות יכולת הקשר עצמאית (CONTEXT). אין פלא שכך הדבר. מדובר במלאכה מורכבת שדורשת קשירת מושגים ומילים באופן שמבין לעומק את התכנים שנאמרים ומחברם לנורמות הרווחות בתעשיה ובציבור אליו נכתב התוכן.
עד כה התמודדו עם הבעיה באמצעות התאמה פרטנית (customization) של כל טקסט. אך כעת יתכן שהתפתחויות חדשות בטכנולוגיות תרגום המכונה ישנו זאת. תרגום מכונה שינסה לאפשר קונטקסט הקרוי "תרגום מכונה מכוון מסמך", יכול לשנות את המצב.
גישושים לקראת תרגום מכונה מכוון הקשר
בשנת 2019 "הכנס לתרגום מכונה" הציב בשורת המטרות שלו את המטרה הבאה: "פיתוח כלי שיתייחס למסמך התייחסות כוללת. אנו מזמינים את הנוכחים לפתח כלים כאלו בצמדי השפות אנגלית לגרמנית, אנגלית לצ'כית ואנגלית לסינית, נבצע הערכת איכות לכלים הללו". המשיכו לקדם את הנושא גם בכנס של נובמבר שנת 2020 בשל העניין הגדול בו. התחום מושך השקעות כספיות רבות.
במקביל יצרני תרגום המכונה שעובר התאמה פרטנית מנסים להפוך אותו ליותר קל ונגיש. למשל Microsoft Office 365, שמשתמשיה מקבלים את המסמכים שלהם בענן כקובץ חד לשוני, שנתוניו מותאמים למשתמשיו.
האם מערכות תרגום מכונה "נוירו-טבעיות" כבר התאימו את עצמן לתרגום לפי קונטקסט?
ישנו דיון עמוק האם תרגום מכונה הצליח להגיע לפחות בשפות מסויימות לרמת איכות אנושית? לפי פרופסור Achim Ruopp מאוניברסיטת ג'ורג'טאון: "ברור שכדי שתרגום מכונה יגיע לרמת איכות אנושית, עליו לא רק להצליח לייצר הקשר (CONTEXT) בין משפטים בתוך המסמך, אלא קונטקסט בכלל המסמך". כלומר הקשרים לא רק ברמת הדקדוק וההיגיון בין משפט למשפט אלא ברמת הנרטיב הכולל.
לפי Google's MacDuff Hughes ישנם ניסיונות לפתח תרגום מכונה שיכלול מתן קונטקסט במהלך תרגום המסמך כולו עוד משנת 2016. אגב זו משימה שאפילו מתרגמים מומחים בשר ודם עושים רק כאשר יש להם חומרי הקשר זמינים בסביבתם. Achim Ruopp טוען שהאתגרים בעניין הזה הם הצורך באבולוציה של ניתוח המידע והצורך בפיתוח מתודולוגיה מתאימה.
יצירת מודלים מותאמים באיכות גבוהה דורשת מומחיות רבה ואפילו אלמנט מסוים של ניסוי וטעיה. זו עוד סיבה לעבור למודלים דינמיים שמתאימים את התרגום לקונטקסט הכולל של המסמך את מורכבויות השפה ופיתוח תשתית מתאימה עדיין מהווים אתגר לא פשוט לכך.
יש גם לציין שאת המודלים הללו יש לשמר ולתחזק בקביעות ולהתאימם לשפה המשתנה. גם זו סיבה לעבור למערכת יותר דינמית שמתאימה את הטקסט לפי הקשר כולל של המסמך, אך זה גם אחד האתגרים בדרך להשגת המטרה.
אלו התפתחויות כבר נעשו בתרגום מכונה לקראת איכות גבוהה יותר?
כידוע, לפי נמזי, אם אתם מתרגמים מנוסים מספיק השולטים בתוכן שאתם כותבים ומכירים אותו היטב בשפת המקור ובשפת היעד הניסיון שלכם יאפשר לכם להחליט האם שווה להסתמך על תוצר של תרגום מכונה מותאם כלשהו ולבסס עליו את עריכת המסמך המתורגם ואת ניסוחו מחדש באיכות הגבוהה שמתבקשת.
אין טעם להקדיש לכך יותר מבין 3-5 שניות משום שיותר מכך צפוי לפגוע בקצב העובדה וביעילות הכללית. אם אתם מבחינים אחרי בערך חמש שניות שקשה לכם לתרגם מסמך שאתם מכירים ובקיאים בהקשר שלו ובשפה שלו לפי הנוסח של תרגום המכונה שהופק לכם: היפטרו מהנוסח.
יהיה לכם יותר משתלם תרגם את המסמך מחדש אולי על ידי אמצעי אחר של תרגום מכונה. אם הגענו עד רמה כזאת של יעילות שבה אפשר בהנחה שאתם מתרגמים מנוסים לזהות אם אילו תוצרי תרגום מכונה שווה לעבוד המסקנה איננה משתמעת לשתי פנים. זוהי ההתקדמות הרבה בתרגום מכונה וגם בהסתגלותו של האדם לאמצעי תרגום מכונה שונים.
פריצות דרך בבקרת האיכות כבר הגבירו את היעילות של תרגום מכונה והקלו את האפשרות לזהות מתי אפשר ורצוי להשתמש בתוצר של אמצעי תרגום מכונה מסוים. בעזרת מערכת משוב מיוחדת מלקוחות שבודקת את תגובתם של לקוחות לביטויים מסויימים ניתן לבדוק את איכות תרגום המכונה בכללותו. יתרה מזאת, ניתן אף ליצור מערכת תרגום מכונה לומדת באמצעות למידת מכונה המגיע כחלק מהאינטליגנציה המלאכותית שלה שמשתפרת מעט לאחר כל תרגום שהיא מקבלת.
מהי המשמעות? דמיינו שהיה לכם עובד מוצלח שאומנם מתחיל בחוסר ניסיון מוחלט ועושה טעויות רבות אבל בכל פעם שהעובד הזה משלים עבודה הוא הופך באופן שיטתי ולינארי לטוב יותר. כל חברת תרגום שאני מכיר הייתה רצה לסגור עסקה עם עובד שכזה. לרמה הזאת הגיעו חלק מתרגומי המכונה שמסתמכים על אינטליגנציה מלאכותית ועל למידת מכונה.
תרגום מכונה שבודק את עצמו – מדרג הציונים שמעריך האם שווה להסתמך על תוצרי התרגום
כאמור, בעזרת אותן מערכות משוב שבודקות איכות של טקסטים שתרגום מכונה מפיק נוצר מדרג הציונים הבא: מתחת לציון 75 "תרגום לקוי": אם המערכת איננה מציינת ציון המשמעות היא שנוסח תרגום המכונה שהופק קיבל ציון מתחת ל-75. במקרה כזה אין להשתמש בנוסח המתורגם אלא כרפרנס.
זאת מפני שכאשר תרגום המכונה שהופק מקבל ציון כזה צפויות להימצא בו טעויות רבות וחמורות מאד של עריכה. הזמן שיצטרכו להשקיע כדי לתקנן ולהפוך את המסמך לאיכותי מספיק לשליחה ללקוח יגרום לכך שההשקעה תהיה לא כדאית.
כאשר תוצר התרגום מקבל ציון 95 הוא נחשב לתרגום שאפשר, רצוי ומשתלם לעבוד עליו. התוכן המתורגם עדיין יצטרך לעבור עריכה לאחר תרגום מכונה. זאת כדי לעבור את כל ההתאמות לקהל היעד ולעמוד באיכות הנדרשת. עדיין ההשקעה תהיה קצרה יותר תדרוש פחות משאבים ותהיה בעלת כדאיות כלכלית.
העיקרון: כאשר חומר הבסיס טוב גם התוצר שיתקבל בהשקעה מינימלית יהיה תוצר ראוי שאפשר להסתמך עליו. הדבר דומה להרחבה ועריכה שתלמיד עושה לתשובות במבחן שלו כאשר הוא יודע שתשובותיו היו נכונות ביסודן.
כשתוצר התרגום מקבל ציון 99 לפי אותה מערכת בדיקה עצמית העריכה היחידה שהוא צריך היא עריכה-לאחר-תרגום- מכונה בשוליים בלבד. עריכה שתתקן שמות של מותגים למשל או תשפר הקשר, עריכה שתתקן שגיאות כתיב וניסוח זעירות.
כדאי לציין שגם אז המתרגמים המקפידים למהדרין מעדיפים להעביר את החומר שהופק בתרגום הזה סבב עריכה נוסף. זאת כדי בעיקר לבדוק שלא היו הקשרים ואתגרי לוקליזציה וקלטוריזציה שהתוכנה פספסה בשל מגבלותיה הברורות כמערכת שאיננה אנושית. בחינה של תוצרי תרגום מכונה תחת העין האנושית היא תמיד עניין מומלץ וזהירות מתחייבת.
משום כך, אפילו כאשר מדרג הציונים של מערכת המשוב העצמית בתוכנת תרגום מכונה שאתם משתמשים בה מעניקה לתוכן ציון של מאה עגול, ציון שאמור לייצג שלמות מוחלטת חובה לעשות סריקה אחרונה.
העין האנושית תבחין בוודאות בדברים שתוכנת התרגום פיספסה, אך אם נהיה כנים לגמרי גם תוכנות התרגום והעריכה עצמן שעוברות על המסמך כהרף עין מצביעות על שגיאות לפי דעתן ומציעות אלטרנטיבות לעיתים עולות על שגיאות שפה, סגנון ותוכן שהמתרגמים פיספסו בהתחלה.
אומנם אין מה להשוות איך ניתן לומר שהמתרגם מתקן את שגיאות התכונה וגם התוכנה מציעה במקרים מסוימים כיצד לתקן את שגיאות המתרגם. מכאן ניתן לומר שהפער בין המתרגמים לתוכנות תרגום המכונה בהפקת איכות הצטמצם במידת מה.
סיכום - אז האם תוכנות תרגום מכונה כבר הצליחו להתגבר על מחסום הקונטקסט?
נכון לעכשיו, עדיין לא. אומנם נעשתה התקדמות משמעותית באיכות של תרגומי מכונה והמשאבים האדירים שמושקעים אכן מניבים תוצאות וגורמים לשיפור מתמיד בתוצר שמתקבל. בכל זאת, הדרך לתרגום מכונה שידע להבין קונטקסט בצורה נכונה ושאיכותו לא תיפול מאיכות התרגום של מתרגמים מקצועיים עדיין ארוכה, אולי אפילו ארוכה מאד.
שפה היא ייצור חי ודינמי והיא משתנה במהירות שהאדם מפתח משמעויות חדשות למילים שכבר בשימוש ומילים חדשות למשמעויות קודמות או משמעויות שטרם התגלו. קונטקסט כולל נורמות מקצועיות נהוגות, הקשרי שפה מקומית והקשרי תרבות, הומור, דת ואידיאולוגיה רווחות בקהל היעד.
להבין את הקונטקסט הכולל של תרגומים פירושו להבין את האנשים שכתבו אותם והאנשים שקוראים את התכנים הללו. האם תוכנה אי פעם תוכל לעשות זאת טוב לא פחות מעין אנושית? אני בספק גדול. אנו צועדים לאיטנו בדרך לשם, אך בצעדי צב. מה שבטוח הוא שתרגום המכונה של מחר ככל הנראה יהיה טוב יותר מתרגום המכונה של אתמול.
מקווה שהתובנות של המאמר הזה סייעו לכם. אם אתם מעוניינים בפרטים נוספים, אתם מוזמנים ליצור קשר עם צוותי טומדס. צוותים שרכשו ניסיון רב בנושאי תרגום מכונה בעשור האחרון.
גילי קימור
מאמרים נוספים שעשויים לעניין אותך
תגובות