- עמוד הבית
-
אודותינו
-
שפות
-
שירותים
-
תרגום משפטי
- לקוחות
-
יצירת קשר
IL: +972 72 2200700
- כניסה לאתר
צור אתנו קשר
הכנס את הפרטים שלך ונחזור אליך בעוד מספר דקות
לא רק גוגל טרנסלייט – תובנות על תרגום מכונה ועריכה לאחר תרגום מכונה
זמן קריאה : 15 דק'
כאשר שואלים את איש העסקים הפשוט מה זה תרגום מכונה הוא מגלגל עיניים ואומר בחשדנות: "גוגל טרנסלייט ואינני יודע כמה אפשר להסתמך עליו".
אך האם תרגום מכונה שבמובנים מסויימים נחשב לעתיד של תעשיית התרגום מבחינה כמותית ואיכותית יכול להסתכם רק בגוגל טרנסלייט? ובכלל מדוע גוגל טרנסלייט זוכה לשם רע כל כך בקרב גורמים עסקיים וממשלתיים והאם הוא זוכה לכך בצדק?
במאמר הבא אנחנו נצלול לתוך נבכי העולם של תרגום מכונה הקרוי (Machine Translation – MT), והעריכה לאחר תרגום מכונה (PEMT). נברר מה ההבדל בין נישות שלמות בתעשיית התרגום, המסמנות את כיוון תעשיית התרגום לעתיד וגוגל טרנסלייט הידוע לשמצה, שמהווה דוגמא בלתי מייצגת לעולם שלם של טכנולוגיה?
כמו כן נדון בשאלות חשובות נוספות ביניהן: מה עדיף בדרך כלל מתרגמים אנושיים או תרגום מכונה? כיצד מזהים במהירות אם תרגום מכונה איכותי?
מה הם היתרונות והחסרונות של תרגום מכונה ביחס לתרגום אנושי ולהפך ובכלל כיצד מנועי תרגום מכונה התפתחו לאורך השנים והחלו לשמש בצורה גוברת והולכת בסיס טוב לעבודתם של המתרגמים המודרניים?
כישלונותיו של גוגל טרנסלייט עושים שם רע לתרגום מכונה
האם ידעתם שב- 4 ליוני 2018 גוגל טרנסלייט עמד למשפט על איכות התרגום שלו והפסיד? ב-21 ליולי 2017 שוטר אמריקאי עצר במחוז לינקולן בקנזס נהג מקסיקני חשוד דובר ספרדית בשם עומאר קרוז זמורה (Omar Cruz-Zamora), השוטר בדק את רישיונו חקר אותו וביקש אישור לחפש ברכבו.
לפי החוק האמריקני אסור לשוטר לחפש בכפיה ברכושו של אדם ללא צו בית משפט ועליו להשיג הסכמה מדעת לחיפוש מרצון. עומאר קרוז זמורה הספרדי לא ידע אנגלית. לכן השוטר השתמש בגוגל טרנסלייט כדי לתקשר איתו ולהשיג ממנו הסכמה מדעת לחיפוש ברכבו.
עומאר קרוז, כנטען, לא הבין את השאלה והסכים לחיפוש ברכבו בלי לדעת למה הוא מסכים. במהלך החיפוש נמצאו ברכב סמים קשים. כאשר הנושא הגיע לבית משפט, ההגנה של קרוז- זמורה טענה שההסכמה לחיפוש לא הושגה כחוק, בגלל פערי השפה. לכן ביקשה ההגנה להתעלם מהסמים שנמצאו כיוון שהושגו בחיפוש לא חוקי.
קרוז – זמורה זכה במשפט וזוכה לאחר ששני מתורגמנים טענו בעדותם: "גוגל טרנסלייט הוא אמצעי נוח וטוב לתקשורת פשוטה, אבל לא אמצעי מהימן להשגת הסכמה מדעת, בגלל שהוא מתרגם תרגום מילולי בלבד ללא הבנת הקשר".
זו בלי ספק אחת הסיבות שמנוע תרגום המכונה הסטטיסטי גוגל טרנסלייט לא מיועד לשימוש עסקי, אלא כתרגום בסיסי להמונים.
למזלנו, גוגל טרנסלייט לא מייצג את כלי תרגום המכונה העסקיים הנהוגים לשימוש כיום. תוכלו אגב למצוא בקישור הבא את חמשת כלי תרגום המכונה הידועים בעולם שנועדו להמונים הזקוקים לתרגום בסיסי ומילולי משפה לשפה.
קראו עוד: מה הם חמשת הכלים הידועים לתרגום מכונה?
כיצד תרגום מכונה התפתח לאורך השנים והאם הציפיות לגביו התגשמו?
בתעשיית התרגום שאפו לפתח אמצעי תרגום מכונה כבר משנות החמישים של המאה הקודמת. המטרה הייתה לתרגם כמויות גדולות של חומר, לכל השפות האפשריות מהר ובאופן מדויק ללא מגע יד אדם. מה ציפו מתרגום מכונה או כפי שלעיתים קוראים לו תרגום ממוחשב?
ציפו מתרגום מכונה להיות זול ויעיל ביותר ואף ניבאו שיחליף במשך הזמן מתרגמים ומתורגמנים ככל שהטכנולוגיה תתקדם עד שתתעלה מעל יכולותיו של האדם.
למרות פריצות דרך רבות שהובילו להתקדמות משמעותית בתחום, אשר הופכת את תרגום המכונה לנושא יותר ויותר רלוונטי, נכון להיום הציפיה הזאת התגשמה באופן חלקי ביותר. עדיין הטכנולוגיה משתפרת והשימוש בה מתקדם בקצב מתמיד. אנחנו עדיין לא קרובים למכשיר פיענוח השפות האוניברסאלי מ"מסע בין כוכבים" אבל לאט לאט אולי אנחנו מתקדמים לשם.
האם עדיף להשתמש בתרגום מכונה או במתרגמים אנושיים ואיזו שיטה טובה יותר לתרגום?
עקרונית, התשובה לשאלה האם להשתמש בתרגום מכונה מתקדם, או בתרגום ממתרגמים אנושיים תלויה בסיטואציה. כאשר המשתנים המכריעים הם: היקף העבודה, מהירות התרגום הנדרשת ורמת איכות התרגום שמצפים לה.
ככל שהעבודה הנדרשת היא עבודה שהיקף החומרים לתרגום בה הוא גדול ודרישות האיכות שלה לעומת זאת אינן גבוהות. כלומר, טקסט יבש שהמסרים שלו צריכים להיות מובנים, אבל לא טקסט בעל משמעויות חוקיות או רפואיות בהן כל מילה קובעת.
או לחלופין, כאשר העבודה איננה טקסט שיווקי שחייב להיעשות ברמת לוקליזציה גבוהה ויש להגיש אותה במהירות. כדאי להתבסס על תרגום מכונה בעת ביצועה.
לעומת זאת, אם עבודת התרגום דורשת קודם כל איכות גבוהה, אם החומר נועד לגורמים ממסדיים או גורמים עסקיים בכירים, אם נדרש בעבודה הרבה קונטקסט ויש לנוסח משמעויות שיווקיות, משפטיות, או רפואיות, כדאי לעבוד עם מתרגמים מומחים שיעשו לעבודה תרגום אנושי.
כמובן ניתן לשלב בין תרגום מכונה לתרגום אנושי בעזרת עריכה לאחר תרגום מכונה שידובר עליה בהמשך.
קראו עוד: מדוע יש להעדיף תרגום ממתרגמים מומחים על תרגום מכונה?
אז כיצד התחיל תרגום המכונה ואלו סוגים של תרגום מכונה קיימים?
לפי ויקיפדיה, תרגום המכונה התחיל בכנס מיוחד בנושא באוניברסיטת MIT בשנת 1952 את הכנס אירגן המתמטיקאי והלוגיקן יהושע בר הילל. הנחת העבודה בכנס הייתה שאפשר לייצר תוכנות תרגום שיצליחו לתרגם טקסטים ברמה גבוהה לפחות בתחומים מדעיים וטכניים.
ההנחה התבססה על כוחה פורץ הדרך של תעשיית המחשוב ובעיקר על היכולת של המחשבים הפרימיטיביים של אותה תקופה לשבור צפנים מורכבים ולפתור בעיות מסובכות.
מנוע תרגום מבוסס חוקים – ההתחלה בתחום תרגום המכונה
הכלי הראשון לתרגום מכונה ללא מגע יד אדם היה מנוע תרגום מכונה מבוסס חוקים. מערכת זו נחשבה למערכת תרגום מורכבת מאד אבל איכותית יחסית.
תרגום מבוסס חוקים היה מבוסס על הכנסת תבניות מורכבות מאד של תחביר, דקדוק וחוקים לשוניים אחרים בשפות רבות, כולל מילונים מיוחדים. מטרתו הייתה שימוש בחוקי השפה ובמעט דוגמאות על בסיסן כדי לתרגם טקסט.
היו מספר חסרונות לכלי הזה, קודם כל הכלי דרש השקעה רבה מאד. היה צורך להקדיש זמן רב והרבה כסף, כדי שמומחים לבלשנות ישתילו את שלל החוקים וההתניות בתוך הכלי, שבעזרתן יוכל לתרגם טקסט. הכלי סיפק תרגום מילולי איכותי יחסית למרות שהתקשה לתרגם מטאפורות ודימויים.
החיסרון העיקרי של הכלי הזה היה היעדר גמישות. כידוע, שפה היא יצור חי שמשתנה כל הזמן. הסלנג של אתמול הופך לשפה התקנית של מחר ולשפה הגבוהה של מחרתיים.
משמעויות של מילים מתחלפות באופן מתמיד. שפות שונות משפיעות אחת על השניה לאורך כל האינטראקציות בין אנשים שדוברים אותן. כלומר, הנוף הלשוני משתנה מהר.
הרבה יותר מידי מהר בשביל כלי תרגום מכונה מבוסס חוקים, שצריך זמן רב כדי לתכנת אותו בהתאם לחוקים הלשוניים הידועים. חוסר הגמישות גרם לחוסר כדאיות כלכלית של כליי תרגום מבוססי חוקים ולכן הפסיקו כמעט לחלוטין להשתמש בהם.
מנוע תרגום סטטיסטי – גמישות לצורך מהירות תרגום גבוהה
לאור חוסר הכדאיות של כלי תרגום מבוססי חוקים, בשנות התשעים לאור השיפורים ביכולת של המחשבים והמצאת האינטרנט, הבשילה התפתחות החדשה בתעשיית התרגום. מנועי תרגום סטטיסטיים.
איך עובד מנוע תרגום סטטיסטי?
על בסיס כמות גדולה מאד של דוגמאות ממגוון תחומים. במנוע תרגום סטטיסטי, יש אלפי זוגות של מילים בשפות שונות ומילים מקבילות בשפות אחרות.
הרעיון מאחורי כלי זה הוא שאם טקסט בשפה עשירה שהצטברו בה דוגמאות רבות עובר דרך הכלי והתכנים שלו דומים לדוגמאות במאגר הסטטיסטי הוא יתורגם במהירות ובאיכות גבוהה.
היתרונות שלו הם: מהירות תרגום גבוהה, תוצאות טובות אם אכן הטקסט קרוב לאוסף הדוגמאות הגדול שנכלל במנוע התרגום הסטטיסטי ובעיקר גמישות נרחבת שמאפשרת להכניס בו בקלות שינויים מועילים ולפתח אותו בהתאם להתפתחות השפה.
מנוע תרגום סטטיסטי מתבסס על התוצאות שהכי סביר שמשתמשים יבחרו בהן כמקבילות למילה. הכלי נחשב למאד לא אמין ועלול להפיק תרגומים מאיכות נמוכה. כלומר אוסף של מילים מתורגמות מילולית בהתאם לתרגומים נפוצים, ללא קונטקסט ואם תחביר ודיקדוק רופפים ביותר.
מדוע האיכות של מנוע תרגום סטטיסטי עלולה להיות נמוכה כל כך?
בגלל שבמנוע תרגום סטטיסטי יש יחסית מעט מאד חוקים לשוניים. לרוב החקיקה בו פשוטה ומאפשרת מיון של כמויות המילים הגדולות שלו לפי קטגוריות מסויימות ,בדרך כלל לפי נושא.
התוצאה היא שטקסטים מסויימים שקרובים לחומר שנמצא במאגר הסטטיסטי אכן יתורגמו מהר ויהיו באיכות מובנת ואף טובה, בעוד שאחרים שהחומרים שלהם בנושאים יותר נישתיים ובשפות שאין בהן מאגר מאסיבי יצאו כמעט לא מובנים.
גוגל טרנסלייט הוא דוגמא למנוע תרגום סטטיסטי שיצא לו שם ידוע לשמצה מבחינת איכות העבודה. לכן, תעשיית התרגום בעשור האחרון השתדלה לעבור ממנועי תרגום סטטיסטיים לכלים "חכמים יותר", מנועי תרגום נוירו-טבעיים המבוססים על למידת מכונה.
מנועי תרגום נוירו טבעיים – הדרך שבה תרגום מכונה הפך למילה נרדפת לאיכות
הצורך לתרגם כמויות גדלות והולכות של חומר לשפות שונות בזמן אמת. צורך שהלך וגבר ככל שהגלובליזציה התחזקה עורר את תעשיית התרגום משנות ה-2000 למהפכה טכנולוגית חדשה. תעשיות רבות ברחבי העולם, חיכו למנועי תרגום שגם מתרגמים טקסטים במהירות ובזול וגם מספקים איכות גבוהה יחסית ואף הולכים ומשתפרים.
התשובה הופיעה בדמותם של מנועי תרגום נוירו-טבעיים. כלומר כלי תרגום שמשלבים מאגרי דוגמאות, חוקים לשוניים ולמידת מכונה. הכלים הללו מתרגמים מהר, בגמישות יחסית ובאיכות גבוהה יחסית.
מנועי תרגום נוירו – טבעיים מורכבים מרשת של גרעינים שמחכה את רשת הניורונים של המוח. הם מערכת לומדת שמנסה ללמוד שפה, קונטקסט, גמישות לשונית וחוקי לשון משתנים בצורה שבה המוח האנושי לומד טקסט. תהליך הלימוד של המכונה שמאפשרת הפקת תרגומים יותר איכותיים במהירות גבוהה ובמחיר נמוך יותר נקרא machine learning.
למה machine learning דומה?
לעובד משכיל ומנוסה שהולך ומשתפר עם כל עבודה שהוא מקבל. האלגוריתמים של תרגום מכונה נוירו- טבעי משתפרים עם כל עבודה משום שהם מכניסים את החומר למאגרים שלהם ואת העריכות הקודמות שלו לחוקים שטבועים בהם.
המערכות הללו עדיין מתפתחות ככל שעובר הזמן, הן עדיין אינן מושלמות, אבל הן משפרות משמעותית גם את קצב ההכנה של תרגומים מקצועיים בתעשיות רבות וגם את האיכות של תוצרי התרגום באמצעות יצירת הקשרים מתוחכמים בין מילים בשפות שונות וסריקה של כלל הטקסט.
מערכות שכאלה, מהוות בסיס לחלק ניכר מהחומרים הכתובים שאנחנו כצרכנים קוראים היום, מבלי לדעת שאנחנו קוראים תוצרים של מכונה.
למרות החשש של עסקים מתרגומי מכונה, לאור ניסיון העבר, תרגומי מכונה נוירו טבעיים הם הכיוון ההיסטורי אליו תעשיית התרגום הולכת. הם הדרך הטובה ביותר לסיפוק איכות גבוהה בזמן סביר.
במשך שנים תרגום מכונה נוירו-טבעי נחשב לקופסא שחורה. כלומר הכנסת חומר בשפה אחת וקיבלת חומר בשפה אחרת בלי לדעת ממש איך האלגוריתם יגיב ולכן איזו איכות תרגום תקבל. אך העניין הזה מתחיל להשתנות.
איך מחליטים מתי תוצרי תרגום מכונה טובים מספיק כדי להתבסס עליהם?
כדי להחליט במהירות האם וכמה להתבסס על תרגומי מכונה שמופקים בכלים כאלה פותחה שיטת דירוג טכנולוגית שנקראת Machine Translation Quality Estimation או בקיצור MTQE.
ההמצאה הזאת, בעזרת אינטליגנציה מלאכותית (AI) חושפת שגיאות בולטות בכל תרגום מכונה שמופק על ידי כלי תרגום נוירו- טבעי שמכיל אותה. בהתאם לכמות השגיאות הבולטות שנחשפות מבחינה ניסוחית ודיקדוקית המערכת נותנת ציון לטקסט שהופק מתרגום המכונה.
ככל שהציון גבוה יותר ניתן להסתמך יותר על תרגום המכונה ולהעביר אותו בדיקה אנושית פחות קפדנית. כלומר יהיה צורך בפחות תיקונים ויהיה ניתן להגיש את התרגום יותר מהר בפחות משאבים אך באותה איכות גבוהה.
למעשה, בעזרת MTQE ניתן להגיע להחלטה מהירה מאד האם להסתמך על תוצרי תרגום מכונה. תוך חמש שניות, ניתן להחליט האם לגנוז תוצר של תרגום מכונה, להשתמש בו מלווה בעריכה רבה, או להיעזר בו ולבצע עליו רק לוקליזציה קלה והגהה פשוטה. כך ניתן לפקח על התוצרים של תרגום מכונה, לחסוך משאבים וזמן ולשפר את איכות התרגום.
קראו עוד: כיצד שימוש בתרגום מכונה משפר את התפוקה?
סודות ה-PEMT, איך תרגום מכונה ותרגום אנושי משלימים אחד את השני?
לאחר תרגום מכונה איכותי ככל שיהיה, בדרך כלל יהיה שלב נוסף של PEMT לפני לוקליזציה ועריכה סופית. מה זה PEMT? PEMT או Post-Editing Machine Translation זו עריכה של עורך אנושי על התוצרים שהתקבלו בתרגום מכונה.
עריכה זו נובעת מכך שלמרות ההתקדמויות הטכנולוגיות הגדולות בתחום תרגום המכונה ושיפור איכותו – אין תחליף לעין אנושית כשלב סופי ומשלים של עבודות תרגום מכונה.
זאת אחת הסיבות שחברת טומדס מעניקה שירותי PEMT. היא מתאימה את עצמה לזמנים שבהם שימוש באמצעי תרגום מכונה חיוני כדי לתרגם כמויות גדולות של חומר בזמן סביר ובאיכות טובה יחסית. אך טומדס לא מוותרת על השלמות האיכותית שהעין האנושית מספקת לאחר שהמכונה הפיקה את התוצר המקסימלי שלה.
זהו הטוב בשני העולמות. טבעי עדיין לחשוש מאיכות נמוכה של תרגומי מכונה אך חשוב לזכור שגם תרגום אנושי, פגיע לטעויות אנוש, שעלולות לעלות בזמן רב ובכסף. הטכנולוגיה והעין האנושית יכולים לגבות ולהשלים אחד את השני.
לכן שילוב של תרגום אנושי בשלב הסופי עם היכולת הטכנולוגית של תרגום מכונה, אכן מבטיח מהירות תרגום יעילה ואיכות תרגום גבוהה במחיר סביר והמעסיק יכול לסמוך בראש שקט על חברת התרגום שתעשה את השילוב.
איך טומדס יכולה לעזור?
טומדס מתגאה בכך שתמיד תהיה חברת תרגום אנושית המבוססת על עשייתם של מתרגמים מומחים בכל שפה ותעשייה. אך בשירותי ה- PEMT שטומדס מספקת היא מתאימה את עצמה לדרישות העתידיות של השוק.
כלומר הפקה מהירה של כמויות חומר מתורגם גדולות באיכות טובה באמצעות שילוב בין אמצעי תרגום מכונה מהמתקדמים והאיכותיים בשוק ובקרה של עין אנושית מקצועית שמלווה אותם.
גילי קימור
מאמרים נוספים שעשויים לעניין אותך
תגובות