- עמוד הבית
-
אודותינו
-
שפות
-
שירותים
-
תרגום משפטי
- לקוחות
-
יצירת קשר
IL: +972 72 2200700
- כניסה לאתר
צור אתנו קשר
הכנס את הפרטים שלך ונחזור אליך בעוד מספר דקות
איך חידושים באינטליגנציה מלאכותית יוצרים תרגום איכותי יותר?
זמן קריאה : 15 דק'
כמו שכל מומחה או לקוח שאי פעם הכיר את תעשיית התרגום מקרוב יודע: שפה היא יצור חי. תוך שנים בודדות עלולים להופיע ביטויים, ניבים, קיצורים ומילים חדשות שיגרמו לבני האדם לתקשר בצורה אחרת מבעבר. יתרה מזאת מילים שהיו בעבר במשמעות אחת עלולות במשך הזמן לקבל משמעות אחרת ולעיתים הפוכה. הסלנג של היום יכול להיות הפירוש המילוני למילה בעתיד.
המונח המקצועי שהשתמשנו בו בעבר ומרבית הלקוחות של תעשיה מסוימת חיפשו, יכול להתחלף תוך שישה חודשים. אנחנו עלולים להישאר מבולבלים ותמהים, רכבת הלשון המשיכה בדרכה והשאירה אותנו מאחור.
אז מה אפשר לעשות?
במקום להביט בהשתאות אנו חייבים לעדכן את השפה שלנו ולהתאימה לזמנים. את ההתאמה הלשונית שאנחנו עושים כל הזמן באופן טבעי עלינו ללמד את מנועי תרגום המכונה לעשות.
לפי נימזי, שיפורים באינטליגנציה המלאכותית (AI) ולמידת מכונה (Machine Learning)עוזרים לנו בכך.
המגבלות של תרגום מכונה,מדוע בכל זאת משתמשים בו?
השתמשתם פעם בגוגל טרנסלייט במהלך העשור האחרון?
אם כן, אתם בוודאי יודעים את המגבלות של תרגום מכונה. את הקושי של מנועי תרגום מכונה להבין הקשר של מילים. לפצח את משמעותן של מילים דו משמעיות. להבין סלנג. להתעדכן באופן קבוע תוך התאמה לטרנדים הלשוניים שהשפה עוברת.
יצירת מערכת תרגום מכונה היא לא "זבנג וגמרנו" מדובר במחוייבות בלתי פוסקת לעדכון מתמיד ואימון מתמשך של מנוע תרגום המכונה. רק כך ניתן לשמור על תרגום ולוקליזציה ראויים למסמכים שמתאימים ללשון בה משתמשים לקוחות פוטנציאליים. משום כך ניתן לתהות למה להשתמש בתרגום מכונה מלכתחילה?
אם תרגום מכונה כל כך מסובך ודורש זהירות מדוע משתמשים בו?
משתמשים בתרגום מכונה מסיבה פשוטה מאד. שיח מומחים בינלאומי בתעשיות שונות תלוי בתרגום ולוקליזציה מהירים ואיכותיים. לכן, למרות שלא יהיה תחליף מוחלט לגורם האנושי, חברות מוצאות את עצמן נעזרות יותר ויותר בתרגום מכונה, שהשתכלל באמצעות אינטליגנציה מלאכותית. בעזרתו מתאפשרת עבודה מהירה יותר, המתאימה לקצב המהיר של הגלובליזציה. מובן שתחת פיקוח אנושי איכות התרגום איננה נפגעת.
הפיקוח האנושי מתקיים בדרך כלל בשלב העריכה אחרי תרגום מכונה. השימוש באינטליגנציה מלאכותית חוזה חלק מהשגיאות משפר את האיכות וחוסך למתרגמים ולעורכים זמן יקר וכאב ראש רב למרות שתמיד יזדקקו להם.
קרא עוד: מה עדיף, בינה מלאכותית או מתרגם בשר ודם?
מהם האתגרים העיקריים שחברה הפורצת לשוק הגלובלי מתמודדת איתם?
במפתיע, לטענת המומחית התר שומייקר, האתגרים המשמעותיים בתרגום ובלוקליזציה, שחברה מתמודדת איתם כאשר היא מתחילה להפוך לגלובלית הם לא תרגום ממשק המשתמש, או תרגום התוכן השיווקי, או אפילו תרגום הקודים שמאפשרים למצוא את האתר בגוגל. האתגר האמיתי הוא תחזוק מערך של תמיכה למשתמשים מכל העולם בשפות רבות. מטלה מתמשכת שאין לה דד ליין אלא היא תהליך שוטף הדורש משאבים רבים.
חברות רבות עומדות בפני דילמה: האם לשכור מערך של מתרגמים מומחים בכל השפות הנדרשות שגם ייצרו תכנים שיווקיים בשפות שונות וגם יספקו תמיכה טכנית למשתמשים או כל תמיכה אחרת? או לחלופין להיעזר בכלים טכנולוגיים שיספקו תרגום בזמן אמת לתכנים השונים באתר וישחררו את המתרגמים האנושיים לתת למשתמשים את התמיכה הלשונית הנדרשת בכל שפה שכותבים אליה.
לשם כך מומחית שירותי השפה התר שומייקר, מנכ"לית חברת שירותי השפה הטכנולוגיים Language IO, פיתחה מערכת תרגום מכונה בזמן אמת, באמצעות אינטליגנציה מלאכותית. מערכת זו אמורה לשרת חברות גדולות קטנות ובינוניות ולספק להם באופן מהיר ואיכותי תרגום מקצועי לתכנים שלהם באמצעים ממוכנים.
מה מיוחד במערכת התרגום הטכנולוגית של התר שומייקר?
קודם כל, המערכת שמתבססת על סוגים שונים של למידת מכונה ומערך חדשני של אינטליגנציה מלאכותית מתמודדת בהצלחה עם כמויות גדולות מאד של מידע, שמציף את הרשת כל יום ודורש תרגום איכותי מיידי. המערכת מסוגלת להתאים את עצמה לז'רגון המדויק המקובל בתעשיה שהמותג משתמש בו, לשמות המוצרים של החברה, לתגיות ה-UI בעזרתן מזהים את המוצר.
מדוע חשוב שהמערכת תסייע לתרגם במדויק דווקא את המאפיינים הללו?
משום שללא תרגום מדויק של כל המרכיבים הללו הלקוח ונציג התמיכה של החברה שאמור לטפל בו לא יצליחו להבין אחד את השני. חוסר הבנה שכזה עלול לגרום לאובדן הכנסה משמעותי ואף להתרחקות של לקוחות.
בשיתוף פעולה עם מומחה בשם אנדי סלית'רין מחברת XTM, אחד החידושים שפותחו במערכת התרגום הטכנולוגית של התר שומייקר הוא פורץ דרך. מדובר באפשרות ללימוד מפוקח של המכונה באופן לשוני קוגניטיבי. כלומר באופן דומה במעט לצורה שבה המוח האנושי שלנו לומד שפה. לימוד זה נעשה תוך כדי התערבות אנושית בתוך התהליך היכן שצריך כדי לשפרו ולכוונו לכיוון הנכון.
המערכת עצמה מציעה פתרונות שונים לסוגיות לשוניות שונות ואף מורכבות שדורשות ממנה "חשיבה". המערכת צריכה לבצע זיהוי הקשרים בתוך הטקסט, בדיקה של מילים נרדפות רבות ועוד. המערכת מבססת את האלטרנטיבות שהיא מציעה על ניסיון העבר ועל מונחים מועדפים על ידי הלקוח, אך היא עושה מעבר לכך.
השאיפה היא לבנות באמצעותה מודל למידה כולל לשפות נפוצות באינטרנט כמו אנגלית. באמצעותו המכונה תעבד במהירות את כמויות החומר האדירות בשפה זו. מהכמויות העצומות של חומר מעובד היא תפתח תרגום איכותי לתכנים מגוונים שיוכל להשתנות עם השפה. מובן שמודל למידה לשוני אינטראקטיבי כזה עדיין נמצא בחיתוליו, אך הפוטנציאל העסקי שלו משמעותי ביותר.
מערכת זו אמורה לעזור בתהליכי לוקליזציה מתמשכים של תוכן ולקיימם באופן הרמוני ומתואם.
איך מערכת התרגום באמצעות אינטליגנציה מלאכותית מתמודדת עם תוכן שגולשים יוצרים?
עד עכשיו, תעשיית התרגום נהגה להתמודד אם האתגר של תרגום תוכן גולשים, באמצעות אימון מנוע תרגום מכונה נוירומכני מותאם לכל לקוח ספציפי בשפה הנדרשת לו. תהליך דומה ליצירת חיסון ספציפי לוירוס ופיתוח נוגדנים ייעודיים עבורו. זהו תהליך איטי מאד שעולה כסף רב ועלול להיות לא משתלם כשבוחנים עלות מול תועלת.
באמצעות מנוע תרגום מכונה המתבסס על אינטיליגנציה מלאכותית ניתן לבצע תהליך יעיל יותר של תרגום לתכנים הללו. בשלב הראשון בוחרים מנוע תרגום מכונה כללי. מנוע זה חייב להיות הטוב והמתאים ביותר לתעשיה ולצמד השפות שבו מתרגמים. כלומר הוא איננו מותאם ספציפית ללקוח אבל בהחלט מתאים באופן מיטבי לשפה ולתעשיה הרלוונטית.
בשלב הבא, באמצעות טכנולוגיה מיוחדת המבוססת על מילוני מונחים משתלים בתרגום את הנוסחים המועדפים על הלקוח. למשל, בשמות של חברות, שמות של מוצרים, מושגים מותאמים לתעשיה, תגיות UI וכו'.
אחד החידושים במערכת הוא מילון המונחים שמשפר את עצמו. מערך זה מאתר באופן פעיל מונחים שונים בתוכן שדורשים תרגום מיוחד ושאי אפשר להסתפק בתרגום כללי כדי לתרגמם נכון.
המערך המילוני המשוכלל הזה מזהה תוכן חריג בצ'אטים ובמיילים שדורש תרגום מיוחד.
מערך זה בנוי על סוג של זיכרון תרגומי מעבודות קודמות ומשוב קודם על איכות התרגום. כלומר הוא מאתר מונחים לשונים מסויימים שהייתה בנוגע לתרגום שלהם כמות גדולה של משוב שלילי. המונחים הללו מסומנים וניתנת עבורם התראה שמדובר במונחים מיוחדים והצעה לתרגמם באופן שונה מהצפוי.
זו בעצם דרך לתקן טעויות בתוכן שאמורות להתאים לחברות בתעשיה ספיציפית באופן פרואקטיבי לפני שהלקוחות בכלל מרגישים שמשהו לא כשורה בתוכן ומתלוננים. כלומר האינטליגנציה המלאכותית מאפשרת תהליך בקרה המשפר את איכות התוכן ללקוח באופן מיידי.
האם מערכת האינטליגנציה המלאכותית יכולה לחזות מגמות עתידיות בשפה ולהתאים אליהן?
חיזוי מגמות חדשות בשפה הוא עדיין דרך ארוכה בשביל תרגום מכונה גם תוך שימוש באינטליגנציה מלאכותית. אבל בזכות אותן מערכות שמנטרות משוב שלילי לגבי תרגום של מונחים מסויימים ניתן לזהות מונחים חשודים כמחוללי מהומות.
המונחים הללו שבדרך כלל מתורגמים לא נכון מעלים התראה למתרגמים האנושיים שמפקחים על המערכת ועושים במידת הצורך "עריכה לתרגום מכונה". זאת משום שהאינטליגנציה המלאכותית מאפשרת ללקוחות לדרג את איכות התרגום בכל מייל וצ'אט. לאחר הדירוג הזה היא עושה השוואה בין המקומות בתוכן שקיבלו משוב שלילי רב לבין ביטויים ספציפיים.
המתרגמים הללו כתוצאה מכך יכולים להבחין במהירות בסלנג חדש, או לאתר ביטוי שמשמעותו השתנתה בשפה מסויימת ולספק פיתרון מידי. כתוצאה מכך מנוע האינטליגנציה המלאכותית נותן לנו אמצעים לשפר אותו ובכך במידה רבה מתקן את הטעויות של עצמו.
חשוב לציין, הביטויים הללו הם הרבה פעמים קיצורים וראשי תיבות שהם חלק מההתפתחות הטבעית של השפה. הם חדשים ולא ניתן למצאו אותם בשום מילון.
האינטליגנציה המלאכותית מאפשרת לעקוב אחרי תקריות שבהן מופעים ביטויים כאלה ולתת להם מענה אנושי שמושתל מיד במונע התרגום.
זוהי למידת מכונה במיטבה, העונה לשינוי המהיר בשפות שונות בצורה לא פחות טובה מאדם הנדרש להתאים את עצמו לסלנג חדש.
מה החידוש העתידי שישנה את תחום תרגום המכונה?
מודל למידת מכונה לשוני אינטראקטיבי שמתבסס על ניתוח שפתי לכמויות אדירות של מידע. המודל הזה יהיה מסוגל לנתח מילים בהקשר המתאים שלהן, על ידי עיבוד כמויות עצומות של מידה בשפה מסויימת וניתוח הסבירות שמילה כלשהי תופיע אחרי מילה אחרת בהקשר ספציפי בפסקה.
מובן שמודל לשוני "חושב" שכזה עדיין נמצא בחיתוליו. אבל השימוש בניתוח לשוני בהחלט יכול להזניק קדימה את האיכות של תרגומי מכונה. באמצעות ניתוח לשוני ניתן לגרום למנוע תרגום מכונה לשאול שאלות לוגיות ובהתאם אליהן לתרגם את המונח כהלכה. למשל, "האם עגבניה היא פרי או ירק?" ועל סמך השאלה הזאת לתרגם את המילה בהקשר הרלוונטי.
מערך ניתוח לשוני יאפשר גם הפרדה מהירה ביותר בין מילה לבין הנגזרות שמתארות אותה. למשל, בין המילה "מהירות" לבין "במהירות" וכך לחסוך הרבה מאד שגיאות הקשר. הוא יוכל לזהות בקלות הפכים וצורות ריבוי למשל ולספק להם תרגום מדויק ואיכותי. לתרגום ממוכן שכזה יהיו פחות טעויות הנובעות מהעובדה ששום מחשב הוא לא בן אדם. הניתוח הלשוני יקדם את מנועי התרגום הללו שלב נוסף בדרך להבנת שפה אנושית במלואה.
המודלים הללו ישתמשו בטביעת האצבעות הייחודית שיש לכל שפה, בדקדוק ובמורפולוגיה שלה כדי להתאים את ההקשרים בין המילים. ניתן יהיה להתערב בתהליך הניתוח ולגלות כיצד המחשב מבין שפה ולהטות אותו להבנה יותר נכונה שלה. לדעת איזו מילה הולכת עם איזו מילה. מערך זה נקרא תרגום מכונה לינגוויסטי.
באמצעות מערכת אינטליגנציה מלאכותית שנקראת IAVS ניתן לגלות מושגים שונים ואת ההטיות שלהן ולהשיג בערך תשעים אחוזי הצלחה בעשיית תרגום מדויק למילים בהקשרן הנכון. ניתן בעזרתן גם לזהות ולהדגיש טעויות דקדוק ואף טעויות כתיב באופן אוטומטי. מערכות שכאלה צפויות להגיע לבשלות ניכרת בשנים הקרובות.
לדוגמא, בסוף שנת 2021 למשל צפויה להופיע מערכת שתחזה במידה מסויימת את הקונטקסט בתוכן. כלומר את המילים שיבואו אחרי המילה מסויימת במשפט. אלו עוד חידושים טכנולגיים קיימים בתעשיית התרגום? תוכלו לבדוק בקישור הבא.
קרא עוד: חידושים בתרגום דיבור דרך שילוב בין בינה מלאכותית ותוכנות זיהוי קולי
אילו חברות ירוויחו משימוש במערכות תרגום מכונה מבוססות על אינטליגנציה מלאכותית?
חברות קטנות, בינוניות וגדולות יכולות להרוויח מהפתרונות הללו. זאת משום שהפיתרונות הללו יכולות להוות תחליף חלקי או זמני לכוח האדם המיומן של החברה כשיש עומס רב וצורך במענה איכותי ללקוחות.
למשל חברה קטנה שמנסה להתבסס בסין יכולה להשתמש במערכת תרגום ממוכן מבוססת על אינטליגנציה מלאכותית כסוג של גיבוי לצוות שלה. למשל, בעת חגיגות ראש השנה הסיני כאשר חצי מהעובדים בצוותים של החברה נמצאים בחופש.
המעניין במערכות כאלה הוא שמאחר שמנתחים בהן מידע ולא רק מאכילים אותן במידע ככל שיותר חומר עובר דרכן כך איכות התרגום תעלה. משום כך המערכות הללו הן גם יתרון לחברות שעובדות לרוב מול לקוחות שאנגלית היא שפתם השניה ושולטים בשפה רק באופן חלקי.
לקריאה נוספת: שימושים באינטליגנציה מלאכותית לתרגום מקצועי
האם ניהול פרוייקטים מקבל מענה באמצעות למידת מכונה של אינטליגנציה מלאכותית?
למידת מכונה מקלה על זיהוי מהיר של חומרים שמתקבלים מיונם והפנייתם למתרגמים מומחים לתכנים הללו שיפקחו על המשך תהליך העבודה. כמו כן, מערכות המבוססות על למידת מכונה יכולות לסייע בארגון צוותי מתרגמים ולזהות למשל מתי מתרגמים פנויים לתרגם מסמך. זאת באמצעות דיווח שקוף. הן יכולות לעזור לחברות תרגום וגם לחברות עסקיות המשתמשות במתרגמים פרילנסרים לנהל את כוח האדם שלהן ולדעת את זמינותו לעבודה.
האם ישנן סוגיות אתיות כאשר מפעילים מערכת אינטליגנציה מלאכותית משוכללת כל כך?
ישנן שתי סוגיות אתיות משמעותיות כאשר משתמשים במערכת שכזאת הבנויה על השגת כמויות עצומות של מידע שמשתפים איתה ומסמנת מילים וביטויים מסוימים כחלק מתהליך התרגום. הסוגיות האתיות הן: שמירת זכויות יוצרים של הלקוחות העסקיים, שמירת הפרטיות ושמירה על חופש הביטוי ובמקביל גם על ביטחונם של נציגי תמיכת הלקוחות בכל העולם.
מדוע ישנו אתגר בסוגיית זכויות היוצרים?
בשל הצורך להסתמך על הרבה מאד מידע של הלקוחות כדי לייצר עבורם את התרגום שהכי מתאים להם. יתכן שחלק מהמידע יהיה מידע עסקי סודי שחברות לא מעוניינות לחלוק אחת עם השניה. לכן הוצג סייג למערכת. היא מסתמכת רק על מידע שנגיש לכולם ברשת. בכך נמנעת פגיעה בזכויות היוצרים וביטחון המידע של לקוחות שיעזרו באינטליגנציה מלאכותית כדי לשפר את שירותי התרגום.
ככלל לעולם לא יוצגו חומר פרטי או פרטים אישיים של הלקוח במערכות הללו.
מדוע ישנו אתגר מבחינת חופש הביטוי?
התמודדות מתמשכת עם כמויות עצומות של מידע במיוחד בנושא של תמיכת לקוחות מעמידה אותנו בפני סוגיה מעניינת. איך להתמודד עם נאצות ותוכן פוגעני שנציגי שירות לקוחות מקבלים פעמים רבות. במדינות שונות באירופה בהן השמירה על חופש הביטוי איננה ערך קדוש, כמו בארצות הברית וישראל (שגם בהן לא כל דיבור הוא מותר וחסין חוקית) ישנם חוקים שונים המגדירים "תוכן פוגעני או תוכן שנאה".
לאור זאת, מערכת התרגום החדשנית המשתמשת באינטליגנציה מלאכותית נדרשה ופיתחה חיישנים, פילטרים ואלגוריתמים מיוחדים שיזהו "תוכן שנאה" ויפטרו ממנו בהתאם לחוקים של המדינות הללו. הן במטרה לציית לחוקי תוכן השנאה (תוכן פוגעני והסתה) במדינות היעד והן כדי לשמור על ביטחונם ובריאותם הנפשית של נציגי התמיכה.
לדעתי הנושא הזה מאד שנוי במחלוקת משום שחופש הביטוי הוא עניין רגיש ביותר וההגדרות של "תוכן שנאה" הן מעורפלות. האם באמת כדאי לתת את השיפוט עליהן לאלגוריתמים של תוכנה?
מצד שני יתכן שהם יהיו יותר נטולי פניות משיקול דעת אנושי. תהיה דעתכם אשר תהיה בנושא הזה, כחלק מההתמודדות עם עומסי מידע גדולים דרך האינטרנט בעתיד, חברות תרגום ולוקליזציה יצטרכו להתמודד גם אם הסוגיה הזאת. הן ידרשו במידה זו או אחרת לעשות זאת גם באמצעים טכנולוגיים בשל כמויות החומר הגדולות שבני אדם לא יספיקו לתרגם בזמן אמת.
סיכום
תרגום ממוכן באמצעות אינטליגנציה מלאכותית הוא אתגר מרתק המעניק הזדמנויות רבות ללקוחות ברחבי העולם. טומדס בשנים האחרונות רכשה ידע וניסיון רבים בהפעלת תרגום מכונה באמצעים החדישים ביותר.
אנו עושים זאת בצורה זהירה ומחושבת כאשר איכות התרגום היא מעל הכול. אנו מספקים שירותי עריכה לאחר תרגום מכונה (MACHINE TRANSLATION POST EDITING) כדי להבטיח את איכות התרגומים שבאחריותנו. אם אתם מעוניינים בפרטים נוספים או זקוקים לשירותי תרגום מכונה פנו אלינו.
גילי קימור
מאמרים נוספים שעשויים לעניין אותך
תגובות