- עמוד הבית
-
אודותינו
-
שפות
-
שירותים
-
תרגום משפטי
- לקוחות
-
יצירת קשר
IL: +972 72 2200700
- כניסה לאתר
צור אתנו קשר
הכנס את הפרטים שלך ונחזור אליך בעוד מספר דקות
מתי תתרחש מהפכת הבינה המלאכותית בשפה העברית ואיך היא תשפיע על כולנו?
זמן קריאה : 13 דק'
מהפכת הבינה המלאכותית משנה את ההיסטוריה יום יום. בבינה מלאכותית המחשב שבמידה רבה מחקה פעולות של מוח אנושי מסוגל לפתור מספר רב של בעיות בצורה הרבה יותר מהירה וזולה מבן אדם באמצעות יכולות החישוב המתוחכמות שלו.
בעולם בינה מלאכותית מתבטאת בדרכים מגוונות משאלה לסמארטפון שלכם מה מזג האוויר בחוץ, דרך ניהול שיחת קניות מורכבת עם צ'ט בוט באפליקציית קניות ועד ניתוח מהיר של כמויות גדולות של מידע.
ניתוח אנליטי בעזרת בינה מלאכותית יכול לשמש לצורך מחקרי שוק לשיווק באינטרנט, מיון מידע רפואי, תפעול מואץ של מערכות שירותים לאזרח 24/7 ואפילו יכול לשמש לצורכי מודיעין.
כל היישומים הללו נמנעו במשך זמן רב מהמשתמש העברי והדרך אליהם עדיין ארוכה. אך פטור בלי כלום אי אפשר. בכל זאת בעזרת עקשנות רבה והתפתחויות בתחום למידת השפה הטבעית פיתרון שיביא את מהפכת הבינה המלאכותית גם לשפת אבותינו כבר נראה לעין.
הפיתרון צפוי לעשות מהפכה של ממש בשירות הציבורי, במגזר העסקי ובאיכות החיים של כל אזרח בישראל, גם בתוך ארבעת קירות ביתו. כחברת תרגום אנחנו עוקבים בדריכות אחרי המגמות הטכנולוגיות.
מה הם האתגרים שמקשים על שימוש במערכות בינה מלאכותית בשפה העברית?
ישראל היא אחת המובילות בעולם בייצוא מוצרי בינה מלאכותית והיי טק בכלל לחו"ל והיא שניה בתחום לארה"ב בלבד. לכאורה, העובדה שישראל בעשר שנים האחרונות נשארה מאחור בהחדרת מוצרי בינה מלאכותית לשיפור השירותים לאזרחיה ולקוחותיה דוברי העברית היא אוקסימורון.
איך יתכן שהסנדלר הישראלי החכם שיצר שירותים ממשלתיים בענן לעיתים עם זיהוי קולי לאנשים מכל הגלובוס הולך יחף?
המכשול הראשון ליישומים בקנה מידה רחב של בינה מלאכותית בעברית הוא היעדר תמריץ. מרבית מערכות הבינה המלאכותית מטבע הדברים כמובן מותאמות לשפה האנגלית, המהווה שפה בינלאומית.
לחלופין הן מותאמות לשפות אחרות מרובות דוברים שכוח השוק שלהן עולה אלף מונים על ישראל הקטנה.
בנוסף לכך מגזרי ההייטק בישראל העובדים בעיקר מול לקוחות בחו"ל עובדים במידה רבה בעיקר באנגלית. כלומר התמריץ הכלכלי לפתח מערכות בינה מלאכותית בעברית הוא קטן ומהווה לפי ועדה ממשלתית כשל שוק בארץ.
יחד עם זאת, ישנם קשיים מובנים בשפה העברית ההופכים כל מודל שפה שיאפשר הפעלת בינה מלאכותית בשפה עברית לאתגר גדול.
לפי חברת אופסייט המתמחה בבינה מלאכותית, האתגרים העיקריים בהטמעת השפה העברית בבינה מלאכותית הם:
האותיות – אין שפות נוספות המשתמשות באלף-בית העברי השונה לחלוטין מכל שפה אחרת, בפרט מהשפות האירופיות שלרוב מתבססים עליהן כשיוצרים מודל לשוני לבינה מלאכותית. כאשר השפה היא ייחודית תהליך למידת המכונה מורכב ואיטי.
הכיוון – כיוון הכתיבה בעברית מימין לשמאל הפוך לכיוון של מרבית השפות האחרות. היפוך הכיוון מבלבל את מרבית המודלים הממוחשבים ללימוד שפה.
הטיית שמות העצם – הטיית שמות העצם בעברית יוצרת מילה 'חדשה' עם משמעות חדשה, זה מקשה מאד על הלימוד הממוחשב. לדוגמה, בעוד שבאנגלית המילה שומרת על המקור שלה ורק המילה הנלווית משתנהMy cat, Your cat), )בעברית המילה חווה שינוי: חתולי, חתולו, חתולנו וכיו”ב.
זמני הפעלים – בעיה דומה אנו רואים בפעלים. בעוד שבאנגלית השינוי לרוב הוא במילה הנלווית בלבד או בסיומת, Will walk, walked) ) בעברית יש שינוי במילים עצמן: הלכתי, הלכה, הולך. בשורשים מסוימים המצב אף מורכב יותר, שכן יש שיכול אותיות (כמו במילים הסתכל, הצטער).
בשורשים שונים הטיות מסויימות גם משנות לחלוטין את המשמעות של המילה. הרבה פעמים מבחינים בשינוי רק לפי ההקשר לדוגמא: "היא הלכה בשדות" לעומת "הלכה כפי רבי טרפון".
הניקוד והמשמעות – יש לא מעט מילים שהניקוד משפיע על המשמעות שלהן – כגון חלה (של שבת) וחלה (בשפעת), או סמל (בצבא) וסמל (ומופת). דוברי השפה מביאים את ניסיונם ומתבססים על ההקשר כדי להבין – אבל מחשב, מתוחכם ככל שיהיה, ימצא את עצמו בבעיה של ממש.
מיעוט הטקסטים בעברית – בגלל שאוכלוסיית דוברי העברית קטנה ובגלל שמרבית הטקסטים שנכתבו בשפה העברית מוגנים מאחורי חומות כבדות של זכויות יוצרים ושימוש מסחרי. ישנם מעט טקסטים יחסית שניתן לאמן בהם את מערכות ה-AI.
מערכות ה- AI הן מערכות לומדות שזקוקות לתקדימים רבים ממגוון של תחומים ואמצעי תקשורת. זאת כדי לבצע תרגום מדויק ויישום אפקטיבי בשפה חדשה.
מהו המענה שעתיד להביא את הבינה המלאכותית לשפה העברית?
ישנם שלושה סוגי מענה הצפויים להבשיל במהלך 5-7 השנים הקרובות. אם הבשלתם יגיעו מדינת ישראל ותושביה דוברי העברית לעידן טכנולוגי חדש. התחרותיות של המשק הישראלי תישמר וצפוי שיפור משמעותי של השירות לאזרח והפעילות העסקית בישראל.
הפתרונות לקידום בינה מלאכותי בעברית בישראל הם:
מציאת תקציבים מתאימים – הזרמת כסף רב כדי לפתור את כשל השוק שהופך את החלת השפה העברית בבינה מלאכותית להשקעה כלכלית שמרתיעה חברות רבות. פיתרון זה כבר מתחיל להבשיל.
כבר אושרה תוכנית לאומית ל-AI בשווי 5 מיליארד שקל במסגרתה בהתאם להמלצות ועידת ועידת ברי ימומנו ב- 180 מיליון שקלים מודלים ללימוד שפה טבעית. אלו ישמשו לצורך תרגום מערכות בינה מלאכותית בעברית.
זהו רק תקציב ראשוני. המודלים ללימוד שפה טבעית שיהפכו את מערכות הבינה המלאכותית לנגישות בעברית צפויות לקבל סבסוד כולל של לפחות מיליארד שקלים מועדת התקציבים במשרד האוצר, רשות החדשות, מפא"ת (לצורכי ביטחון) וארגונים אחרים.
אימון מערכות ה – AI בכמויות גדולות של חומר בעברית – חברות גדולות כמו אמזון, מטא, גוגל, רפאל, הראל ואחרות כבר התחילו תוך תמיכה ממשלתית מסוימת באיסוף כמויות גדולות של טקסטים בעברית על מנת לאמן את מערכות הבינה המלאכותית.
השאיפה היא להגיע ל20 מיליארד מילים בעברית קשורות כל התעשיות והמדיות האפשריות (המודל אמור להיות דו לשוני לתפוס גם לעברית וגם לערבית). השאיפה היא לדיוק של 95% שיושג על ידי העשרת האלגוריתמים במידע.
לפי כתבה בYNET כבר כעת הדיוק משתנה מתחום לתחום אך מראה סימנים טובים. המודלים מדוייקים ברמה של 90% בתרגום לעברית של ידיעה עיתונאית מסודרת. הדיוק שלהם יורד לרמה של 70 או 80 אחוזים כאשר עוברים לטוויטר.
כל מודל לשוני יחווה ירידה ברמת הדיוק כאשר הוא עובר משפה לשפה, ממדיה אחת לאחרת או חוקר תחום חדש. תפקידם של מומחי התחום הוא להציף את המודל בדוגמאות מעשירות שישפרו את הדיוק לרמות הגבוהות ביותר.
שימוש אפקטיבי בתעשיות השונות דורש דיוק של 95% על מנת לשמר את האיכות הגבוהה לצד ניצול מירבי של מהירות עיבוד המידע ופיתרון הבעיות ויתרון הוזלת העלויות שהם פועל יוצא של הפעלת בינה מלאכותית מותאמת שפה.
שימוש במערכות למידה עמוקה לצורך שיפור מתמיד ביכולות ה-AI
אלגוריתמים ללימוד עיבוד שפה טבעית הקרוי גם NLP מצליחים להשתכלל וללמוד הקשר ברמה כמעט דומה למוח האנושי. זאת על ידי ניסיון לחקות את אופן הפעולה של המוח האנושי. המערכות הללו בנויות על רשתות של גרעיני מידע הנקראים נוירונים (בדומה לתאי העצב במוח) שמדברים זה עם זה.
היכולת לעבד כמויות גדולות מאד של מידע, להפיק לקחים ולהשתפר כתוצאה מכל תקדים שמועבר למערכת ה-AI וחקיקתה הפנימית, היא תוצאה של רשתות הנוירונים האלה.
במקביל למערכות היעילות הללו שכבר מתחילות לשאת פרי במירוץ לבינה המלאכותית בישראל, בחברת מטא עובדים על שיטה אלטרנטיבית לתרגום שפה בעזרת אודיו.
השאיפה היא ליצור Universal Speech Translator, כלומר מתרגם אוניברסלי מבוסס אודיו הממיר אודיו לטקסט שיכול לתרגם כל שפה לכל שפה. מטא עושים זאת במסגרת פרויקט "שום שפה לא נשארת מאחור"
כיצד תשפיע בינה מלאכותית בעברית על החיים שלנו?
הנה מקצת מהיישומים שבינה מלאכותית יכולה להציע במטרה לשפר את חיי היומיום של כל אזרח במדינת ישראל, להאיץ את כלכלה, לשמור על יתרונה התחרותי ולהקל על התקשורת בין האזרח לממשל. היישומים הם:
תמיכה בתלמידים בעזרת בינה מלאכותית: שני פיתוחים מהפכניים של חברת מייקרוסופט כבר מונגשים בעברית. הם יסייעו למורה בכיתה ללמד ולתלמידים שבכיתה ללמוד.
Azure Video Analyzer for Media הוא כלי שמסייע לניתוח סרטונים. בעזרתו אפשר לתמלל את האודיו ולזהות את הדוברים ונושאי השיחה. יתכן שהכלי יכול לשמש היטב ללמידה מרחוק ובוודאי ללימוד המתבסס על משאבים ממוחשבים.
כלי נוסף של בינה מלאכותית שעובר בימים אלו התאמה לעברית ושעוזר מאד בכיתה בשיפור מיומנויות הקריאה והשפה של תלמידים הוא הכלי Teams for Education.
כלי בינה מלאכותית זה חוסך זמן למורה שבמקום להקשיב לבדו ל-38 תלמידים מקריאים יכול לקבל ניתוח מהבינה המלאכותית של כל מיומנויות השפה של התלמידים.
הבינה המלאכותית יכולה לאתר איפה הם הצליחו ואיפה נכשלו ולהסביר להם מילים לצורך שיפור.
שיפור חוויית משתמש בעזרת בינה מלאכותית: ההשלכות של יישום בינה מלאכותית בעברית על השירותים הממשלתיים שלנו באינטרנט ועל פעילותן של חברות מסחריות צפויות להיות שיפור בחוויית המשתמש.
כדי לתת למשתמש באופן מדויק מה שהוא רוצה או מה שהוא חושב שהוא רוצה בונים צבא של צ'אט בוטים מתוחכמים, עוזרים דיגיטליים וסוכנים חכמים.
הענפים שירוויחו מכך הכי הרבה והפיתוח של בינה מלאכותית צפוי להיות בהם המהיר ביותר הם: הבנקאות והקניות באינטרנט. רשתות כמו אמזון כבר מטמיעות בינה מלאכותית שמגבירה מכירות. והתופעה צפויה רק להעמיק.
בנקים בעיקר משתמשים בבינה מלאכותית כדי לתת שירותים מחוץ לסניפים בזמינות 24/7. הם גם אוספים מידע רב על הלקוחות שלהם (הסוף לפרטיות?) ומשתמשים בבינה מלאכותית למניעת הונאה.
השבחת עובדים – מערכות בינה מלאכותית מותאמות לשפת השוק המקומי. עברית במקרה שלנו יכולות לעזור לגיוס עובדים יעיל ולהכשרתם וניהולם. משלב העיון בקורות החיים של העבודים עד כלי הכשרה והגברת הפרודוקטיביות של העובדים וסיפוקם מהעבודה.
זאת על ידי עשיית אוטומציה למשימות פשוטות. כלי בינה מלאכותית גם יסייעו לעקוב ולפקח אחרי עובדים.
סביב התחום הזה כבר עולות שאלות אתיות... למשל איך יהיה ניתן לשמור על פרטיותם של העובדים? יתרה מזאת, מירוץ האוטומציה עלול לייתר הרבה משרות פשוטות ולאלץ את העובדים לשפר משמעותית את כישוריהם, כדי להיות עדיין עובדים מבוקשים. במירוץ ההישרדות הזה הרבה מועמדים לעבודה עלולים להישאר מאחור.
התעשיות הרפואיות – כלי בינה מלאכותית מסוג DEEP LEARNING מסוגלים לעבד כמויות עצומות של מידע. עיבוד המידע הנחרב הזה עזר להפקת חיסונים מול מגפת הקורונה ולפיתוח תרופות שונות למחלות לב. ניתוח כמויות מידע עצומות בזמן קצר יכול להציל חיים על ידי עידוד קידמה מדעית וזירוז הפקת תובנות מניסויים קליניים.
זיהוי שפה והפקת טקסטים – יכולת התקשורת המילולית של הבינה המלאכותית הגיעה לשיאים חדשים בשנה האחרונה. כלי NLP ללמידה של שפה טבעית לא רק מבינים טקסטים טוב יותר ממרבית האנשים. כלי הבינה המלאכותית כבר מאפשרים כתיבת טקסטים.
באוגוסט האחרון עלה לכותרות סטודנט אמריקאי בשם ליאם פור, שהשתמש ב- GPT-3 כדי ליצור בלוג שלם, כתוב כולו בידי מחשב. הבלוג היה כה מעניין, שרבים ביקשו להצטרף אליו כמנויים.
כלומר בני אדם לא זיהו שרובוט כתב את התוכן. לחלופין ייתכן שהתוכן כל כך מצא חן בעיניהם שלא היה להם איכפת שהכותב הוא רובוט.
בינה מלאכותית שמייצרת טקסטים? האפשרויות הן אינסופיות. כבר היום יש מערכות שמסכמות באופן אוטומטי טקסטים ארוכים. עולם העסקים ישתמש ביכולות האלה לייצר תקצירים, סיכומי מידע על לקוחות, תסריטי שיחות מכירה ותרגומים אוטומטיים מדוייקים.
בישראל, חברת התרגום טומדס כבר חזתה את המגמה העולמית ופיתחה שירותי תרגום מכונה מלווים בעריכה אנושית. זאת כדי לענות לביקושים עתידיים שהולכים ומתפתחים בתעשיית התרגום בעקבות ההתפתחות הטכנולוגית.
אנחנו כבר נמצאים בשלב שבו לא ניתן להבחין אם הטקסט שאנחנו קוראים הוא אותנטי או סינתטי. בשילוב יכולת הבנת הטקסטים של הבינה המלאכותית אנחנו קרובים ליום שלא נדע אם אנחנו מקבלים שירות מאדם או ממכונה.
מחשבות לסיום
לסיכום, מהפכת הבינה המלאכותית צפויה להגיע לישראל במלואה בעשר שנים הקרובות. היא תשנה את החיים שלנו בהיבטים רבים. חייבים לציין, הכול בזכות נחישותם של הייטקיסטים ישראלים וזרים שלא ויתרו על השוק הישראלי.
גילי קימור
מאמרים נוספים שעשויים לעניין אותך
תגובות