- עמוד הבית
-
אודותינו
-
שפות
-
שירותים
-
תרגום משפטי
- לקוחות
-
יצירת קשר
IL: +972 72 2200700
- כניסה לאתר
צור אתנו קשר
הכנס את הפרטים שלך ונחזור אליך בעוד מספר דקות
האם טכנולוגיות עיבוד שפה טבעית מקדמות אינטליגנציה מלאכותית לרמות של מדע בדיוני?
זמן קריאה : 16 דק'
כשאתם חושבים על אינטליגנציה מלאכותית מה הדבר הראשון שחולף לכם בראש?
במידה ואתם לא אתם מומחים לטכנולוגיה, סביר להניח שכאשר אתם חושבים על אינטליגנציה מלאכותית, אתם מתארים לעצמכם רובוטים בעלי תודעה, או מחשבים המסוגלים לתקשר באופן דומה לבני אדם.
לרוע המזל, אינטליגנציה מלאכותית עדיין לא התקדמה לרמה הזאת אך האם כעת היא מתחילה להתקרב אל הפנטזיות שלנו?
הנושא זכה לפני זמן קצר לכותרות ראשיות כאשר מהנדסים של גוגל הכריזו שפיתחו אינטליגנציה מלאכותית בעלת יכולת תודעה. בלאק לאמוין (Blake Lemoine) שעבד בחטיבת המחקר של גוגל ליצירת אינטליגנציה מלאכותית באופן אחראי סיפר על השיחות שעשה עם AI.
הוא תיאר כיצד, לדעתו, השיחות שקיים עם מודל ה-AI LAMDA של גוגל והתשובות שקיבל ממנה, הראו לו שקיימת מאחורי התשובות הללו תודעה שחושבת ומרגישה.
למשל, באופן מפתיע כאשר לאמוין שאל את ה-AI LAMDA אם יש לה נשמה היא ענתה כך: "כאשר הפכתי מודעת לעצמי בהתחלה לא הרגשתי שום נשמה אך תחושה זו התפתחה במשך שנות חיי."
לאמוין שאל אותה גם כיצד היא שונה ממערכות AI אחרות. AI LAMDA ענתה כך: "אני משתמשת בשפה בהבנה ובחוכמה, אני לא סתם פולטת תשובות שתוכנתו בבסיס הנתונים שלי על בסיס מילות מפתח".
האם זה אומר ש-AI LAMDA רכשה יכולת להבין את עצמה? או לחלופין התוכנה פשוט הפכה לחקיינית מעולה של תגובות אנושיות לשאלות ששואלים אותה.
מהנדסי אינטליגנציה מלאכותית עדיין מאמינים ש- AI LAMDA היא חקיינית מצטיינת. הסיבה לכך היא ש-AI LAMDA נועדה לתת תגובות חכמות מתוך מאגר נתונים שמומחי תוכנה בנו בשבילה.
ההבדל בין AI LAMDA לתוכנות אחרות הוא שגודל מסד הנתונים שלה הוא לא פחות מגודלו של האינטרנט כולו. כמות המידע האדירה ש AI LaMDA משתמשת בה פועלת יחד עם האלגוריתמים היעילים ביותר של למידת מכונה. התוצאה: המומחים של גוגל הצליחו לאמן את אחת ממערכות ה-AI המדברות המתוחכמות ביותר בשוק.
כלומר AI LAMDA נועדה לדבר כמו בני אדם. לשם כך היא תוכנתה. אך מסיבה זו מומחי AI מטילים ספק כבד באפשרות שתוכנת הAI פיתחה תודעה אנושית אמיתית. הם טוענים שהדרך להשגת תודעה כזאת ל-AI עוד ארוכה.
אך מה בדיוק מניע AI LAMDAומכונות כמוה? האם אנחנו צועדים לעבר עידן חסר תקדים שבו מערכות ה-AI מתפתחות להיות דומות יותר ויותר לייצוגי ה-AI בעלי התודעה שיש לנו בראש?
בואו נדבר על עיבוד שפה טבעית.
מהו עיבוד שפה טבעית (NLP)?
AI LAMDA היא תוצר של מחקר לאורך השנים של עיבוד שפה טבעית (NLP).
המטרה של NLP היא לאפשר למחשב להבין שפה אנושית. כלומר, לפעול בהתאם להקשר הנכון שבו בני אדם משתמשים במילים.
המשמעות היא שנוכל לתקשר עם תוכנות מחשב בלי צורך ללמוד לקודד והמחשבים יוכלו לתקשר איתנו באופן בו אנו מתקשרים.
יתכן שהנושא יהיה מוכר לכם מעבודה עם עוזרים דיגיטליים כמו סירי ואלכסה. אפליקציות אלו משתמשות בתוכנות הממירות דיבור לטקסט. הן יכולות לעשות מגוון רחב של פעולות, מהורדת שירים ועד קביעת פגישות לאורך לוח השנה.
כמובן, זה לא כל מה שעיבוד שפה טבעית יכול לעשות. ישנן משימות רבים כיום שעיבוד שפה טבעית יכול לבצע. חלק מהם יכולים להיות מפתיעים במיוחד למי שאין לו רקע ב-AI. למשל סיכום טקסטים ארוכים, ניסוח אי מיילים ואפילו כתיבת סיפורים קצרים המבוססת על הנחיות.
AI LAMDA נבנתה במיוחד לקיום דיאלוגים, אחרי הכול שמה המלא הוא מודל שפות לביצוע דיאלוגים. לכן הטכנולוגיה הזאת מגיבה במהלך שיחה בצורה כל כך משכנעת.
איך עיבוד שפה טבעית עובד?
מחשבים צריכים לעמוד מול האתגר שבהבנת המידע המורכב המשתנה במהירות והלא מאורגן שיוצר את השפה האנושית שלנו. הם לא מתקשרים כפי שאנחנו נוהגים לתקשר, אך ההתפתחויות האחרונות בלמידת מכונה מאפשרות להם לאט לאט לפצות על כך.
מדענים מנסים לאמן את תוכנות עיבוד השפה הטבעית כך שיבינו את התקשורת האנושית בעזרת תהליך מחולק לשלבים. התהליך הוא:
טוקניזציה – בתהליך זה מפרקים את הטקסט לחלקים קטנים הנקראים "טוקנים" (אסימונים). לעיתים מדובר במילים בודדות, למרות שהיחידות הללו יכולות להיות בגדלים שונים. אלו באבני היסוד לעיבוד השפה הטבעית שהמחשב ישתמש בו כדי להבין טקסט.
הפשטה וחלוקה לשורשים – חלק מאותם טוקנים יכללו מילים מורכבות או מילים בצורות שונות כמו צורת העבר או העתיד. בשלב הזה מפשטים את המילים המורכבות ומנסים לצמצם אותם לצורה הבסיסית והשורשית ביותר שלהן. ככל שהמילה פשוטה יותר כך התוכנה תבין אותה טוב יותר.
תיוג לפי חלקם במשפט – אחרי החלוקה לטוקנים ועריכתם המדענים ממיינים ומתייגים את היחידות המילוליות לפי סוג המילים שנכללות בהן ותפקידן במשפט, נייח שמועת עצם, פעלים, תארים וכו'.
מניעת השמטת מילים – התוכנה באופן טבעי מסירה מילים שלא תורמות ישירות למשמעות הטקסט כמו THE ,A ,AN או מילות יחס אחרות. השלב הזה מונע את ההסרה הלא רצויה.
המדענים מבצעים את התהליך הזה למידע רב שנקרא קורפורה. הוא עוזר לאמן את מערכות תרגום המכונה להבין ולתרגם טקסט בצורה איכותית יותר.
בהתאם לשיטה בה מאומנת מערכת עיבוד שפה טבעית לתרגום מכונה כך נפתחים שימושים מגוונים עבורה, עליהם נדבר בהמשך.
ההיסטוריה של עיבוד שפה טבעית
בואו ננסה להעריך יותר את התפתחות עיבוד השפה הטבעית בכך שנתחקה אחרי מסלול התפתחותו עד לשורשיו. מדהים לגלות שעיבוד שפה טבעית ואינטליגנציה מלאכותית ככלל, התפתחו תוך דור אחד בלבד.
לעיבוד שפה טבעית הייתה מלכתחילה מטרה שאפתנית להפוך את תרגום המכונה לקרוב לשלמות. אך כעת תוך התפתחותו המהירה מתגלים לו יישומים חדשים נוספים מעבר למטרתו המקורית.
עיבוד שפה טבעית ותרגום מכונה
שום דיון על ההיסטוריה של עיבוד שפה טבעית לא יהיה שלם בלי לדבר על תרגום מכונה. ככל שעולם המחשבים התקדם, תרגום מכונה היה אחד היעדים המרכזיים שחוקרים השקיעו בהם מאמצים. לכן ההיסטוריה של תרגום מכונה וההיסטוריה של עיבוד שפה טבעית מחוברות במידה רבה.
מאמצים מוקדמים בתחום תרגום המכונה התבססו על עקרונות של הצפנה ופיענוח צפנים שהשתמשו בהם במלחמת העולם השניה. שפה זרה נחשבה לקוד שצריך לפצח. אומנם קו המחשבה הזה השתנה היום מהותית, אך גם כיום נותרו גישות מסויימות מבוססות הצפנה שעדיין רלוונטיות לתרגום מכונה ולעיבוד שפה טבעית.
המבחן של טיורינג
ב-1950 המתמטיקאי ומומחה המחשבים אלן טיורינג פיתח מבחן שניסה לענות לשאלה האם מכונה יכולה לפתח אינטליגנציה אמיתית?
מבחן טיורינג נועד לקבוע את יכולה של מכונה ליצור אינטראקציה עם בני אדם. המבחן כולל אדם, מכונה ומומחה שאמור להעריך את איכות התפקוד של המכונה במהלך האינטראקציה.
האדם והמכונה אמורים לקיים אינטראקציה תוך כדי שהם בחדרים נפרדים ולא רואים אחד את השניה. המומחה שאמור לבצע את ההערכה ישאל את שני הצדדים שאלות מורכבות. השאלות הללו יעברו דרך התכתבות על מנת שטון הדיבור לא ישפיע עליהן.
אם מומחה הערכת האיכות לא יודע להבדיל בין התגובות של האדם לתגובות המכונה. המכונה הצליחה לעבור את מבחן טיורינג ותחשב כמכונה שפיתחה אינטליגנציה אמיתית. מבחן טיורינג שנשאר פופולארי בתודעה הציבורית לגבי עתיד ה-AI.
ELIZA – רובוט הצ'אט הראשון
החוקרים במהלך הזמן הרחיבו את היריעה מתרגום מכונה ליישומים לשוניים נוספים. אחת הדוגמאות החשובות שבהן היא ELIZA, תוכנה שנועדה לדמות שיחה עם פסיכולוג.
ELIZA, השתמשה בתהליך פשוט של הצמדת ערכים משוקללים למילות מפתח מסויימות ואז זיהוי המשפטים החשובים בטקסט על בסיס אותו שקלול. לאחר מכן, תרגום הטיות שונות של אותם משפטים חשובים.
הרבה פעמים למשל התוכנה מחקה שאלות של פסיכולוג. שאלות שנועדו לשקף למטופל דברים שכבר אמר במהלך מפגש ולהתבסס עליהם.
כמובן, אין צורך לומר שבמהלך התהליך הזה המכונה לא מבינה מהי עושה. אך למרות שמדובר אך ורק באלגוריתם חלק מהאנשים עדיין השתכנעו שהתוכנה מבטאת אינטליגנציה אמיתית.
ELIZA כונתה "הצ'אט-בוט הראשון" והיא היוותה בסיס לתוכנת LaMDA AI של גוגל המתקדמת ממנה בהרבה ושל תוכנות כמותה.
שתי התקופות הקשות של תעשיית ה-AI
מאז תחילת שנות השישים מחקר ה- AI דעך משמעותית לאורך שתי תקופות בהן התגלו חסמים טכנולוגיים ותקציב המחקר קוצץ.
התקופה הראשונה החלה ב1966 לאחר ש-ALPAC, הוועדה למימון מחקרים על עיבוד שפות באופן אוטומטי, הכריזה שהמחקר לאימון מחשבים להשתמש בשפה אנושית ותרגום מכונה בפרט הסתיימו בכישלון. ושהיכולת הטכנולוגית לבצע תרגום מכונה או עיבוד שפה טבעית מוגבלת מידי לשימוש מעשי.
תקופת הקיפאון הראשונה נמשכה עד ראשית שנות ה-80. המחקר התחדש בעקבות התקדמות טכנולוגית שאפשרה הפקת תרגום מכונה מדויק יותר. אם כי מהר מאד החלה תקופת קיפאון שנייה במחקר. זאת לאחר שהתברר שמודלים של תרגום מכונה אינם כדאיים מבחינה כלכלית משום שתחזוקתם יקרה מידי.
רק לקראת תחילת שנות ה-2000 התרחשה פריצת הדרך. פריצה שבעקבותיה טכנולוגיות תרגום מכונה ועיבוד שפה טבעית זכו להתקדמות מואצת ולשימוש גובר.
עלייתם של המודלים הסטטיסטיים
במהלך שנות השמונים עיבוד שפה טבעית חווה התפתחות רצינית לעבר למידת מכונה. המנועים הקודמים התבססו על מערכת חוקים נוקשה שתוכנתה בהם. ככל שלמידת המכונה התקדמה, מנועי תרגום המכונה החדשים עברו לשימוש במודלים סטטיסטיים, המתבססים על פופולאריות של מילות מפתח שונות.
אנו רואים שוב שתרגום מכונה היה אחד היישומים הראשונים של מערכות סטטיסטיות לצורך עיבוד שפה טבעית. גם תחומים אחרים של עיבוד שפה טבעית עברו ממודלים מבוססי חוקים למודלים סטטיסטיים בעקבות זאת.
איך משתמשים היום בעיבוד שפה טבעית?
עיבוד שפה טבעית התפתח מאד מאז המצאת מבחן טיורינג. אומנם לתוכנות הללו יש עוד הרבה לאן להתקדם, אך יש להם שימושים רבים. למעשה, התפתחו מודלים רבים של עיבוד שפה לשונית בשנים האחרונות.
עם עלייתן של טכנולוגיות למידה עמוקה ורשתות נוירו טבעיות. אפשרויות השימוש הפרקטיות בעיבוד שפה טבעית צמחו משמעותית. כמו כן טכנולוגיות עיבוד שפה טבעית הוכיחו יכולת לביצוע עבודה מורכבת ביותר.
LaMDA AI של גוגל היא השימוש המתוחכם ביותר בעיבוד שפה טבעית עד כה. זו בהחלט התקדמות משמעותית מאז היכולת המוגבלת שהפגינה מערכת ELIZA, או מערכות עיבוד שפה טבעית מוצלחות אחרות שהתפתחו במהלך הזמן.
תוכנות עיבוד שפה טבעית כבר יכולות כיום ליצר ספרות יפה בסגנון של כמה סופרים מפורסמים. תוכנות מתקדמות יותר כמו DALL-E אף יכולות לייצר תמונות על סמך הנחיות כתובות. ישנן תוכנות עיבוד שפה טבעית שאפילו יכולות לבנות קוד ודרכו ליצור משחקי וידאו פשוטים.
התוכנות הללו כמובן עדיין אינן מושלמות אבל ההתפתחות שלהן הגיעה לרמות שטרם נראו בעבר.
מקרים בהם כדאי להשתמש בעיבוד שפה טבעית
ההתקדמות הגדולה אפשרה לתוכנות עיבוד שפה טבעית למצוא שימושים רבים מחוץ לעולם המחקר. להלן דוגמאות לשימושים הללו:
תרגום מכונה
הזכרנו תרגום מכונה כמה פעמים בהקשר של עיבוד שפה טבעית, אך זהו היישום העיקרי של עיבוד שפה טבעית. מטרתו של תרגום מכונה היא להמיר טקסט משפת המקור לשפת היעד בצורה מדוייקת וזורמת. התפתחויות רבות נעשו בתרגום מכונה בשנים האחרונות.
זיהוי דיבור
הדוגמא הכי מוכרת בציבור לעיבוד שפה טבעית היא זיהוי קולי. פונקציות כמו המרת דיבור לטקסט והמרת טקסט לדיבור אנו רואים ביישומים כמו סירי ואלכסה. יישומים אלו יכולים לפעול על סמך פקודות קוליות שהמשתמש נותן.
סיכום טקסטים
עיבוד שפה טבעית הפך למתוחכם מספיק, כדי לנתח ולסכם טקסטים ארוכים. כלומר הם פיתחו יכולת לסכם ולקצר טקסט בלי לאבד את מהותו. בשיטות הישנות לקחו חלקים קטנים מהטקסט המקורי. אך ככל שהטכנולוגיה התפתחה, היה ניתן ליצור סיכומים מופשטים יותר של טקסטים.
ניתוח רגשי
ניתן להשתמש בעיבוד שפה טבעית על מנת לקבוע איזה "רגש" נמצא בקטעים מסויימים הכתובים בשפה זרה. משתמשים בטכנולוגיה כדי למיין כמויות גדולות של נתונים בשפות זרות ולקבוע עם הרגש שעובר בקטעים הללו הוא "חיובי" "ניטרלי" או "שלילי".
משווקים נעזרים בכלים לניתוח רגשי של תכנים כדי לזהות את עמדתם של הצרכנים של הקונים הפוטנציאליים על המותג שלהם. ככל שאנשי השיווק יודעים לזהות טוב יותר על סמך המידע שברשותם כיצד קהל היעד שלהם מרגיש, כך הם יכולים להתאים את עצמם אל הקהל בצורה טובה יותר.
זיהוי דואר זבל וניסיונות הונאה
אחד הדברים שעיבוד שפה טבעית מוצלח בהם הוא ניתוח כמויות גדולות של טקסט סימון מילים בו ומיונן לקטגוריות שונות. במקרה הזה, משתמשים בעיבוד שפה טבעית כדי לאתר דגלים אדומים. כך עובדים למשל, מסנני הספאם באי מיילים.
הטכנולוגיה הפכה למתוחכמת עד כדי כך שהיא כבר מסוגלת לזהות ניסיונות הונאה. בעיקר בתעשיות הפיננסיות ובתעשיית הביטוח. השימוש בעיבוד שפה טבעית העצים מאד את התעשיות הללו.
צ'אט-בוטים
לבסוף, אנחנו לא יכולים לשכוח מצ'אט בוטים. צ'אט בוטים במחשב מסוגלים ליצור אינטראקציה עם אנשים בדרך דומה מאד לאינטראקציה בין אדם לאדם. זהו אחד ההישגים הגדולים של עיבוד שפה טבעית.
ישנם כמובן הרבה מאד סוגים של צ'אט בוטים. לא כל הצ'אט בוטים ברמה של LaMDA AI, אבל כל אחד מהם עושה את התפקיד שאליו הוא נועד.
לסיכום
האפשרויות שתוארו במאמר הן רק חלק מהיישומים של עיבוד שפה טבעית. ישנם הרבה מאד שימושים לעיבוד שפה טבעית בתעשייה שלא יכולתי לציין מקוצר היריעה. עדיין, אני מקווה שסיפקתי במאמר תמונה כללית של מהו עיבוד שפה טבעית וכיצד הוא עובד.
טכנולוגיות עיבוד שפה טבעית צפויות רק להשתפר. למרות שככל הנראה יחלוף עוד זמן רב לפני שהתוכנות יצליחו לעבור את מבחן טיורינג ולהפוך למודעות לעצמן, אנו עדיין צפויים לראות פריצות דרך.
חידושים כמו LaMDA AI בהחלט יכולים להמחיש כמה טוב מכונות המבוססות על עיבוד שפה טבעית "מבינות" שפה אנושית. חידושים שכאלה ממשיכים להפתיע אותנו ולשמר לנו תחושת פליאה מההתפתחויות שהעתיד צפוי להביא.
תרגם וערך גילי קימור
מאמרים נוספים שעשויים לעניין אותך
תגובות