צעד קטן לחברת ה-AI הישראלית AI21 Labs, צעד גדול לפיתוח הבינה המלאכותית בעולם? החברה מציגה היום את מודל ה-NLP שלה בגירסתו החדשה - Jurassic-X - שמסוגל לתקשר עם בני אדם בשפה טבעית תוך שהוא מתייחס לנתונים מתעדכנים תדיר, כמו מזג האוויר או שערי מטבע. ב-AI21 טוענים שמערכת המודל-שפה-כשירות (NLP-as-a-Service) שלהם מתמודדת בליגה של מודלי השפה המובילים בעולם, כמו GPT3 של OpenAI, BERT של גוגל ואפילו פייסבוק - והיכולת החדשה נותנת למודל הישראלי עדיפות בתחומים שהמתחרים יתקשו לענות עליהם.
NLP (עיבוד שפה טבעית) הוא אחד מתחומי הבינה המלאכותית המרכזיים כיום, והמודלים המובילים מצליחים לקרוא ולהבין טקסטים טוב יותר מבני אדם, לתקצר אותם, להציע ניסוחים ואפילו לכתוב טקסטים משלהם אבל הם פחות מוצלחים בניהול דיאלוג. מנגד, היכולות של צ'אט בוטים ועוזרים דיגיטליים כמו סירי או גוגל אסיסטנט להבין טקסטים מורכבים הן נמוכות משמעותית, וב-AI21 מבקשים לגשר בין העולמות ולייצר מערכות אינטליגנטיות שמתקשרות עם בני אנוש בשפה טבעית.
שימושים ראשונים של ה-AI של AI21 היכרנו בדמות Wordtune, התוסף שמאפשר לשפר את ניסוחי הטקסטים שלנו, וכן Wordtune Read שמאפשר קבלת תקציר טקסטים, ולפניהם המודלים "חיים" ו"חיימק’ה" שהדגימו יכולות בייצור טקסטים חדשים. AI21 Labs הוקמה על ידי מומחי הבינה המלאכותית פרופ' יואב שוהם ואורי גושן ואליהם הצטרף כמייסד גם פרופ' אמנון שעשוע, מנכ"ל מובילאיי.
המערכת החדשה של AI21 יכולה לענות על שאלות שדורשות התממשקות למקורות מידע חיצוניים לצורך קבלת מידע עדכני בזמן אמת, כך שניתן לקבל באמצעותה תשובות עדכניות ולא רק תשובות שמתבססות על המידע שהוזן למודל בעת שפותח. חברות ה-AI האחרות נדרשות לאמן מחדש את המודלים שלהן כדי להזין לתוכם נתונים מעודכנים, מה שגורם לעלויות פיתוח גבוהות.
פרופ' יואב שוהם: "אחת הסיבות לכך שמודלי שפה לא מממשים את הפוטנציאל האמיתי שלהם, היא שעדכון מודלי שפה נעשה פעם בשלוש שנים בממוצע וכך, מודל שאומן לפני נובמבר 2020 יחשוב שדונלד טרמפ הוא נשיא ארה"ב ולא יהיה לו מושג שבימים אלה מתחוללת מלחמה באוקראינה"
פרופ' יואב שוהם, מיייסד שותף ב-AI21, מסביר שמודלי השפה לא מצליחים כיום לממש את הפוטנציאל האמיתי שלהם ולתקשר עם בני אדם באמצעות שפה טבעית: "אחת הסיבות לכך היא, שעדכון מודלי שפה נעשה פעם בשלוש שנים בממוצע וכך, מודל שאומן לפני נובמבר 2020 יחשוב שדונלד טרמפ הוא נשיא ארה"ב ולא יהיה לו מושג שבימים אלה מתחוללת מלחמה באוקראינה". מגבלה קיימת נוספת היא חוסר היכולות של המערכות הקיימות לחלץ בעיות מתמטיות הגלומות במשפט בשפה טבעית. המודל החדש אומן להתמודד עם בעיות משני הסוגים האלה.
הייעוד - מסחרי
מודל Jurassic-X פותח לפי עקרונות MRKL (Modular Reasoning, Knowledge and Language), שבהם מתחבר מודל השפה למקורות חיצוניים כמו מחשבונים מקוונים, ממירי מטבעות או מאגרי מידע חיצוניים. המערכת מורכבת מסט מודולים הניתן להרחבה ונתב שמפעיל כל מודול, בהם מודל שפה עצום, מאומן מראש, למטרות כלליות ומספר מודלים עצביים קטנים יותר למטרות מסוימות ומודולים סימבוליים. אלה יכולים לגשת למקורות ידע ספציפיים באמצעות קריאות API ציבוריות או קריאות SQL לבסיסי נתונים. מודל ה-Jurassic-X מבוסס על מודל השפה העיקרי של AI21 - Jurassic-1 - שבו 178 מיליארד פרמטרים.
הרעיונות הנשגבים על שיח בין אדם למכונה מתממשים בינתיים ביישומים מסחריים למדי. בחברה מדברים על יישומים של הטכנולוגיה בעולמות הפרסום והפיננסים, ועד כה החברה חתמה הסכמי שיתוף פעולה עם קבוצת הפרסום והשיווק פובליסיס (Publicis Groupe) ועם חברת הוצאה לאור אמריקאית ששמה לא נמסר.