זה היה עניין של זמן עד שהבינה המלאכותית המשוחחת - ChatGPT והאחרות - תעבור לשלב הבא: שיחה מול אווטאר, דמות אדם בתלת ממד, שמקשיבה לשאלות ועונה את התשובות. חברת D-ID הישראלית מציגה היום טכנולוגיה ראשונה מסוג זה, שתאפשר לחברות ולמשתמשים בודדים לפתח במהירות אווטאר או אווטארית אינטליגנטיים, שאיתם ניתן לנהל שיחה פנים אל פנים.
צריך להודות: מדובר בחוויה מסוג חדש. תחושת האי נוחות שמלווה שיחה עם ChatGPT או כל צ'אטבוט אחר, עמק המוזרות (uncanny valley) בשפה המקצועית, כמעט ונעלמת כאן. הדמות הווירטואלית שמולנו נראית כמו אישה או גבר, בשיחת וידאו. שואלים אותה שאלות בדרך שהיינו שואלים אדם אמיתי. היא עונה מיד, כמו אדם רגיל, ומדברת בצורה רהוטה ועשירה כמו שהתרגלנו עם ChatGPT. חוויית השיחה בוואטסאפ הופכת לחוויית שיחה בזום. ואם היא משקרת מדי פעם, כמו שכבר למדנו, זה רק עושה אותה אנושית יותר.
גיל פרי, מנכ"ל D-ID, אומר שמדובר בטכנולוגיה שהבשילה ממש לאחרונה: אחרי שהחברה הציגה יכולת לשלב טקסטים של AI עם אווטארים כבר לפני חודשים מספר, עכשיו היא גם מציגה יכולת לעשות את זה בסטרימינג, כלומר בזמן אמת. "הבנו שאנחנו יכולים לעשות משהו משמעותי בתחום ה-AI הגנרטיבי", הוא אומר. "אבן הבניין העיקרית של כל התחום הזה היא LLM – מודל השפה הגדול. המרכיב השני הוא ייצור התמונות כמו ב-Dall-E2 או Stable Diffusion, ואנחנו אבן בניין שלישית – גורמים לתמונות לדבר את הטקסט ומאפשרים לכל הדבר הזה לקרות ממש בלייב".
גיל פרי, מנכ"ל D-ID: "הבנו שאנחנו יכולים לעשות משהו משמעותי בתחום ה-ג'נרטיב AI. אבן הבניין העיקרית היא LLM – מודל השפה הגדול. המרכיב השני הוא ייצור התמונות, ואנחנו אבן בניין שלישית – גורמים לתמונות לדבר את הטקסט ומאפשרים לכל הדבר הזה לקרות ממש בלייב"
השירות החדש, המשלב שתי טכנולוגיות - שירות שיחה בזמן אמת ביחד עם היכולת להנפיש תמונה על בסיס טקסט, מאפשר למשתמשים לנהל שיחה טבעית עם דמות דיגיטלית אינטראקטיבית. את הטכנולוגיה של D-ID ניתן לשלב עם טכנולוגיות ליצירת טקסטים כמו GPT-3 או LaMDA. טכנולוגיית ההנפשה בזמן אמת זמינה למפתחים באמצעות ממשק API. באמצעות ממשק זה, יתאפשר לחברות, מוסדות ומפתחים להציע שירות לקוחות דיגיטלי שכולו מופעל על ידי בינה מלאכותית וכך ליצור אינטראקציה בצורה אנושית ולשפר את שירות הלקוחות, המכירות, ההדרכה לעובדים ועוד.
אם קיווינו לעשות שיחת נפש עם אווטאר חביב ונמרץ שאת דמותו ואת קולו בחרנו בעצמנו – אז זה עוד לא קורה. כרגע החברה ממוקדת בלקוחות עסקיים גדולים והיא מציעה להשתמש בטכנולוגיה לצורך פיתוח אנשי תמיכה, שירות לקוחות או חוויית הלקוח, שאיתם יוכלו לקוחות החברה לשוחח בדיבור טבעי. לדברי פרי החברה מקיימת בימים אלה מספר ניסויי POC אצל לקוחות גדולים לקראת הפעלת השירות בקרוב.
פרי אומר: "החזון פה הוא משהו ענק, זה בעצם לעשות דיסרפשן לאיך אנשים מתקשרים עם כל דבר דיגיטלי – המחשב, הטלוויזיה, האייפון, עם אתר, עם כספומט, אפילו צ'ק-אין בשדה תעופה. אתה פשוט תדבר עם בני אדם. שיחות עם דמויות וירטואליות היא צורת המדיה הבאה וכמות השימושים היא אינסופית".
חברת D-ID החלה את דרכה ב-2017 בפיתוח טכנולוגיית אנונימיזציה של בני אדם בסרטוני וידאו, שאת פניהם היא החליפה בפנים מלאכותיות ששיקפו את המאפיינים המקוריים שלהם. אבל אז פרצו טכנולוגיות הדיפ-פייק לחיינו והחברה התאימה את הטכנולוגיה שפיתחה לתחומים של הנפשת תמונות וייצור סרטונים שמבוססים על וידאו סינתטי, הציגה את Deep Nostalgia עם חברת MyHeritage (שהנפישה קרובי משפחה שנפטרו) ועוד. הנפשת הצ'אטבוטים היא תחום חדש שהחברה נכנסת אליו במהירות רבה, ואם לשפוט על פי הפופולריות של התחום, הוא עשוי לתפוס נתח ניכר מפעילותה בעתיד.
"העולם משתנה מהר", אומר פרי. "מפת הדרכים שלנו תמיד היתה שאתה תוכל לשוחח עם אווטאר, עם דמות מלאה, גם בתלת ממד, גם במטאוורס. ועכשיו נכנסו היכולות של ה-GPT לשיחה עם עומק". לדבריו הפלטפורמה של החברה מאפשרת כבר עתה לכל מפתח להקים מערכת של אווטאר שיחות, וכל חברה יכולה לייצר צ'אטבוט כזה ולהתאים אותו לצרכים שלה. מול חברות גדולות D-ID עצמה נותנת את שירות ההתאמה, שכולל אימון של ה-AI על הטקסטים הספציפיים של החברה, קביעת מערכת של תשובות אחידות לשאלות חוזרות, ופיתוח האווטאר.
ומה באשר לצ'אטבוט כללי לציבור הרחב, שאיתו אפשר יהיה לנהל שיחות בווידאו על כל נושא?
"אנחנו שם בגדול, זה אפשרי. אנחנו אמנם חברת B2B ומתמקדים בחוויית הלקוח בחברות גדולות. אבל אולי אנחנו נעשה את זה... יכול להיות שיהיה מעניין בקרוב".
כחלק מהחלטתה של D-ID להיות מעורבת בקידום טכנולוגיות בינה מלאכותית באופן אתי ואחראי, מודיעה החברה על הצטרפותה ליוזמה חדשה תחת השם Partnership on AI's Responsible Practices for AI Synthetic Media. היוזמה התגבשה במהלך השנה האחרונה בשותפות כמה גורמים אשר פועלים בפיתוח וקידום טכנולוגיות בינה מלאכותית. כחלק מהיוזמה, ניתנות המלצות וקווים מנחים למשתמשים וחברות שיוצרים, משתפים ומפיצים מדיה שנוצרת על ידי שימוש בבינה מלאכותית.