הסרטון הזה שמוצג כאן בהמשך הוא לא קטע מתוך סרט חדש של מארוול. יותר מזה – שום חלק ממנו לא נוצר על ידי בני אדם. כל מרכיב בסרטון הוא תוצר של בינה מלאכותית: הדמויות, הנופים, המוסיקה, הדיבור ואפילו העלילה - הכל נוצר ללא מגע יד אדם. אם תרצו – זה השלב הבא של ה-AI הגנרטיבי, התחום הלוהט בעולמות הבינה המלאכותית, שמתפתח בקצב שקשה לעקוב אחריו.
חברת D-ID הישראלית הייתה שם עוד לפני שקראו לזה AI גנרטיבי, אלא וידאו סינתטי או סתם דיפ פייק. אבל היא ממוקמת היטב כדי לחבור למגמה הנוכחית בעולם ולהציג פלטפורמה שמחברת את כל עולמות ה-AI הגנרטיבי: תמונה, וידאו, שיחה, ודיבור.
D-ID מציגה היום את מה שהיא מכנה "פלטפורמת הבינה המלאכותית הראשונה בעולם שמאפשרת יצירה של טקסט, תמונות וסרטונים תחת קורת גג אחת". למעשה מדובר בפלטפורמת Creative Reality Studio שהושקה לפני חודשים מספר, שלתוכה שולבו מנועי ה-AI GPT-3 של OpenAI שמייצר טקסטים ו-Stable Diffusion של Stability AI, שמייצר תמונות. באמצעות משפטי הכוונה (prompts) המשתמש מעצב את הדמות שהוא רוצה, והיא הופכת לאווטר מונפש שמקריא את הטקסטים של GPT-3 בקול ובסגנון שנבחר.
גיל פרי, מנכ"ל D-ID: "אנחנו רק מתחילים להבין את הפוטנציאל האדיר של טכנולוגיות ה-AI הגנרטיבי ונראה כי הן הולכות להשתלט על העולם בסערה. אנחנו רוצים להיות חלק מאבני הבניין של הטכנולוגיה המתפתחת במהירות"
"AI גנרטיבי הוא הבאזוורד החדש, התחום הכי חם בעולם הטק", אומר גיל פרי מנכ"ל ומייסד משותף ב-D-ID. "אנחנו נמצאים בפרונט של התחום הזה. יודעים לקחת תמונה וטקסט ולגרום לתמונה לדבר את הטקסט וככה מייצרים וידאו. עשינו חיבור לראשונה בעולם, הוספנו איזור חדש של AI בפלטפורמת הסטודיו שלנו, ואנחנו מחברים את GPT-3 עם סטייבל דיפיוז'ן ועם יכולת שלנו לייצר את הווידאו". לדבריו D-ID מייצרת את הדמויות במהירות שעולה על זמן אמת (בהדגמה הוא מראה סרטון של 32 שניות שיוצר בתוך 15 שניות) ולכן הכוונה היא להשתמש ביכולות האלה בפלטפורמות סטרימינג, כשהאווטר מדבר במקום המשתמש.
"זו עוד אבן בניין בתחום ה-AI הגנרטיבי. הולך להיבנות פה עולם שלם כמו המובייל והענן, סביב הדבר הזה", אומר פרי. "אני צריך לרוץ מהר מהר כי זה התחום הכי חדש. אנחנו נותנים פנים ל-ChatGPT. אנחנו מתמקדים באיכות בפרונט, ובהנפשת התמונות".
שוק היעד של המוצר החדש הם יוצרי תוכן, אנשי שיווק ופיתוח ארגוני. הפלטפורמה מאפשרת להם ליצור תכני וידאו המשלבים פרזנטורים דיגיטליים. הגרסה האחרונה של הסטודיו מפחיתה את העלויות ואת המאמץ הכרוכים בהפקת סרטוני וידאו על ידי שילוב הטכנולוגיות. "הפוקוס שלנו הוא על מחלקות של חברות גדולות, שיוכלו לעשות מצגות עם פרזנטור בשבריר המחיר לעומת הפקות רגילות. את הנפשת השיחה עם AI אנחנו מכוונים למחלקות תמיכת לקוחות כדי לשפר את שביעות הרצון של הלקוחות".
ה-AI הגנרטיבי פותח שוק חדש מבחינתה של D-ID – שוק יוצרי התוכן. "הקריאייטורים גילו את הסטודיו כשהושק בהשקה רכה ובסטלת' לפני כמה חודשים וראינו דברים מדהימים בטוויטר וברשתות", אומר פרי. "זה היה מפתיע אבל גם סגרנו עסקאות B2B כי חלק מהיוצרים היו עובדים בארגונים גדולים". לדבריו יש כיום כ-200 מיליון יוצרי תוכן פעילים, עם פוטנציאל של עוד 100 מיליון שרוצים להיות יוצרי תוכן, בהם צעירים ובני נוער.
"החלטנו לתת לזה פוקוס ואנחנו מציעים להם חבילה במחיר של דולרים בודדים", אומר פרי. "אנחנו רק מתחילים להבין את הפוטנציאל האדיר של טכנולוגיות ה-AI הגנרטיבי ונראה כי הן הולכות להשתלט על העולם בסערה. אנחנו רוצים להיות חלק מאבני הבניין של הטכנולוגיה המתפתחת במהירות, עם פלטפורמה ראשונה שמציעה למשתמשים יכולת יצירת תמונה וטקסט בשילוב עם יכולת הנפשה באמצעות AI ובכך לפתוח דלת לאינסוף פוטנציאל יצירתי. אנחנו כבר משתוקקים לראות את התוצרים של המשתמשים שלנו".
הטכנולוגיה של D-ID עומדת מאחורי יצירתם של למעלה מ-107 מיליון סרטונים ברחבי העולם, ומאחורי מוצר ה-Deep Nostalgia של חברת MyHeritage, שאפשר למיליוני אנשים להנפיש תמונות של קרובי משפחתם ודמויות היסטוריות שנפטרו. עם לקוחות החברה נמנים מותגים דוגמת האחים וורנר ומותג הצרכנות Mondelez וכן חברות פורצ'ן 500 ותאגידים גלובליים.