עולם הבינה המלאכותית מתפוצץ סביבנו בימים האלה: חברות משלבות AI במוצרים שלהן, קרנות משקיעות השקעות עתק בתחום וכולם מתלהבים מהיכולות המופלאות של הצ'אטבוט לכתוב דברים במקומנו. רק שעם הפוטנציאל באה גם סכנה. למשל הנטייה של הצ'אטבוט להמציא עובדות שעלולות להטעות ולהוביל להחלטות מסוכנות.
סכנה חמורה לא פחות שלמדנו להכיר בשנים האחרונות, היא הנטייה של הבינה המלאכותית לעשות אפלייה: להעדיף גברים על נשים בקבלה לעבודה, להעדיף לבנים על שחורים בקבלת הלוואה, להתריע על פשיעה דווקא בשכונות מסוימות. אז נכון, יש דיבור על הצורך בהגינות (fairness) בבינה מלאכותית, אבל מי באמת עושה משהו בעניין?
אז הנה אחת כזאת – חברת פיירג'ן (Fairgen), שמציעה להתמודד עם אפליה של בינה מלאכותית באמצעות בינה מלאכותית. אחת הדרכים לעשות את זה הוא לסרוק את מערכי נתונים של הלקוח, ולהציף את כל הנקודות הבעייתיות. אחר כך צריך גם לנקות את ההטייה מבלי לאבד מהיעילות של מערך הנתונים המקורי. וכאן בא הכלי השלישי: ייצור דאטה סינתטית באמצעות ג'נרטיב AI - נתונים מומצאים שמתנהגים כמו הלקוחות האמיתיים ומאפשרים להפיק תובנות בעלות ערך ללקוחות.
הבעיה קיימת, גם הטכנולוגיה שפותרת אותה כבר קיימת, אבל מתברר שהשוק עוד לא ממש קיים. הבנקים, חברות הביטוח וכל שאר הענקיות שאוספות ומנתחות את הנתונים שלנו כל העת, לא חשות דחף עז לעשות את זה בצורה הוגנת. וזה מה שהוביל את פיירג'ן לעשות פיבוט ממש בשבועות האחרונים, ולהשתמש בטכנולוגיה שלה כדי לפתור בעיה שונה בשוק שונה – חברות סקרי שוק צרכניים.
סמואל כהן, מנכ"ל Fairgen: "כשיש מצב של אפליה חברתית, ה-AI תגדיל את האפליה הקיימת. לקחו החלטות שאנשים קיבלו ב-40 השנים האחרונות ואימנו עליהן את ה-AI והתוצאה היא שה-AI משכפלת את ההחלטות הקודמות. כמו בכל תחום ב-AI, אם אתה מכניס זבל אתה מקבל זבל"
"הבעיה העיקרית היא שאנחנו מתקדמים מהר מאוד בתחומי ה-AI אבל לא הרבה אנשים חושבים על הסיכונים שהם לוקחים עם המודלים האלה, שבהם תהליך קבלת ההחלטות אוטומטי", אומר ד"ר סמואל כהן, מנכ"ל החברה ומייסד משותף. "כשיש מצב של אפליה חברתית, ה-AI תגדיל את האפליה הקיימת. לקחו החלטות שאנשים קיבלו ב-40 השנים האחרונות ואימנו עליהן את ה-AI והתוצאה היא שה-AI משכפלת את ההחלטות הקודמות. כמו בכל תחום ב-AI, אם אתה מכניס זבל אתה מקבל זבל. ה-AI מקבלת החלטות גרועות ומפלות וזה מעגל שקשה לשבור אותו".
הקשיים מתחילים בהגדרה הבסיסית של מהי בכלל הטיה. התשובה משתנה מלקוח ללקוח ומתחום עיסוק אחד לאחר. אחרי שמפצחים את החידה ומגדירים את אותן הטיות שהלקוח מוכן להכיר בהן, צריך דעת לנקות את מערך הנתונים (de-biasing) מבלי לפגוע בביצועים. למשל, אם הוצא הנתון שמזהה את המגדר צריך להצביע על נתונים אחרים, לא מגדריים, שמזהים את הסיכון בלקוח מסוים.
כאן נכנסת גם טכנולוגיית הדאטה הסינתטית. כהן מסביר: "אנחנו מקבלים דאטה אמיתית, מגדירים את מסגרות ההגינות, ואז משתמשים במודל ג'נרטיבי ומייצרים מערך נתונים חדש שעומד בדרישות ההגינות שהוגדרו. ה-IP שפיתחנו הוא איך ליצור מודל ג'נרטיב AI שמייצר דאטה סינתטית שהיא כל כך קרובה לדאטה האמיתית כך שאתה לא מאבד ביצועים".
כהן: "המטרה היא לעשות סקייל בתעשיית המחקרים וכשהשוק יהיה מוכן - לחזור לתחום ההגינות בבינה מלאכותית. יש מגוון חברות שאנחנו יכולים למכור להן לאחר מכן – חברות סקרים, חברות שאלונים אונליין, חוקרים באקדמיה שעושים סקרים - זה שוק מאוד גדול"
הרגולטורים בעולם מאוד מודאגים מבעיות של הגינות הבינה המלאכותית, רק שהם מוכנים לעשות מעט מאוד כדי להגן על הציבור בעניין. בארה"ב, בקנדה וגם בישראל קודמו תקנות שבהן הממשלות ממליצות לחברות ה-AI להיות הגונות. ממליצות, לא מפקחות. באיחוד האירופי הגישה מחמירה יותר, עם דירוג ה-AI לפי מידת המסוכנות ועם פיקוח מקרוב על כל מערכת מסוכנת. אלא שהדיונים בנושא ה-AI Act מתמשכים כבר שנים, ובינתיים אין כל רגולציה מחייבת. זו הסיבה שבפיירג'ן התייאשו קצת.
אם הרגולציה האירופאית היתה בתוקף, היו יכולים להיות לכם הרבה לקוחות, נכון?
"נכון, אבל ראינו שבינתיים התקנות החדשות לא אושרו וזה כנראה ייקח עוד זמן. וגם אחרי שזה יאושר, ייקח עוד זמן עד שחברות ירצו להתחיל לבצע פרויקטים ולהשקיע בזה כסף. בשביל סטארט אפ בתחילת הדרך זה בעייתי. זו סביבה שלא ברור מתי יהיו לך לקוחות".
זו הנקודה בה סטארט אפ צריך לחשב מסלול מחדש, אפילו אם זה באי חשק מסוים. פיירג'ן איתרו שוק לקוחות אחר שהטכנולוגיה רלוונטית עבורו ואולי אפילו מייצרת הכנסות ממשיות. מדובר בתחום חברות מחקרי השוק הצרכניים, שבאמצעותם רשתות ומותגים מקבלים החלטות על פיתוח מוצרים, שיפור מוצרים ועל קמפיינים של שיווק ומכירות. גם במחקרים האלה קיימות הטיות שקשה להתמודד איתן.
"כדי להגיע לרמה הנכונה של קבלת ההחלטות אתה צריך לנטרל את ההטיות שיש במחקר", אומר כהן. "הבעיה היא שככל שאתה רוצה נתונים יותר עמוקים ומפורטים, ככה ההטיות מחמירות". כאן החברה מגייסת את מודל הג'נרטיב AI שלה, ומייצרת נשאלים סינתטיים שמתנהגים וחושבים ממש כמו אנשים אמיתיים. "בסופו של דבר אתה יכול לייצר יותר סקרים על סגמנטים ונישות קיצוניות, שקשה לאסוף מידע מהן".
"יש כאן וייב שאין במקומות אחרים"
חברת פיירג'ן התחילה ביוזמה של סמואל כהן, יליד צרפת, בתקופת לימודיו באימפריאל קולג' בלונדון. תקופת התמחות שעשה בחברת קולאבו הישראלית הפגישה בינו לבין המשקיע והיזם הסדרתי בני שניידר. כהן למד מתמטיקה ומדעי המחשב לתואר ראשון, המשיך לתואר שני באוקספורד וסיים עם דוקטורט בלמידת מכונה באוניברסיטת UCL בלונדון. באותו זמן עבד בתחום מחקר ה-AI בפייסבוק ובחברות נוספות והתמחה בג'נרטיב AI.
על ספסל הלימודים הוא פגש בנתן קווליונה, שלמד הנדסת חשמל ואלקטרוניקה והתמחה בדאטה סינתטית. ביחד עלה הרעיון להקים סטארט אפ. עם הרעיון הוא הלך לדבר עם שניידר: "אמרתי לו שאני חושב שהגיע הזמן מבחינתי להתחיל במשהו אמיתי, עשינו סיעור מוחות של כמה חודשים, עד שעלה הרעיון של ניקוי הטיות והחלטנו להקים את זה ביחד". לכהן (CEO) ולקווליונה (CTO) הצטרפו היזם מייקל כהן (COO) ובני שניידר עצמו כמייסד שותף ויו"ר החברה.
על הקמת החברה בישראל אומר כהן: "האקוסיסטם כאן חזק וכך גם תחום ההשקעות. אנשים לא מפחדים להתחיל דברים חדשים, חדשניים. אני רציתי את ישראל כל הזמן והיו הרבה סיבות טובות לעבור מלונדון לישראל"
את בני שניידר לא צריך להציג: הוא יזם סדרתי עם ארבעה אקזיטים מאחוריו בהיקף כולל של יותר ממיליארד דולר. מי שהחל את המסע בהייטק בחברת תדיראן, המשיך בסיסקו ולאחר מכן היה שותף להקמת החברות פנטאקון שנרכשה על ידי סיסקו, קומראנט שנרכשה על ידי RedHat וראבלו שנרכשה על ידי אוראקל. כיום הוא שותף בקרן StageOne Ventures, משמש מייסד משותף ויו"ר של Salto ויו"ר של ScyllaDB, Fairgen ו-vHive. לפי IVC יש לא פחות מ-21 חברות בפורטפוליו שלו, שמונה אקזיטים כמשקיע ורק שתי חברות שנסגרו.
את הכסף הראשוני בפיירג'ן שם שניידר. ביוני האחרון החברה סגרה סבב גיוס סיד בהיקף 2.5 מיליון דולר, שהובילו אותו הקרנות טל ונצ'רס הישראלית ו-Creator Fund הבריטית, קרן שמתמחה בטכנולוגיות דיפטק וביזמים בעלי תואר דוקטור. כעת על הפרק פרויקט היתכנות גדול, פרויקט פיילוט שמתבצע עם חברת מחקרי שוק גדולה בצרפת. הרבה תלוי בתוצאות הוולידציה הזו.
כהן אומר כי לאחר הוכחת ההיתכנות החברה תוכל להתחיל בתהליך התרחבות לשווקים השונים, כשההון הנדרש וכוח האדם כבר מוכנים. "המטרה היא לעשות סקייל בתעשיית המחקרים וכשהשוק יהיה מוכן - לחזור לתחום ההגינות בבינה מלאכותית", הוא אומר, "יש מגוון חברות שאנחנו יכולים למכור להן לאחר מכן – חברות סקרים, חברות שאלונים אונליין, חוקרים באקדמיה שעושים סקרים - זה שוק מאוד גדול. לאחר מכן, בתוך כמה חודשים, נערוך סבב גיוס נוסף ואז גם נרחיב את מספר העובדים. הכל אחרי שהפיילוט יסתיים בהצלחה".
היית יכול להקים את החברה בלונדון. גם בצרפת יש תשתית חזקה לסטארט אפים. למה העדפת לעלות לישראל ולהקים את החברה כאן?
"קודם כל, כי כל השותפים שלי נמצאים בישראל. הסיבה השנייה היא שהאקוסיסטם כאן חזק וכך גם תחום ההשקעות. יש כאן וייב שאין במקומות אחרים, אנשים לא מפחדים להתחיל דברים חדשים, חדשניים. אני רציתי את ישראל כל הזמן והיו הרבה סיבות טובות לעבור מלונדון לישראל".