חברת מטא, פייסבוק לשעבר, מציגה הערב אלגוריתם בינה מלאכותית שגובר, לטענתה, על האלגוריתמים הקיימים כיום בתחומי זיהוי תמונה וזיהוי דיבור ומשתווה לאלגוריתמים בתחום זיהוי טקסט (NLP). בניגוד אליהם, הוא מסוגל לזהות את כל הדאטה הזו בו זמנית. מטא מעמידה את הקוד לשימושה של קהילת החוקרים והמפתחים בעולם ללא תשלום.
האלגוריתם, המכונה data2vec, מציג טכנולוגיית למידת מכונה מונחית עצמית, כלומר הוא אינו דורש אימון על ידי תיוג דוגמאות אלא לומד מתוך כמות עצומה של נתונים שנצברים במאגרי הנתונים שלו. "האלגוריתם מקרב אתנו לבניית מכונה שלומדת בעצמה על היבטים שונים של העולם סביבה, והוא יאפשר לפתח בינה מלאכותית מותאמת שאנו מאמינים שתאפשר לבצע משימות שלא ניתן לבצען היום", נאמר בפרסום של החברה.
גישת הלימוד מונחה עצמית מאפשר לטכנולוגיה ללמוד את הסביבה על ידי התבוננות, לקלוט מידע ולעבד קטעי קול, תמונה או טקסט בצורה מתקדמת, גם מבלי "לאמן" אותה לעשות זאת
במטא אומרים שהאלגוריתם החדש יוכל לשמש תשתית לפיתוח מוצרים כמו משקפי מציאות רבודה (AR) שיסייעו לספורטאים לנתח ביצועים, מכונות שיבצעו פעולות מורכבות כמו אפייה על בסיס וידאו, אודיו וטקסט, ועוד. האלגוריתם החדש של מטא יאפשר לפתח מערכות AI שיפעלו בפלטפורמת המטאוורס, שהחברה מצפה כי תחליף את המדיה החברתית הנוכחית. יישום האלגוריתם על ידי מפתחים רבים יסייע למטא להפוך את הפלטפורמה שלה למובילה על החברות המתחרות.
מערכות למידת מכונה קיימות מוגבלות לעיבוד על בסיס המידע שעליו אימנו אותן. חוקרים יצרו מערכי נתונים גדולים לזיהוי דיבור וטקסט באנגלית, למשל, אך לא ניתן להשתמש בהם לכל השפות הקיימות בעולם. גישת הלימוד מונחה עצמית מאפשר לטכנולוגיה ללמוד את הסביבה על ידי התבוננות, לקלוט מידע ולעבד קטעי קול, תמונה או טקסט בצורה מתקדמת, גם מבלי "לאמן" אותה לעשות זאת. המכונה לומדת על ידי בחינה ישירה של הסביבה, ומתקרבת לדרך בה לומד אדם, שקולט דיבור, טקסט ותמונה בו בזמן ומבין את העולם סביבו.