בדל רובוטים המופעלים על ידי בינה מלאכותית לומדים תנועות שפתיים אנושיות – Securities.io
צור קשר

רובוטיקה

רובוטים המופעלים על ידי בינה מלאכותית לומדים תנועת שפתיים אנושית

mm
רובוטים מוזרים ששרים ומדברים כמו בני אדם 1

חברת Columbia Engineers יצרה רובוט המסוגל לחקות וללמוד תנועות שפתיים אנושיות במהלך דיבור. העיצוב המשודרג משלב רובוטיקה מתקדמת עם בינה מלאכותית, מה שמאפשר למכשיר - ששמו Emo - ללמוד מהתבוננות בהבעות אנושיות ולשכפל רגשות אנושיים בעת הצורך. הנה מה שאתם צריכים לדעת.

סיכום: מהנדסי קולומביה פיתחו רובוט הומנואיד המונע על ידי בינה מלאכותית המסוגל ללמוד תנועות שפתיים אנושיות מציאותיות באמצעות תצפית, ובכך לשפר באופן דרמטי את סנכרון הדיבור ואת הביטוי הרגשי.

מדוע רובוטים אנושיים מפעילים את עמק המוזרות

מאז ימי הרובוטיקה הראשונים, קיים חיפוש אחר יצירת רובוטים דמויי אדם. משימה זו קלה הרבה יותר לומר מאשר לעשות, שכן מהנדסי רובוטיקה עשו צעדים מתמשכים בכיוון זה, אך מעולם לא השיגו במלואה את מטרתם ליצור מכשיר שנראה ומרגיש כמו אדם אמיתי.

כל מי שהיה בסביבת רובוטים דמויי אדם בסיסיים ביותר יכול להעיד על אי הנוחות שהמכשירים גורמים מבחינת יכולתם להיטמע כבני אדם. אי דיוקים קלים ביותר, כמו תנועות עיניים או הבעות פנים לא טבעיות, יכולים ליצור תחושה זו אצל צופים.

עמק האונקני

הרובוטיקן היפני מסאהירו מורי שם לב לתופעה זו בשנות ה-1970. בספרו המפורסם כיום "בוקימי נו תני גנשו"(עמק האירוניה) חיבור, הוא מפרט את הקונספט. המאמר מתאר כיצד רובוטים אנושיים תמיד מגיעים לנקודה של ניתוק חד מהצופים שלהם עקב פגמים עדינים.

בשנת 1978, המונח מצא את דרכו לחוגים מדעיים מערביים דרך ספרה של יאסיה רייכרדט "רובוטים: עובדה, בדיה ותחזית,", אשר תרגם את המונח לשימוש הפופולרי שלו כיום, "עמק מוזר". עבודה זו מתבססת על הדיון של מורי, ומתארת ​​כיצד ההבדלים הקטנים ביותר יכולים לגרום לתגובות שליליות בקשר של הצופה.

פנים אנושיות הן החלק הקשה ביותר במשוואה

במהלך העשורים האחרונים, הושגו מספר אבני דרך ביצירת רובוטים דמויי אדם. טכנולוגיה חדשה, כמו תוכניות לימודים לתואר שני (LLM), מאפשרת למכשירים אלה לתקשר באמצעות שפה טבעית, מה שעוזר לגשר על הפער. עם זאת, אחד התחומים הגדולים ביותר שעדיין דורש תשומת לב רבה הוא הפנים האנושיות.

רובוטים מוזרים ששרים ומדברים כמו בני אדם

הפנים האנושיות הן תערובת מורכבת של רקמות, עצבים ושרירים המסוגלת להפגין אלפי הבעות שונות, שרבות מהן עוזרות להעביר רגשות לאחרים. באופן זה, הפנים נתפסות ככלי התקשורת האולטימטיבי.

מהנדסי רובוטיקה הכירו זה מכבר בחשיבות ובקושי ביצירת פנים רובוטיות הפועלות כמו בני אדם. באמצעות שנים של עבודה קשה, רובוטים הצליחו להשיג פנים שנראות אנושיות, עם עור והבעות. אך למרות מיליארדי מחקרים, הקשר עדיין חסר.

החלק כדי לגלול →

מאפיין פנים אנושיות רובוטים דמויי אדם מסורתיים מערכת שפתיים AI של קולומביה
מורכבות שרירים 30+ שרירי פנים בתנועה רציפה מנועים מוגבלים עם אילוצים נוקשים 26 מנועים עם מפרק סיליקון רך
סנכרון שפתיים-שמע סינכרון טבעי במהלך דיבור תנועות מוגדרות מראש, לעיתים קרובות מתעכבות נלמד באופן דינמי באמצעות בינה מלאכותית מחזון לפעולה
ביטוי רגשי מיקרו-ביטויים עדינים ומודעים להקשר הבעות מינימליות או מוגזמות רמזים קוהרנטיים רגשית בשפתיים ובפנים
הסתגלות לומד באופן רציף דרך אינטראקציה ספריות תנועה סטטיות שיפור עצמי באמצעות למידה תצפיתית
אפקט העמק המופלא ללא חתימה אי נוחות גבוהה לצופה תגובה מוזרה מופחתת משמעותית

חשיבותן של השפתיים בתקשורת

רובוטים נתקלים שוב ושוב בבעיה משמעותית אחת בעת יצירת מכשירים דמויי אדם - כמעט בלתי אפשרי לשחזר תנועת שפתיים. השפתיים שלך עושות יותר מאשר לכוון את צליל הקול שלך ולעזור לך לבטא מילים.

השפתיים שלך למעשה מפגינות רגש ברמה עדינה, אשר, לאורך אלפי שנות אבולוציה, הפכה חיונית לתקשורת האנושית. ראוי לציין שתנועות השפתיים שלך הן אחת התכונות הממוקדות ביותר של הפנים שלך במהלך שיחות. כתוצאה מכך, המוח שלך מקדיש יותר כוח חשיבה למחוות אלה מאשר פעולות אחרות כמו כיווץ המצח או קריצה.

שפתיים של רובוטים נראות לא טבעיות

למרות שרובוטים השיגו את היכולת להיראות כמעט אנושיים, עדיין חסרה להם הבעת פנים שפתיים. עשרות שנים של מחקר הוכיחו כי הטכנולוגיה שתשיג את הסנכרון המתאים בין שפתיים לשמע, הנדרש ליצירת התנהגות מציאותית, אינה קיימת. ככאלה, נראה כי רובוטים תמיד מדובבים את שיחותיהם ולא מדוברות. אפקט הקול המדובב הזה גורם למכשירים אלה להיראות מגושמים וחסרי חיים.

באופן חד משמעי, פנים אנושיות מסתמכות על עשרות שרירים כדי ליצור תגובות רגשיות, ולשפתיים רובוטיות אין עדיין רמת מורכבות כזו. יידרש סוג חדש של עיצוב כדי להשיג רמת מורכבות זו. בנוסף, רוב תנועות השפתיים הרובוטיות הן תנועות מוגדרות מראש שנקבעו כדי להתאים לשידורים קוליים מסוימים ולא תנועות שנועדו ליצור את המילה באופן טבעי. מכיוון שרובוטים אינם באמת מפיקים את הצליל עם שפתיהם, התנועות נראות לא טבעיות ומוזרות.

מחקר קולומביה: לימוד רובוטים לתנועת שפתיים ריאליסטית

למרבה המזל, צוות של מהנדסי קולומביה אולי גילה כיצד לחצות את העמק המוזר. ה"לימוד תנועות שפתיים ריאליסטיות עבור רובוטים בעלי פנים אנושיות¹מחקר " מציג סוג חדש של פנים רובוטיות המתמקדות בעיקר בתנועת שפתיים וסנכרון.

חומרה מיוחדת

אחת המכשולים העיקריים שהצוות היה צריך להתגבר עליהם הייתה הנוקשות של הפרצופים הרובוטיים של ימינו. בעוד שהיו עיצובים חדשים רבים המספקים תגובות מונעות על ידי מנוע בפנים, אף אחד מהם לא יכול לתמוך במורכבות הנדרשת כדי לאפשר תנועות שפתיים ריאליסטיות.

כדי להתגבר על מגבלה זו, המהנדסים השתמשו בשפתיים מסיליקון שנבנו במיוחד כדי לספק הבעה מקסימלית. לאחר מכן, הם שיבצו 26 מנועים לפנים, שנאי פעולה לפנים ואוטו-מקודד וריאציוני (VAE).

חזון לפעולה (VLA)

בליבת פריצת הדרך הטכנולוגית הזו עומד מודל הבינה המלאכותית "מראייה לפעולה". באמצעות מודל זה, פנים רובוטיות יכולות ליצור באופן אוטונומי שפתיים מציאותיות שאינן מסתמכות על הגדרות מכניות מוגדרות מראש לתנועה.

כדי ליצור את המודל, הצוות השתמש בשיטות למידה תצפיתיות. סגנון תכנות זה מאפשר למכשיר לקבוע דינמיקה מדויקת של שפתיים במהלך דיבור בזמן אמת. לפיכך, הצעד הראשון היה להזין את האלגוריתם לצינור למידה בפיקוח עצמי.

מקור - קולומביה

שלב זה דרש מהמהנדסים להציב את פני הרובוט מול מראה ולהורות לו ליצור אלפי פרצופים. פעולה זו אפשרה לאלגוריתם ללכוד את יכולות הבעת הפנים שלו. משם, הרובוט צפה בשעות של תוכן יוטיוב.

השילוב של אודיו ותנועת שפתיים עוקב בקפידה ושימש לתכנות אלגוריתם הבינה המלאכותית של שפתי הפנים של הרובוט. במשך מספר ימים, הרובוט למד בדיוק כיצד פניו צריכות להיראות מהבעת פנים אנושית במקום להשתמש בפרמטרי קלט. לאחר מכן, המהנדסים הוסיפו אודיו והחלו בבדיקות.

כיצד נבדקה הבינה המלאכותית Lip-Sync בשפות שונות

הצוות בדק את התיאוריה שלהם על פני 10 שפות והקשרים לשוניים שונים. המבחן השתמש בשפות חדשות לחלוטין למודל, מה שהבטיח שיהיה עליו לחשב את הבעות הפנים ותנועות השפתיים הנכונות לעומת זכירת מילים שאומנו בעבר. מעניין לציין, שהמבחן השתמש גם בהקשר ובשירים.

תוצאות מבחן הרובוטים המוזרים

תוצאות הבדיקה הראו סנכרון ויזואלית קוהרנטי בין שפתיים לשמע בכל רחבי המכשיר. ראוי לציין כי הרובוט, המופעל על ידי אלגוריתם, סיפק תנועת שפתיים ריאליסטית שתאמה במדויק מספר קטעי שמע. באופן מרשים, הוא סנכרן בהצלחה את תנועות השפתיים שלו ב-10 שפות ואף שר שיר מאלבום הבכורה שלו, שנוצר על ידי בינה מלאכותית. שלום עולם_.

ראוי לציין כי הצוות מצא כמה מגבלות בטכנולוגיה. ראשית, הרובוט לא היה מסוגל לשחזר באופן עקבי תנועות שפתיים קשות הקשורות למילים כמו "pop". הוא גם התקשה עם מילים מקומטות כמו "whistle". המהנדסים ציינו בחדות כי פגמים קטנים אלה יסתדרו מעצמם ככל שהאלגוריתם ישתפר עם הזמן. תכונת הלמידה העצמית הזו היא ההיבט הטוב ביותר של האלגוריתם. הוא ישתפר ללא הרף ככל שהוא יאסוף יותר נתונים מבני אדם לאורך זמן, ויפתח את הדלת לאינטראקציות משמעותיות יותר בין אדם למכונה בעתיד.

יתרונות עיקריים של רובוטיקה דמוית אדם ריאליסטית

ישנם מספר יתרונות שהטכנולוגיה הזו מביאה לשוק. ראשית, היא תאפשר לבני אדם ליצור קשר עמוק יותר עם מכונות. רוב האנשים אינם מודעים לכמות התקשורת המתרחשת באמצעות הבעות פנים באופן תת-מודע.

מחקר זה פותח את הדלת לטכנולוגיית ליפסינק ובינה מלאכותית לשיחות כדי ליצור חוויות אנושיות שיכולות לסייע במאבק במגפת הבדידות ועוד. באמצעות טכנולוגיה זו, רובוטים אנושיים יוכלו להתקרב צעד אחד לחציית עמק המוזר ולדחוף את הרובוטיקה לרמה חדשה.

יישומים וציר זמן בעולם האמיתי

ישנם יישומים רבים לטכנולוגיה זו המשתרעים על פני מספר תעשיות. השימוש הברור של טכנולוגיה זו הוא לסייע בקידום טכנולוגיית רובוטיקה אנושית. היכולת להקרין פנים רכות וחמות על רובוטים קרים יכולה לסייע בקידום אימוץ. הנה כמה יישומים נוספים שכדאי לחשוב עליהם.

טיפול בקשישים

למרות שהם לא נחשבים לאנשים הכי מביני טכנולוגיה, קשישים החלו לאמץ את הרובוטיקה ברמה חדשה לגמרי. שוק הרובוטים המסייעים לטיפול בקשישים נמצא במגמת עלייה, עם סטטיסטיקה מה שמראה שהוא הגיע ל-3.38 מיליארד דולר בשנת 2025. אותם דיווחים צופים שהוא יעבור את 9.85 מיליארד הדולר עד 2033.

קשישים היו מוכנים יותר לתקשר ולקבל רובוטים אם הם לא היו נראים מסובכים מבחינה טכנולוגית. ככזה, עוזר רובוטי שיכול לתקשר באמצעות דיבור לצד תנועות פנים מציאותיות יכול להיות ההתאמה המושלמת. חולים קשישים יוכלו למצוא קשר לצד סיוע נחוץ מאוד.

בידור

תעשיית הבידור עשויה להיות בין הראשונים לאמץ טכנולוגיה זו. יוצרי סרטים מסתמכים במידה רבה על רובוטיקה בתעשיית הבידור של ימינו. החל מאנימטרוניקה כמו זו המשמשת בפארקי שעשועים כמו דיסני ועד רובוטים ללכידת תנועה המשמשים בסרטים גדולים, המכשירים דחפו את תעשיית הבידור קדימה.

מגזר הרובוטים הבידוריים של ימינו עובר את היקף ה-4.72 מיליארד דולר. ערך זה צפוי לגדול ל-26.94 מיליארד דולר עד 2034, הודות לביקוש גובר לדמויות CGI ריאליסטיות. בעתיד הקרוב, טכנולוגיה זו עשויה למלא את הנישה הזו, ולאפשר לשחקנים לשתף את פניהם עם דמויות בדרכים חדשות וישירות יותר.

חינוך

מגזר החינוך הוא מקום נוסף שבו טכנולוגיה זו יכולה לשגשג. כאן, ניתן יהיה להגדיר את המכשירים הללו כמורים פרטיים. כבר עכשיו, חלקם... דיווחים הראו שתלמידים השיגו שיפור של 30% בהבנת המתמטיקה באמצעות שיעורים המותאמים לרובוטים.

ציר זמן לאימוץ

אתם יכולים לצפות לראות את הטכנולוגיה הזו מתחילה לחלחל לחיי היומיום בתוך 5-10 השנים הקרובות. רובוטים כבר נמצאים במפעלים ובמקומות עבודה רבים, והשילוב צפוי רק לעלות. רובוטים מבינים ששילוב טכנולוגיה מסוג זה יכול לעזור להפוך את המכשירים שלהם לנגישים יותר.

חוקרים מרכזיים בקולומביה

המחקר התארח על ידי מעבדת המכונות היצירתיות של קולומביה. המאמר מפרט את יוהאנג הו, ג'יונג לין, יהודה אלן גולדפדר, פיליפ מ. ווידר, יפנג קאו, סטיבן טיאן, יונז'ה וואנג, ג'ינגרן וואנג, מנגמנג וואנג, ג'י זנג, קמרון מהלמן, ינגקה וואנג, דלין זנג, בויואן צ'ן והוד ליפסון כתורמים.

מה יקרה הלאה עבור רובוטים דמויי אדם

הצוות ימקד כעת את ממוקדו בשכלול נוסף של האלגוריתם. שלב זה יכלול יותר אינטראקציות אנושיות ואף עשוי להתפתח ליחידות מרובות המסוגלות ללמוד בזמן אמת ולשתף את הנתונים הללו עם מודל מרכזי.

השקעה בחדשנות רובוטית

תעשיית הרובוטיקה היא מגזר מהיר שחווה צמיחה משמעותית בחמש השנים האחרונות. הכנסתן של טכנולוגיות חדשות כמו תואר ראשון במשפטים ומדפסות תלת-ממד סייעה להניע חדשנות לרמות חדשות. למבט מקיף על הזדמנויות השוק הרחבות יותר, קראו את המדריך שלנו בנושא השקעה בבינה מלאכותית פיזית וברובוטים אנושיים בשנת 2026.

הנה חברה אחת שהייתה בחזית המהפכה הזו.

תרדיאן (36 מיליארד דולר)

Teradyne, Inc. (TER ) היא חברת האם של Universal Robots (UR), מובילת השוק בתחום ה"קובוטים" (רובוטים שיתופיים). בעוד שטראדיין אינה בונה פרצופים אנושיים, היא כיום השחקנית המובילה בהבאת הבינה המלאכותית "צפה ולמד" שתוארה במחקר של קולומביה לרצפת הייצור.

באופן מכריע, Teradyne יצרה שותפות אסטרטגית עם Nvidia (NVDA ) לשלב את פלטפורמת "Isaac Manipulator". זה מאפשר לרובוטים של Teradyne להשתמש במצלמות בינה מלאכותית כדי "לראות" את סביבתם ולהתאים באופן דינמי את מסלולם - בדומה לרובוט האמו שלומד להתאים את שפתיו - במקום להסתמך על קוד נוקשה שנכתב מראש.

(TER )

ביצועים והערכה לשנת 2026: Teradyne נחשבת באופן נרחב למניית רובוטיקה "בלו צ'יפ". מנייתה זינקה בכמעט 50% בשנת 2025 והמשיכה לעלות בתחילת 2026, ונסחרה בסביבות טווח של 230 דולר.

אזהרת משקיעים: בעוד שהמומנטום חזק, אנליסטים מציינים כי TER נסחרת כעת בפרמיית שווי גבוהה (מעל פי 70 מכפיל רווח). המניה מהווה הימור ששילוב בינה מלאכותית יעורר מחזור שדרוג חומרה מסיבי בייצור, אך היא נושאת סיכון תנודתיות משמעותי בהשוואה למניות תעשייתיות מסורתיות כמו דיר או קטרפילר.

חדשות וביצועים אחרונים של Teradyne (TER)

סיכום

הכנסתם של פרצופים רובוטיים מציאותיים הגיונית לחלוטין. כיום בעלי תואר ראשון במשפטים מסוגלים לשכפל דיבור אנושי, וכאשר הם משולבים עם הבעות פנים מציאותיות, מכשירים אלה יספקו רמה חדשה של הכשרה, למידה, שירותי בריאות ועוד. לעת עתה, הצוות יתמקד בתיקון פגמים ובמציאת שותפים אסטרטגיים ומימון.

למדו על פריצות דרך מגניבות נוספות בתחום הרובוטיקה כאן.

הפניות

1. יוהאנג הו et al.לימוד תנועות שפתיים ריאליסטיות עבור רובוטים עם פנים דמויי אדם. מדע רובוטיקה 11, eadx3017 (2026). DOI:10.1126/scirobotics.adx3017

דיוויד המילטון הוא עיתונאי במשרה מלאה וביטקוין ותיק. הוא מתמחה בכתיבת מאמרים על הבלוקצ'יין. מאמרים שלו פורסמו במספר פרסומי ביטקוין כולל Bitcoinlightning.com

גילוי מפרסם: Securities.io מחויבת לתקני עריכה מחמירים כדי לספק לקוראים שלנו ביקורות ודירוגים מדויקים. אנו עשויים לקבל פיצוי כאשר תלחץ על קישורים למוצרים שבדקנו.

Esma: CFDs הם מכשירים מורכבים ומגיעים עם סיכון גבוה להפסיד כסף במהירות עקב מינוף. בין 74-89% מחשבונות המשקיעים הקמעונאיים מפסידים כסף במסחר ב-CFD. עליך לשקול אם אתה מבין כיצד פועלים CFDs והאם אתה יכול להרשות לעצמך לקחת את הסיכון הגבוה של אובדן כספך.

כתב ויתור על ייעוץ השקעות: המידע הכלול באתר זה ניתן למטרות חינוכיות, ואינו מהווה ייעוץ השקעות.

כתב ויתור על סיכון מסחר: יש רמה גבוהה מאוד של סיכון הכרוכה במסחר בניירות ערך. מסחר בכל סוג של מוצר פיננסי כולל מט"ח, CFDs, מניות ומטבעות קריפטוגרפיים.

סיכון זה גבוה יותר עם מטבעות קריפטו בגלל שהשווקים מבוזרים ואינם מוסדרים. עליך להיות מודע לכך שאתה עלול להפסיד חלק ניכר מתיק ההשקעות שלך.

Securities.io אינו ברוקר רשום, אנליסט או יועץ השקעות.