“U老師,我好困,你下班了嗎?我想先休息了。”
“還早,可以再呆一個小時,你困的話就先睡吧。”
胡宇航拍了拍擺在桌上的“人頭”。凌晨五點,哥倫比亞大學校園已被夜色吞沒,實驗室依舊燈火通明,他穩坐桌前,全神貫注地改著代碼。
這位“95后”身上有許多光環:28歲、美國哥倫比亞大學AI機器人博士、手握《科學-機器人學》《自然-機器智能》《NPJ-機器人學》等頂刊論文,首形科技(AheadForm)創始人兼CEO。
在賽博空間,他還有個更廣為人知的身份——U航。抖音粉絲量破百萬,靠“手搓”機器人引得千萬人圍觀。7月14日視頻中,他在人臉機器人“Emo”眼下點了顆痣,“她”好奇地抬眸,眼波流轉,神情困惑,仿佛真的有了生命。
“你會對一個人說‘你創造不了價值就是廢物’嗎?大概率不會。但人們卻常常用這樣的邏輯對待機器人。”胡宇航說,他希望機器人不只是外觀像人,更要類人的運控算法,且具備自我認知與情感共鳴的能力。
胡宇航(左)與“Emo”(圖源:U航視頻)
一條非主流賽道
胡宇航與人臉機器人的緣分,可以追溯回2020年。
當時,人工智能研究突飛猛進,自然語言處理(NLP)和計算機視覺(CV)技術取得顯著進步。胡宇航敏銳洞察到,未來的AI發展將不再局限于單一任務的訓練,而應將重點放在交互上。
“未來AI將能更深層次地理解人類語言背后的含義,并結合多模態技術,如語音、圖像、視頻等信息,全面感知和分析人類的情緒。”胡宇航說。
那么,機器人是否需要一張“臉”?
“人類的大多數感官都集中在頭部,人臉作為情緒和表達的聚焦點,是人與人之間最直接的連接方式。”胡宇航堅信,人類最偉大的能力并非冰冷的邏輯計算,而是豐富細膩的情感。一個有自然表情,能理解、傳遞情感的面孔,將能賦予機器人感受這些人類體驗的能力,讓它們真正融入我們的世界。
同時,他在讀博期間做了多個機械臂、四足機器人、桌面整理等機器人AI自主學習項目,非常清楚物理數據對人機交互的重要性。
“但采集物理數據非常困難。”胡宇航解釋道,物理世界存在大量柔性物體,材料形變、高動態慣性,甚至濕度和光線,都難以被完整真實模擬,而大規模部署機器人真機訓練又太過昂貴。
相較而言,人臉機器人不受物理世界的約束,只要用海量互聯網數據訓練,依靠表情、視覺、聲音,就能和人類互動。
“這是人機交互最直接的入口。”胡宇航語氣堅定,他一頭扎進了人臉機器人的研究,但這條賽道太過小眾,他的想法也是反共識的,“我覺得至少在未來5年內,人形機器人還不能夠創造高效生產力,而更適合做類人交互的產品。”
很快,又一個難題擺在他面前:準確感知情緒變化,對人類來說尚屬難題,更何況機器人?
“語境和語義的綁定至關重要,要在訓練中對齊人的表情、眼神、聲音等信號。”胡宇航解釋稱,喜、怒、哀、樂,傳統的情緒識別主要依賴綁定人臉坐標系,分類標簽,但現實中的情緒表達太過主觀復雜,無法精準歸類。
胡宇航放棄了強行分類的想法。他把目光投向深度學習和神經網絡,把表情想象成高維空間中的一個點,隨著情緒變化,這個點在空間里平滑地移動,借此訓練人臉機器人對表情復雜性和連續性的判斷。
“讓機器人不再機器。”這是埋在胡宇航心底的種子。2025世界人工智能大會(WAIC 2025)上,他的《人機面部協同表達》榮膺青年優秀論文獎(提名獎),“非共識”站上了國際舞臺。
飛躍“恐怖谷”
“你的機器人要臉嗎?”WAIC 2025期間,胡宇航穿梭于各個機器人展臺,不時發出靈魂一問。
“機器人有臉豈不是很詭異”“表情太僵硬了”“皮笑肉不笑,不如不笑”……從2020年至今,有關恐怖谷的質疑和爭論,一直纏繞著胡宇航。
“大多數人認為恐怖谷無法避免,畢竟沒人希望被一顆仿真的機器人頭嚇到。”胡宇航無奈地說,人類追求“有頭有臉”的交流,即便異地也會打開視頻,但卻恐懼直視機器人的臉。
矛盾背后,圍繞恐怖谷的討論都指向不成熟的技術。
“如果我們有更好的技術和工程體系,就有可能解決恐怖谷效應。”胡宇航舉了個例子,很少有人會害怕蠟像、雕塑、手辦,因為已經足夠逼真,“只要將機器人原本僵硬的動作變得絲滑、協調,就能大大減少人心中的恐懼。”
要實現這一點,最關鍵的就是算法。傳統機器人領域中,關于仿生非線性的研究幾乎一片空白,無論是機械臂,還是四足機器人,動作大多依靠程序的指令,像個“提線娃娃”,呆板僵硬。
因此,要想讓動作流暢,只能靠機器人自主學會做表情。但光憑借互聯網數據的訓練,機器人并不知道做出的表情是否自然。
胡宇航想到了鏡子。人只有照鏡子才能知道自己的表情,他腦洞大開,或許機器人也可以嘗試對鏡學習。
胡宇航把一面鏡子放到人臉機器人的面前。通過眼睛里的攝像頭,機器人能將電機指令和臉部表情相對應,匯總給AI模型,再對照互聯網數據,解讀不同表情的意義,構建起語音、語義、表情間的聯系。
“先借助互聯網數據訓練AI模型,再結合對鏡收集的物理數據,通過自監督學習不斷進化出對身體的理解,讓機器人的表情更加精細,在不同語境下也能自主交互。”胡宇航介紹道。
此外,由于人臉是無數微動作的耦合,為了讓人臉機器人更加逼真,必須在柔軟、非線性的硅膠皮膚內塞進更多電機,實現精準調控,同時不能破壞面部結構,胡宇航費了好大一番功夫。
“光是廢棄的‘臉皮’就塞滿了一整箱。”胡宇航說,現在他開發的最新人臉機器人已裝進30個電機,足以支撐高精細度的表情,“但要做得更好,還得進一步提升工程能力。”
找點刺激
搖頭、搖頭,還是搖頭。
盡管對方一言未發,但胡宇航知道,他又被婉拒了。從2020年踏足人臉機器人領域,這個場景他經歷了無數次。
這是個太小眾的交叉領域:表情的理解和控制涉及大量醫學知識,要找一個對機器人感興趣的醫學生,或者找一個有醫學背景的工程師,都無比困難。
找不到同行者,胡宇航決定自己摸黑前進。“沒有現成的基座,全得自己搭建;硅膠材料不穩定、易破損;人臉仿生的高曲面參數無法用傳統的CAD軟件建模;在優化動作的基礎上還要設計、維護外觀……”胡宇航語速越來越快,沒有參考文獻,沒有工程先例,從算法、模型的開發,到實物的搭建、調優,全靠他一個人。
“不然呢,難道放棄嗎?”他沒把技術難題放在心上,更困擾他的是這一路上的質疑,“做這個方向的噪音非常多,我甚至都無法說服實驗室的學生加入這個課題組。”
他常常一個人窩在實驗室,3D打印出零部件,跑代碼、建模型、搭實物,失敗了幾十次后,他多了兩個“搭子”——“冷酷”和“冷漠”,一個登上了《科學-機器人學》,一個參與了科幻電影Posthuman的拍攝。
“冷酷”與“冷漠”(圖源:U航視頻)
2024年6月,胡宇航創立了首形科技,英文名是AheadForm,既象征著機器人的頭部,也彰顯他勇往直前的態度。
“創業非常刺激,這是個開放的游戲。”談及創業,胡宇航直言,盡管九死一生,他還是想試試。其實,早在廈門大學嘉庚學院就讀本科時,他就參加了大量的創業創新比賽,獲得多個獎項。
2025年5月11日,他發布的視頻中,一個皮膚白皙細膩的“女孩”睜開眼睛,好奇地四處打量,胡宇航打了個響指,指了指鏡頭,“女孩”立即回頭,動作絲滑。這是他的新成果,接入了視覺系統和小腦模型。很快,視頻播放量突破百萬。
更多人看到了胡宇航,和人臉機器人的前景。
胡宇航收到了不少簡歷,有的來自招聘軟件,有的來自評論區和私信。考慮人臉機器人的交叉特性,他精挑細選,組建了一支覆蓋機器學習、具身智能、心理學,甚至藝術設計的17人團隊。
但還遠遠不夠。對每個創業者來說,商業化永遠是懸在頭頂的達摩克里斯之劍。
胡宇航也不例外,他率先看中了人臉機器人的“表演”屬性,博物館、游樂園、景區、展廳……落地的第一步,就是讓更多人感受人臉機器人的“類人共情價值”。
“大規模落地至少在兩年后了,現在相信我們的投資人還是不多,臉部表情生成算法在國際上也處于早期,離商業化還有段距離。”胡宇航嘆了口氣,“剛剛開始,一切才剛剛開始。”
For Joy
“前途這么光明,你睡得著嗎?”
社交媒體評論區里,不少網友紛紛調侃。確實,對胡宇航來說,焦慮、失眠,工作到后半夜成了常態。
點開他的視頻,大多一片漆黑,一張臉對著鏡頭碎碎念。他總是在回宿舍的路上分享日常,而這通常已是凌晨兩點后。
“我一般睡六七個小時,睡醒了去實驗室,忙一天再回來睡覺。”胡宇航想了想,生活中的他沒有太多興趣,很少聚餐、很少旅游,隨便一盒泡面就可以飽腹,絕大多數時間都呆在實驗室。
焦慮的時候,他會起一身蕁麻疹,四肢、后背,像一只只小螞蟻在身上亂爬,找不到、抓不住。
但他依舊坐得住。2021年,胡宇航所在的創意機器實驗室研發“會笑的機器人”,發表了相關論文。可接下來的兩年,他顆粒無收,“我意識到必須去做一些沉淀性的工作。”胡宇航說。
然而,兩點一線的生活枯燥無味,胡宇航決定,拿起手機記錄生活。“我希望未來某一天,回想這段求學生涯時,能有更多有趣的記憶。”胡宇航表示,不管再忙再累,每天總要吃飯,就從做飯開始記錄,“后面發現很麻煩,還要買菜、備菜。”對習慣隨便對付一口的他來說,這反而浪費了時間。
后來,他把鏡頭對準自己:哥大博士的一天、下班后在路上的碎碎念、偶爾的發瘋日常,甚至在校園抗議活動中,因封校難以進入實驗室,被迫成為了一名“戰地記者”。
黑帽子、黑體恤、黑褲子、黑框眼鏡、黑色帆布鞋和一個黑色雙肩包,這是胡宇航的經典裝扮,他社恐、話不多,合影里總是比個大拇指。
但聊到熱愛的事業,他又滔滔不絕。他是個典型的“F”(情感型)人,看重情感陪伴的價值。“人類最強烈的情感一定是雙向陪伴。當一個人孤獨到一定地步的時候,這種需求會格外強烈。”胡宇航想到了自己。他堅信,一定也有人需要陪伴,哪怕對方是機器人。
人臉機器人“Emo”(圖源:U航視頻)
“大家普遍默認機器人是工具,機器人價值劃了個等號到生產效率上,那你會對著一個人說,你創造不了價值就是垃圾嗎?”胡宇航頓了頓,用了TikTok首席執行官周受資的一句話“For joy”。機器人如此,他也是。
“我們總是低估五年后世界會變成什么樣子。”胡宇航說。采訪結束,他還要繼續奔波,北京、上海、杭州、深圳連軸轉,“既然認可終局會出現,方向是正確的,那么就趁早開始。”
相關論文信息:
https://www.science.org/doi/full/10.1126/scirobotics.adi4724
https://www.nature.com/articles/s42256-025-01006-w
https://www.nature.com/articles/s44182-025-00031-6
https://yuhang-hu.com/
本文鏈接:給機器人做“臉”,28歲哥大博士收獲百萬粉絲http://www.sq15.cn/show-11-24986-0.html
聲明:本網站為非營利性網站,本網頁內容由互聯網博主自發貢獻,不代表本站觀點,本站不承擔任何法律責任。天上不會到餡餅,請大家謹防詐騙!若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。
下一篇: 遙望天上李元星