抖音走出的AI科学家:U航与百万“电子股东”共创人脸机器人革命
(文/刘媛媛 编辑/周远方)
聚光灯下,一位年轻的95后科技创业者站在领奖台上。他身后的大屏幕中,名为“Emo”的人脸机器人正对着观众微笑。该表情并非预设程序,而是机器人通过AI预测人类情绪后,同步生成的“共情反应”。
这位获奖者,正是抖音精选科技创作者“U航”(本名胡宇航)。他带来的《人机面部协同表达》不仅斩获WAIC青年优秀论文奖(提名奖),更让公众看到了一种可能:当冰冷的机械被赋予“表情灵魂”,人机交互的边界正在被重新定义。
而更令人惊叹的是,这项前沿技术的诞生,竟与抖音评论区里百万网友的“脑洞”息息相关。自今年5月U航在抖音账号首发“Emo”后,引发了不少网友的追更,系列视频总播放量达到约1.5亿次,每条视频下都有网友认真讨论未来应用场景,为其提供专业的建议和天马行空的灵感。
当一台机器人能在你微笑时同时扬起嘴角,能在你皱眉时同步泛起眉间褶皱,它就不再是冰冷的机械,而是能感知情绪的“伙伴”。这不是科幻电影的场景,而是哥伦比亚大学博士、首形科技创始人U航带着“人脸机器人Emo”交出的答卷。
U航是一位实打实的硬核科技青年,他的“硬核”,刻在学术基因里。作为国家地方共建人形机器人(上海)创新中心特邀开发者,他的科研之路始终站在人工智能与机器人领域的前沿。
在哥伦比亚大学读博期间,他的研究就瞄准了一个核心命题:如何让机器人摆脱 “表情僵硬”“交互机械”的传统困境。彼时,学界对人脸机器人的探索常困于“恐怖谷效应”,即越像人却越显诡异,根源在于机器人只会被动模仿,无法理解 “情绪为何发生”。于是U航另辟蹊径,决心让机器人不仅要“会做表情”,更要“懂何时做表情”。
而这个想法背后,是扎实的学术积累。其研究成果多次登上全球顶级期刊,关于机器人运动控制算法优化、人工智能深度学习模型的创新等,得到学界高度认可,并被《纽约时报》《New Scientist》等权威媒体聚焦。
2024年,U航正式开始创业,探索将实验室的突破推向产业的可能性。短短数月,这个专注研发人脸机器人技术的团队,就吸引了众多来自全球顶尖学府的研发人才。他的目标很明确,就是要打破传统机器人“表情不自然、交互不灵活”的痛点,让机器真正融入人类社交。
第一套密码是“预判式共情”。传统机器人的表情多是“指令-动作”的机械响应,而Emo可以通过分析人类面部的微表情,从挑眉幅度、嘴角张力等细节中,预判下一秒的情绪爆发。就像人类能从朋友的眼神里读懂“即将大笑”,Emo能在你露出微笑前840毫秒,提前调动面部执行器,让嘴角以自然的弧度上扬。
第二套密码是“自我建模”。U航让Emo对着摄像头做随机动作,在千万次“自我观察” 中学习“指令与表情”的对应关系。如同人类对着镜子练习微笑,逐渐摸清“想笑就调动苹果肌,皱眉就收紧眉间肌”的肌肉记忆。这种“自主学习”能力,让Emo的表情更为生动。
“既然AI算法正从工具属性向人际交流属性转变,终端硬件就不该只是冰冷的外壳或屏幕。”U航表示,硬件需要更具象化,解决人和机器面对面交流的问题,让人类未来能与AI乃至AGI实现面对面互动。而未来人形机器人的一大核心价值,正是落在情绪交互上。
不难看出,在这个AI加速重塑世界的时代,U航这样的硬核科技青年,正用技术与情感的融合, 对“机器人”进行重新定义。
与平台共创,让创新走出封闭的实验室
这些来自生活的智慧,让机器人的进化始终扎根于真实需求。助推其系列视频总播放量达到约1.5亿次,并多次登上抖音热榜,不断点燃着社区的科技互动氛围。
“抖音为我提供了共创的平台,跟网友互动给了我很多灵感。”U航向观察者网透露,从内容创作者到科技创业者,不同视角让自己有了更大的成长。
“我觉得从研究者到科技创业者,再到抖音创作者,三者是相辅相成的,做研究能为创业提供技术基础,创业能为研究提供载体,再通过这个载体获得融资、组建团队。而在社交平台上发布内容进行宣传,能认识很多人,也能被有需求的人认识,还能得到不同的批评和看法,这些都能进一步促进研究和创业。”在U航看来,用内容创作者的思维,反而能更好地理解技术的成果转化,更好地和未来的用户沟通。
据了解,抖音正成为越来越前沿和活跃的科技社区以及科技新星的孵化器。过去一年,科技科普类内容播放量增长175%,每天约8400万人在抖音观看深度前沿科技内容,有5成为30岁以下年轻用户。
用户对AI的关注也带动创作者们持续投稿,过去一年4680万人在抖音投稿讨论人工智能,产出2.2亿条内容。
当科研拥抱大众智慧,技术才能真正“活”起来。未来的创新,应该属于每一个同行者。
1、“中国电动汽车帮助尼泊尔改善空气质量,为发展中国家带来新希望”
3、多部门向天津、河北调拨4.4万件中央救灾物资,河北省救灾物资管理办法