啊,刷爆外网的 EMO 模型它终于来了!!!
上传一张照片,就能让照片里的人开口唱歌、说话、甚至讲段子。试了一下,效果还是相当不错,嘴型对得也很好,不愧是阿里出品的。
它能够根据单一的参考图像和音频输入,直接生成具有丰富表情和多样头部姿势的虚拟角色视频,实在太好玩了。
那在哪玩呢?由于内测太过火爆了,目前已经全量上架到通义千问 App 上,大家手机下载即可玩,快耍起来!
先来试试,我们先用 AI 生成一张**姐的照片(这里我从网上直接找了一张),不错,真好看!你们喜欢看什么,我能不知道嘛?
然后点击频道->全民舞台,点击选择你想要生成的舞蹈,然后上传半身/全身照即可。
目前生成需要等待 10 分钟到 60 分钟不等,看具体的舞蹈与照片,但实际上并没有花费这么长的时间就能够完成。
最后来看看成片吧!虽然明显还是能看出来肢体僵硬,但是效果已经算不错了,还会眨眼,手势动作幅度还是有跟上。
,时长00:09
我们再来试试全面唱演,通上面一样选择你想生成的音频(有爆款热歌、影视热梗、表情包三种类型可选),然后上传一张大头照即可。
最近雷总小米 Su7 火得一塌糊涂,让他为我唱首《野狼Disco》,合情合理吧。不得不说,雷总真是越老越帅。
等待生成即可,整个片段时间较长,而且还要对嘴型,这个等待的时间比较久,足足花了四五十分钟,等得我花儿都谢了,玩得人实在太多。
EMO 模型的上线,是 AI 技术在视频生成领域的又一个重大飞跃。EMO 模型为全球的技术开发者、艺术家、教育工作者和普通用户提供了创新的工具和平台,为全球用户提供了一个功能强大、操作简便、应用广泛的视频生成工具,让不会跳舞、不会唱歌的普通人,上传一张自己的照片就能够实现舞蹈梦、歌唱梦。
技术改变生活,在 AI 上更是夸张,AI 每天都在改变世界。
本文转载自,作者: