原钉钉副总裁成立Al应用开发平台BetterYeah
“O”:视频输出。2023年,我们看到了文字到视频合成的浪潮:WALT(谷歌)、EmuVideo(Meta)、Align Your Latents(英伟达)、Pika等等,数不胜数。然而,大多数生成的片段仍然很短。我将它们视为AI视频的“系统1”——“无意识”的局部像素运动。
矢量数据库开始开发类似SQL的接口,并支持多模态。
图源备注:图片由AI生成,图片授权服务商Midjourney
HandRefiner的工作原理包括手部识别与重建以及条件修补两个过程。首先,它识别出生成图像中形状不正常的手部,并使用手部网格重建模型重建出一个正确的手部形状和手势。即使在畸形的手部图像中,HandRefiner也能够生成合理的重建结果,这得益于模型基于正常手部的训练数据。