现已开源 豆包 VideoWorld 视频生成模型 可仅靠视觉认知全球 (开源包是什么)

视频生成实验模型“VideoWorld”由豆包大模型团队与北京交通大学、中国迷信技术大学结合提出。不同于Sora、DALL-E、Midjourney等支流多模态模型,VideoWorld在业界初次成功无需依赖言语模型,即可认知全球。目前,该项目代码与模型已开源。

版权声明

本文来自网络,不代表本站立场,内容仅供娱乐参考,不能盲信。
未经许可,不得转载。

热门