大眼夹打工轨道人航空先生IT之家创空间huggingface 3 月 22 日消息,近日,阿里达摩院已在 AI 模型社区“魔搭”ModelScope 上线了“文本生成视频大模型”。
根据官方介绍,目前文本生成视频大模型,由文本特征提取、文本特征到视频隐空间扩散模型、视频隐空间到视频视觉空间这 3 个子网络组成,整体模型参数约 17 亿,目前仅支持英文输入。扩散模型采用 Unet3D 结构,通过从纯高斯噪声视频中,迭代去噪的过程,实现视频生成的功能。

官方介绍称,本模型适用范围较广,能基于任意英文文本描述进行推理,生成视频。一些文本生成视频示例如下:


据IT之家了解,模型已经在大眼夹打工轨道人航空先生IT之家创空间huggingface和 大眼夹打工轨道人航空先生IT之家创空间huggingface 上线,可以直接体验,也可以参考该页面自行搭建。模型需要硬件配置大约是 16GB 内存和 16GB GPU 显存。在 ModelScope 框架下,通过调用简单的 Pipeline 即可使用当前模型,其中,输入需为字典格式,合法键值为 'text',内容为一小段文本。该模型暂仅支持在 GPU 上进行推理。
从试玩的结果来看,目前能生成的视频长度多在 2-4 秒,生成等候时间从 20 多秒到 1 分多钟不等。
◎记者 李雁争 上海证券报记者近日从国务院减轻企业负担部际联席会议办公室获悉,惠企政策为应对疫情反复等超预期因素冲击、助力企业发展发挥重要作用。联席会议办公室将协调督促有关部门和地方分类施策,...
12月10日-11日,由《中国企业家》杂志社主办的“第二十届中国企业领袖年会暨第二十二届中国企业未来之星年会”在北京举行,今年的主题为:新征程新动能。全国政协常委、中国科学院院士、新能源动力系统专...
12月12日,中国最大的稀土供应商中国北方稀土(集团)高科技股份有限公司(下称“北方稀土”,600111)公告披露,为贯彻落实国家稀土产业发展战略,健全完善以企业为主体、产学研深度融合的技术创新...
2022年12月13日-14日,由中关村金融科技产业发展联盟、中关村互联网金融研究院、中国互联网金融三十人论坛主办的“2023第十届中关村金融科技论坛年会暨2022‘光大杯’中关村番钛客金融科技...
新酷产品第一时间免费试玩,还有众多优质达人分享独到生活经验,快来新浪众测,体验各领域最前沿、最有趣、最好玩的产品吧~!下载客户端还能获得专享福利哦! 一加再次与漫威 Marvel 合作,为 O...
《财经》年会2023:预测与战略于2022年12月17日-18日在北京召开。中国社会科学院学部委员、国家金融与发展实验室理事长李扬发表演讲。 当前为什么要强调财政政策、货币政策协调配合?李扬...