當前位置:首頁 > 當日新聞快報 > 正文內容

Online Casino:阿里达摩院低调上线文本生成视频大模型:仅支持英文输入,已开放试玩

admin3年前 (2023-03-23)當日新聞快報144
感谢IT之家网友 大眼夹打工轨道人航空先生IT之家创空间huggingface、大眼夹打工轨道人航空先生IT之家创空间huggingface、大眼夹打工轨道人航空先生IT之家创空间huggingface 的线索投递!

大眼夹打工轨道人航空先生IT之家创空间huggingface 3 月 22 日消息,近日,阿里达摩院已在 AI 模型社区“魔搭”ModelScope 上线了“文本生成视频大模型”。

根据官方介绍,目前文本生成视频大模型,由文本特征提取、文本特征到视频隐空间扩散模型、视频隐空间到视频视觉空间这 3 个子网络组成,整体模型参数约 17 亿,目前仅支持英文输入。扩散模型采用 Unet3D 结构,通过从纯高斯噪声视频中,迭代去噪的过程,实现视频生成的功能。

Online Casino:阿里达摩院低调上线文本生成视频大模型:仅支持英文输入,已开放试玩

官方介绍称,本模型适用范围较广,能基于任意英文文本描述进行推理,生成视频。一些文本生成视频示例如下:

Online Casino:阿里达摩院低调上线文本生成视频大模型:仅支持英文输入,已开放试玩

A giraffe underneath a microwave.(一只在微波炉里的长颈鹿)

Online Casino:阿里达摩院低调上线文本生成视频大模型:仅支持英文输入,已开放试玩

A goldendoodle playing in a park by a lake.(一只金贵犬在湖边的公园玩耍)

据IT之家了解,模型已经在大眼夹打工轨道人航空先生IT之家创空间huggingface和 大眼夹打工轨道人航空先生IT之家创空间huggingface 上线,可以直接体验,也可以参考该页面自行搭建。模型需要硬件配置大约是 16GB 内存和 16GB GPU 显存。在 ModelScope 框架下,通过调用简单的 Pipeline 即可使用当前模型,其中,输入需为字典格式,合法键值为 'text',内容为一小段文本。该模型暂仅支持在 GPU 上进行推理。

从试玩的结果来看,目前能生成的视频长度多在 2-4 秒,生成等候时间从 20 多秒到 1 分多钟不等。

“Online Casino:阿里达摩院低调上线文本生成视频大模型:仅支持英文输入,已开放试玩” 的相關文章

国务院减轻企业负担部际联席会议:惠企减负政策落实效果好 将把典型做法推广到全国

  ◎记者 李雁争   上海证券报记者近日从国务院减轻企业负担部际联席会议办公室获悉,惠企政策为应对疫情反复等超预期因素冲击、助力企业发展发挥重要作用。联席会议办公室将协调督促有关部门和地方分类施策,...

中科院院士欧阳明高:预计锂离子电池全产业链全年收入将突破万亿

  12月10日-11日,由《中国企业家》杂志社主办的“第二十届中国企业领袖年会暨第二十二届中国企业未来之星年会”在北京举行,今年的主题为:新征程新动能。全国政协常委、中国科学院院士、新能源动力系统专...

中国稀土产业如何高质量发展?北方稀土与中国钢研牵头建创新中心

中国稀土产业如何高质量发展?北方稀土与中国钢研牵头建创新中心

  12月12日,中国最大的稀土供应商中国北方稀土(集团)高科技股份有限公司(下称“北方稀土”,600111)公告披露,为贯彻落实国家稀土产业发展战略,健全完善以企业为主体、产学研深度融合的技术创新...

袁雨来:用科技创造更公平的理财世界

袁雨来:用科技创造更公平的理财世界

  2022年12月13日-14日,由中关村金融科技产业发展联盟、中关村互联网金融研究院、中国互联网金融三十人论坛主办的“2023第十届中关村金融科技论坛年会暨2022‘光大杯’中关村番钛客金融科技...

一加10T手机漫威套装版将登陆印度市场

一加10T手机漫威套装版将登陆印度市场

  新酷产品第一时间免费试玩,还有众多优质达人分享独到生活经验,快来新浪众测,体验各领域最前沿、最有趣、最好玩的产品吧~!下载客户端还能获得专享福利哦!   一加再次与漫威 Marvel 合作,为 O...

李扬:国债的期限结构和品种结构应当多样化,增加短债尤为当务之急

李扬:国债的期限结构和品种结构应当多样化,增加短债尤为当务之急

  《财经》年会2023:预测与战略于2022年12月17日-18日在北京召开。中国社会科学院学部委员、国家金融与发展实验室理事长李扬发表演讲。   当前为什么要强调财政政策、货币政策协调配合?李扬...