當前位置:首頁 > 當日新聞快報 > 正文內容

Online Casino:阿里达摩院低调上线文本生成视频大模型:仅支持英文输入,已开放试玩

admin2年前 (2023-03-23)當日新聞快報107
感谢IT之家网友 大眼夹打工轨道人航空先生IT之家创空间huggingface、大眼夹打工轨道人航空先生IT之家创空间huggingface、大眼夹打工轨道人航空先生IT之家创空间huggingface 的线索投递!

大眼夹打工轨道人航空先生IT之家创空间huggingface 3 月 22 日消息,近日,阿里达摩院已在 AI 模型社区“魔搭”ModelScope 上线了“文本生成视频大模型”。

根据官方介绍,目前文本生成视频大模型,由文本特征提取、文本特征到视频隐空间扩散模型、视频隐空间到视频视觉空间这 3 个子网络组成,整体模型参数约 17 亿,目前仅支持英文输入。扩散模型采用 Unet3D 结构,通过从纯高斯噪声视频中,迭代去噪的过程,实现视频生成的功能。

Online Casino:阿里达摩院低调上线文本生成视频大模型:仅支持英文输入,已开放试玩

官方介绍称,本模型适用范围较广,能基于任意英文文本描述进行推理,生成视频。一些文本生成视频示例如下:

Online Casino:阿里达摩院低调上线文本生成视频大模型:仅支持英文输入,已开放试玩

A giraffe underneath a microwave.(一只在微波炉里的长颈鹿)

Online Casino:阿里达摩院低调上线文本生成视频大模型:仅支持英文输入,已开放试玩

A goldendoodle playing in a park by a lake.(一只金贵犬在湖边的公园玩耍)

据IT之家了解,模型已经在大眼夹打工轨道人航空先生IT之家创空间huggingface和 大眼夹打工轨道人航空先生IT之家创空间huggingface 上线,可以直接体验,也可以参考该页面自行搭建。模型需要硬件配置大约是 16GB 内存和 16GB GPU 显存。在 ModelScope 框架下,通过调用简单的 Pipeline 即可使用当前模型,其中,输入需为字典格式,合法键值为 'text',内容为一小段文本。该模型暂仅支持在 GPU 上进行推理。

从试玩的结果来看,目前能生成的视频长度多在 2-4 秒,生成等候时间从 20 多秒到 1 分多钟不等。

“Online Casino:阿里达摩院低调上线文本生成视频大模型:仅支持英文输入,已开放试玩” 的相關文章

收评:国内期货主力合约多数上涨,沪镍涨超4%,豆粕涨超3%,生猪跌超6%

收评:国内期货主力合约多数上涨,沪镍涨超4%,豆粕涨超3%,生猪跌超6%

  12月8日午盘收盘,国内期货主力合约多数上涨。沪镍涨超4%,豆粕涨超3%,焦炭、豆二、菜粕涨超2%。跌幅方面,生猪跌超6%,低硫燃料油(LU)、SC原油、棕榈油跌超2%。   【沪镍创阶段新...

美国短期通胀预期意外降至一年多来低点 消费者信心回升

美国短期通胀预期意外降至一年多来低点 消费者信心回升

  美国短期通胀预期意外降至一年多来最低水平,消费者信心在汽油价格下跌的推动下有所回升。   周五,密歇根大学公布的12月初值数据显示,消费者预计明年物价将以4.6%的年率攀升,低于一个月前的4.9%...

黄桃罐头能缓解新冠症状?厂家、专家回应,网友:我知道…

黄桃罐头能缓解新冠症状?厂家、专家回应,网友:我知道…

  来源:证券时报官微综合南方日报综合自环球时报、辽沈晚报、人民日报健康客户端   “小时候一发烧感冒   妈妈就会给我买黄桃罐头”   “吃了黄桃罐头,感冒症状真的减轻了”   ……   黄桃罐头是...

资金大举出逃避险 美股能否重演美联储行情

  作者: 樊志菁   [ 市场已经将目光转向了议息会议前一天公布的11月消费者价格指数(CPI),这将为未来美联储政策紧缩路径提供重要参考。密歇根大学最新公布的消费调查显示,一年期通胀预期降至4.6...

发改委:适时投放政府猪肉储备,在“两节”等重要时段加大投放力度

  据发改委网站,国家发展改革委新闻发言人就当前经济社会发展有关情况答记者问。以下为部分内容。   问:元旦、春节临近,请问国家发改委在保持居民消费品价格稳定方面有哪些考虑?   答:元旦、春节是我国...

美国监管机构对通用汽车旗下Cruise自动驾驶系统展开调查

  12月17日报道,美国汽车安全监管机构对通用汽车公司旗下自动驾驶汽车部门采用的自动驾驶系统展开了安全调查。   美国全国高速公路交通安全委员会(NHTSA)说,已收到三起涉及Cruise车辆因另一...