首页 > 生活分享 > 免费教学 > 快手发布对标Sora的视频生成大模型「可灵」 已开放邀测体验

快手发布对标Sora的视频生成大模型「可灵」 已开放邀测体验

发布时间:2024-06-07 16:16:45来源: 15210273549

OpenAI文生视频大模型Sora发布后,国内企业争相入局,国产文生视频大模型迈入加速阶段。36kr获悉,近日又一国产视频大模型加入战局,快手“可灵”视频生成大模型官网目前已正式上线。相较此前各家放出的视频大模型以展示视频为主,本次亮相的可灵大模型不但效果对标Sora,且已在快手旗下的快影App开放邀测体验。

可灵大模型官网

作为短视频领域头部玩家,快手在短视频视频技术方面有多年的深入积累,其视频生成大模型也有天然、广泛的应用场景。可灵大模型为快手AI团队自研,采用类Sora的技术路线并结合多项自研创新技术,具备诸多优势:1、能够生成大幅度的合理运动;2、能够模拟物理世界特性;3、具备强大的概念组合能力和想象力;4、生成的视频分辨率高达1080p,时长高达2分钟(帧率30fps),且支持自由的宽高比。

具体而言:可灵大模型能够生成大幅度的合理运动。可灵采用了3D时空联合注意力机制,能够更好地建模视频中的复杂时空运动。因此,可灵大模型不仅能够生成较大幅度的运动,且更符合客观运动规律,能够真正做到让想象力动起来。下面宇航员在月球上奔跑的例子中,随着镜头慢慢抬升,我们可以看到宇航员跑步的动作流畅轻盈,步态和影子的运动合理恰当。

prompt:一名宇航员在月球表面奔跑,低角度镜头展现了月球的广阔背景,动作流畅且显得轻盈

能够模拟真实物理世界的特性。得益于自研模型架构及Scaling Law激发出的强大建模能力,可灵大模型为我们构建起了一个无限逼近现实的想象空间,无论是真实世界的光影反射,重力影响下的流体运动,还是与物理世界的交互,可灵大模型都能够生成符合物理规律的视频。下面是小男孩吃汉堡的生成视频,一口咬下去,汉堡被咬掉一个大大的缺口,并在视频中一直保持。可以看到小孩咀嚼汉堡的享受表情,脸部的肌肉动态非常逼真。

prompt:一个戴眼镜的中国男孩在快餐店内闭眼享受美味的芝士汉堡

具备强大的概念组合能力和想象力。凭借模型对文本-视频语义的深刻理解和基于 Diffusion Transformer 架构学到的强大概念组合能力,可灵大模型能够将用户丰富的想象力转化为具体的画面,让创意触手可及。下面的视频展示了熊猫吉他手坐在湖边弹着吉唱着歌的想象场景。

prompt:一只大熊猫在湖边弹吉他

可灵大模型生成的视频分辨率高达1080p、时长高达2分钟(帧率30fps),且支持自由的输出视频宽高比。可灵大模型的自研3D VAE能够将视频编码到紧凑的隐空间并解码成带有丰富细节的视频,可以生成高达1080p分辨率30fps的视频。得益于高效的训练基础设施、极致的推理优化和可扩展的基础架构,可灵大模型能够生成长达2分钟的视频。在推理过程中,还可以做到同样内容输出多种视频宽高比。同时,可灵官网还展示了分钟级的视频生成效果,可以跟随镜头看到,小男孩骑自行车游览花园,在一镜到底中穿越春夏秋冬四季的风景。

免费教学更多>>

三星Galaxy S25 Ultra 12GB+256GB 钛影黑仅4969元 华硕 ROG 幻 16 Air 2025 笔记本“U9 285H+RTX5070”配置开售,16999 元 联想拯救者27英寸电竞显示器限时特惠 海光芯 联想SR658H v2高端服务器成都69899元 英利瑞oppo手机钢化膜天猫促销仅需5.02元 小米YU7价格再造悬念 雷军:23.59万起不可能! 小米:徕卡快门音效将下放更多机型,加急设计和开发更多水印样式 小米地震预警服务临时调整:高考期间5级以上才提供 华为Pura80系列的影像又有新的突破,“一底双长焦”,感觉会是演唱会神器 小鹏×华为:AR-HUD如何掀起智能驾驶″可见性″革命 2025Q1全球高端手机销量TOP 20:华为8款小米1款上榜 快手美团将释放多领域实习岗位 荣耀Magic V5本月发布:性能升级,轻薄再突破 荣耀 Magic V5 折叠屏手机规格曝光:骁龙 8 至尊领先版,本月见 竖折手机摩托罗拉(联想)出货量增长超行业3倍,在14个国家冲进前三 红米Note14Pro+5G手机16GB+512GB子夜黑仅1160元 小米辣920:直播界的“正能量偶像”,用坚持和热爱成就梦想 小米高考加油站上线:免费充电纳凉拍照!10万份“答案之水”免费领 欧炫小米12系列手机膜,天猫到手价28.7元 华为Pura 80系列上架5个小时预约人数破6.5万!交100元订金 可拥有优先取机权 2025高考生,我在文华为你加油! 小鹏G7将搭载华为HUD,试驾车已经备好,6月开启预售? 华为为代表的国产全自研影像创新再次闪耀 消息称华为新款「三折叠」手机下半年亮相,主要升级处理器和影像 2025 手机行业格局下的 OPPO:坚守与突破 SK海力士在一季度首次超过三星电子 成为全球DRAM营收最高厂商 有时候,三星这个2亿像素不但细节比12MP好,观感也更好,就很反直觉了 三星三款折叠手机通过印尼认证,将于今夏发布 大学新生必备!联想大学生“青春有AI”教育特惠计划助力AI终端+个人能力双升级 扫地机:2025年618电商节首阶段,线上零售额增长11.8%,成交量增长18.8%,均价下滑5.9%