欢迎访问电竞企鹅直播官网网站。

全国咨询热线18333811520

【48812】最前哨|快手可灵大模型推出图生视频功用

来源:电竞企鹅直播官网    发布时间:2024-06-22 07:49:10
详细信息

  6月21日,在计算机视觉范畴盛会CVPR2024上,快手可灵大模型正式推出图生视频功用,支撑将恣意静态图画转化为5秒动态视频,其间可调配创作者输入的文本,生成多种运动作用。

  此次可灵大模型还同步发布了视频续写功用,支撑对已生成的视频一键续写和接连屡次续写,单次可让视频延续约5秒,最长可生成约3分钟视频。

  这意味着,可灵大模型可以终究靠屡次续写的功用,在AI视频生成的时长上逾越Sora。

  快手可灵视频生成大模型于6月6日发布,可支撑生成最高达120s的视频,对标Sora。

  现在国内的AI比赛,现已从上一年卷数据、算力和算法,争相发布根底大模型的状况,演化成了验证大模型使用落地才能的比拼。

  而掀起这一浪潮的节点性事情,依旧源于Open AI。其于2月16日发布了文生视频模型Sora,并初次由AI生成了长达1分钟的多镜头长视频,展示出了关于实在国际的高度模仿和细节复原,被视作科技职业的革新。

  随后,国内各大厂商也竞相追逐。快手作为国内头部的内容渠道天然也不会落下。

  在本年Q1的财报电话会上,快手CEO程一笑表明,本年一季度,快手会稳步推动自研大模型各项功能的迭代提高,而且加速大模型在各事务场景的使用。更早之前,快手还发布了文生图和图生图大模型产品“可图”。

  快手以外,字节跳动从上一年开端就现已成立了Flow部分,致力于大模型使用的研制,但至今还没有老练产品落地。

  此前,曾有风闻表明,字节跳动在Sora引爆文生视频范畴之前,现已在研制对标Sora的名为Boximator的立异性视频模型。随后字节跳动驳斥谣言表明,Boximator是视频生成范畴操控目标运动的技能办法研讨项目,还无法作为完善的产品落地,间隔国外抢先的视频生成模型在画面质量、保真率、视频时长等方面还有很大距离。

  本年4月和3月,国内AI赛道中的学院派选手还别离推出了视频生成AI模型“Vidu”和“Follow-Your-Click”,但生成视频的时长在10s-20s的区间,且画面质量也比较来说较低,与Sora仍存在比较大距离。

  在AI视频生成的竞赛中,时长和画面质量渐渐的变成了了国内厂商争相打破的两个重要维度。现在,快手快了一步。