kaiyun体育·官方入口

新闻
你的位置:kaiyun体育·官方入口 > 新闻 > 开云kaiyun官方网站视频边界俨然已成AI技巧落地的首个桥头堡-kaiyun体育·官方入口

开云kaiyun官方网站视频边界俨然已成AI技巧落地的首个桥头堡-kaiyun体育·官方入口

2025-05-23 04:35    点击次数:52

开云kaiyun官方网站视频边界俨然已成AI技巧落地的首个桥头堡-kaiyun体育·官方入口

腾讯旗下混元大模子,正在“招聘”导演。12月3日,在混元大模子媒体换取会上,腾讯公布了旗下模子最新进展:负责上线视频生成智力。现场生成视频骄横,不论是在水里冲浪,一经在阁楼里舞蹈,唯一你的设想力“够用”,输入精准指示词后皆能一键生成。另外皮东说念主物展示方面,混元视频大模子不仅能生成东说念主物中景还能展示东说念主物特写,镜头调度的历程丝滑又颇具电影质感。

本年以来,“等我老了依靠小猫来养老”“老像片古东说念主物动起来”等用AI大模子制作的上述视频走红收罗,视频边界俨然已成AI技巧落地的首个桥头堡。在换取会上腾讯还文牍开源该视频生成大模子,参数目130亿,是现时最大的视频开源模子。面前,用户可在腾讯元宝APP的“AI视频”板块苦求试用。

超写实电影感视频,AI一键生成了

换取会上,腾讯混元多模态生成技巧负责东说念主凯撒表示,用户只需输入一段形色,即可生成视频。面前的生成视频扶助中英文双语输入、多种视频尺寸以及多种视频明晰度。

底下来展示一些用混元最新视频大模子生成的践诺案例,比如输入指示词:“超大波涛,冲浪者在浪花上起跳,完成空中转体。影相机从波涛里面穿越而出,捕捉阳光透过海水的须臾。水花在空中酿成齐全曲线,冲浪板划过水面留住轨迹。终末定格在冲浪者穿越水帘的齐全须臾。”

视频生成的成果不错看到,水和东说念主在视频演进的历程中皆分辩呈现得很好,镜头从冲浪者到水花再到冲浪者出水,全体非常领略。

再举一个颇具西方电影感的例子,输入指示词“穿戴白床单的幽魂濒临着镜子。镜子中不错看到幽魂的倒影。幽魂位于布满灰尘的阁楼中,阁楼里有老旧的横梁和被布料掩藏的产品。阁楼的场景照耀在镜子中。”

生成的视频中幽魂在镜子前舞蹈,视频有远景也有后景,幽魂在床单中舞蹈的当作不错通过床单的褶皱展示,电影氛围和电影感打光皆作念到了。

有读者可能会想,上头的例子皆比拟当代化,如若想要生成古风的东说念主物,还有用吗?输入指示词“一位中国好意思女穿戴汉服,头发飘扬,配景是伦敦,然后镜头切换到特写镜头”。

从生成的视频不错看到,混元真的合股中西!从中景到大特写,天然资格了一个电影语境上的“大跳切”,然而少许也不突兀,中景古风好意思女衣袂飘飘,切到特写时好意思女头上发带、钗环致使连头发丝皆在随风飘舞,另外混元把东说念主物脸上的眇小症结也作念出来了,很有真实感。

除了单主体镜头,混元视频大模子在多主体上也作念得很好。输入指示词“特写镜头拍摄的是一位60多岁、留着髯毛的灰发男人,他坐在巴黎的一家咖啡馆里,千里念念着六合的历史,他的眼睛聚焦在画外来去的东说念主们身上,而他我方则基本一动不动地坐着,他身穿羊毛大衣西装外衣,内衬系扣衬衫,戴着棕色贝雷帽和眼镜,看上去很有涵养风韵,片尾他泄漏一点玄机的闭嘴含笑,仿佛找到了人命之谜的谜底,灯光非常具有电影感,金色的灯光,配景是巴黎的街说念和城市,景深,35毫米电影胶片。”

这段指示词中主体除了“灰发男人”,还有“画外来去的东说念主们”“巴黎的街说念和城市”。生成的视频不错看到,从特写切到中景,男人脸上的光、色彩细节,以及配景中来去的东说念主、城市称心皆阐扬出来了,配景与远景相互纠合,也作念到了所谓的“电影感”。

纠合以上案例不出丑出,面前腾讯混元生成视频大模子不错已毕超写实画质、生成高度相宜指示词的视频画面,画面领略不易变形。

比如,在冲浪、舞蹈等大幅度领略画面的生成中,腾讯混元不错生成非常领略、合理的领略镜头,物体不易出现变形;光影反射基本相宜物理顺次,在镜面或者照镜子场景中,不错作念到镜面表里当作一致。值得一提的是,混元面前已已毕了在画面主角保执不变的情况下自动切换镜头,这是业界大部分模子所不具备的智力。

同期,在与国表里多个顶尖模子的评测对比骄横,混元视频生成模子在文本视频一致性、领略质地和画面质地多个维度成果卓著,在东说念主物、东说念主造局势等场景下阐扬尤为出色。

文生视频评测斥逐。

全面开源,上元宝可免费使用

面前该模子已上线腾讯元宝APP,用户可在AI专揽中的“AI视频”板块苦求试用。企业客户通过腾讯云提供行状接入,面前API同步怒放内测苦求。

通过腾讯元宝APP-AI专揽-AI视频即可使用该功能。

同期,腾讯方面还文牍,这次发布的视频生成大模子已在Hugging Face平台及Github上发布,包含模子权重、推理代码、模子算法等完整模子,全面开源,可供企业与个东说念主开荒者免费使用和开荒生态插件。基于腾讯混元的开源模子,开荒者及企业无需重新老师,即可径直用于推理,并可基于腾讯混元系列打造专属专揽及行状,约略省俭大量东说念主力及算力,加速行业革命门径。

从年头以来,腾讯混元系列模子的开源速率握住加速。就在11月初,腾讯召开混元大模子媒体换取会,文牍最新的MoE模子“混元Large”以及混元3D生成大模子“ Hunyuan3D-1.0”负责开源。

本年以来,“等我老了依靠小猫来养老”“老像片古东说念主物动起来”等用AI大模子制作的上述视频走红收罗。视频边界俨然已成AI技巧落地的首个桥头堡。不少AI视频出圈的背后,是“中国版Sora”的快速崛起。本年春节时刻,Sora的横空出世投下了一枚炸弹,须臾让卷“文生文”“文生图”的大模子厂商开启了“视频ChatGPT期间”。不外,Sora一鸣惊东说念主后却迟迟未上线,被外界称为“期货”。

在这时刻,多家中国厂商抢先入场,推出了视频大模子产品,包括字节、快手、阿里云、昆仑万维、好意思图在内的互联网厂商,以及Minimax、智谱、爱诗科技与生数科技等大模子初创等厂商皆在快速跟进。

腾讯混元多模态生成技巧负责东说念主凯撒在换取会后吸收采访时暗意,面前不少业界产品和模子皆有先发上风,但团队在研发时发现,当今视频生成出奇是文生视频边界锻真金不怕火度远莫得大家设想的那么高,失败率仍很高。“在咱们里面评估,这个技巧进程还莫得到大限制贸易化的进程,还在技巧打磨阶段。咱们选拔在这个阶段推出它,同期选拔对外开源,但愿跟社区一说念把技巧早日推向像AI图像生成这么着实可用的景况。”

采写:南皆记者 林文琪开云kaiyun官方网站