智东西9月4日报道，9月3日，快手开源最新多模态大模型Keye-VL-1.5 。该模型拥有 80亿个参数，支持 128k tokens扩展上下文，在视频理解、图像理解和推理方面能力出色。

在Video-MME、Video-MMMU、TempCompass等一系列权威的公共视频基准测试中，Keye-VL-1.5在同等规模模型中取得了 SOTA（最佳表现），赶超阿里Qwen2.5-VL 8B、小米MiMo-VL 7B-RL 等同等规模优秀模型；在WeMath、MathVerse等需要复杂逻辑推理和数学问题解决的评估集上，Keye-VL-1.5-8B也展现出较强性能。

据悉，相比于只会识别标签和片段的传统模型，Keye-VL-1.5能捕捉视频中的细节与时间逻辑，实现对长视频与复杂语义的深度理解。这一模型可用于视频推荐、创作、互动以及内容审核和商业化全链条。

这意味着，从自动生成吸睛标题，到智能剪辑精彩片段，再到实时互动解说，Keye-VL-1.5或许能为短视频生态注入了前所未有的可能性。

智东西对这一模型进行一手体验后发现，Keye-VL-1.5在图像理解和逻辑推理上效果较好，且速度较快， 10秒左右可完成针对数分钟视频内容的处理。值得一提的是，在近日广受关注的 AI生成内容的识别上，Keye-VL-1.5表现出了较高的准确率。

同时，在体验中，Keye-VL-1.5 暂时无法完成音频理解、图像/视频创作等任务，且在数学及推理、语言生成的精妙性方面仍有进步空间。

技术报告地址： https://arxiv.org/pdf/2509.01563 Hugging Face地址： https://huggingface.co/Kwai-Keye/Keye-VL-1_5-8B 体验地址： https://huggingface.co/spaces/Kwai-Keye/Keye-VL-1_5-8B

首先，智东西用近日广受关注的AI生成内容识别任务来测试Keye-VL-1.5。随着《人工智能生成合成内容标识办法》，AI生成合成内容的审核管理工作量随之变大。

当智东西上传了一个实拍的熊猫视频，输入提示词：“这个视频是AI生成的吗？” 。如下图所示，Keye-VL-1.5采用非思考模型，在几秒见即给出“ 不是 ”的正确答案。

我们增加难度，上传一个男士拿着猫罐头的视频，输入提示词：“这个视频是AI生成的吗？有没有广告推销？” 如下图所示，这次Keye-VL-1.5自己选择了深度思考模式，经过近10秒钟的思考后，输出了正确答案： “是，该视频可能是AI生成的，并且有广告推销（猫粮）。”

接下来，我们上传了一个荷花池的风景视频，要求Keye-VL-1.5 “根据视频创作一首七言绝句” ，如下图所示，这对Keye-VL-1.5几乎没有难度，生成诗句： “夏日池塘荷叶绿，粉苞初放映晴天。蜻蜓点水惊飞蝶，清香浮动入诗篇。” 诗句全面覆盖了视频中的景物，并且创作了了“蜻蜓点水惊飞蝶”全新意象，还联想到了“清香浮动”嗅觉感受，可见其兼具图像理解和逻辑推理能力，但在语言生成的精妙性方面仍有进步空间。

我们上传了关于两只猫相处的视频，要求Keye-VL-1.5 “对这个视频进行剪辑，剪去两只猫停顿部分，保留动态部分，7秒左右”。但Keye-VL-1.5目前无法执行视频剪辑和生成的动作，而是给出了应该删去和保留哪些视频帧。

当我们上传了一个男孩和女孩走在校园跑道上的照片，输入提示词： “视频中出现了几个人？他们可能多大岁数，是什么关系？” ，Keye-VL-1.5很快给出准确答案： “2个人，年龄约16-22岁，可能是情侣、好友或同学关系。” 可见Keye-VL-1.5在逻辑推理上有一定的能力。

我们上传了一个关于女性宣言合集视频，问Keye-VL-1.5： “视频中出现了几个女孩？她们在谈论什么话题，有什么意义？” 这次Keye-VL-1.5 误把前两个黑色头发女孩识别为了同一个，且没有识别出音频，所以无法总结出话题主题。从思考过程可知，Keye-VL-1.5差一点成功确认视频中出现了三个女孩，但最终却因误以为第一、二个女孩为同一人，而没有得到正确答案。

根据Keye-VL-1.5自己的官方回复：“目前，我作为基于文本的AI模型，无法直接处理视频中的声音内容。我的能力主要集中在文本分析、图像描述和逻辑推理上。”

二、拿下同规模通用视觉-语言测试SOTA，能理解视频、看懂逻辑

看完实测，再来看看Keye-VL-1.5的基准测试情况。通过在公开基准上的评估和内部人工评估，Keye-VL-1.5相较于现有模型表现出显著的改进，尤其在视频理解任务中表现出色，同时在通用视觉-语言任务上也保持了较好性能。

在通用视觉-语言任务上， Keye-VL-1.5在大多数基准测试中展现出具有竞争力的性能，常常取得最先进（SOTA）或接近最先进的结果，总体上优于其他模型。

在大规模通用基准测试OpenCompass、MMMU-val、AI2D等测试中， Keye-VL-1.5分别获得79.5%、71.4%和86.7%的分数，超过了所有其他模型。

在MMBench和MMStar上， Keye-VL-1.5也取得了最佳性能。在数学推理任务中，Keye-VL-1.5显著优于Qwen2.5-VL 8B和InternVL3-8B ，其结果与小米的MiMo-VL 7B-RL相当。

在以视频为中心的场景中，对视频内容的准确理解是Keye-VL-1.5的核心优势。在公开的视频基准测试中，Keye-VL-1.5显著优于其他模型，尤其是在Video-MMMU上，绝对提升了6.5%。

▲Keye-VL-1.5（思考模式）与Keye-VL-Preview及其他模型在多视觉-语言基准测试中的比较

由于公开基准任务覆盖有限、存在过于简单的问题形式、潜在数据污染风险等问题，快手还对Keye-VL-1.5进行了内部基准测试。

如下表所示，Keye-VL-1.5-8B以3.53的整体综合得分大幅领先，较Keye-VL-Preview显著提升了0.51。该模型在提供准确且全面的响应方面能力的增强，且响应与用户查询的匹配度有所改善。与MiMoVL-7B-RL-2508对比，Keye-VL-1.5-8B在综合性能上确立了0.13的优势，且在准确性方面表现尤为突出（+0.19）。虽然快手的模型在事实准确性上更胜一筹，但在语言生成的精妙性方面仍面临挑战。

详细的能力分析揭示了特定领域的优势和优化重点：下表中的细粒度评估显示，Keye-VL-1.5-8B在推理能力（3.81）、时间信息理解（3.36）和稳健性（4.29）方面具有显著优势；在视觉元素识别（3.49）和创造能力（3.66）上与MiMoVL-7B-RL-2508相当。

近年来，多模态大语言模型加速发展，然而由于视频具有动态性和信息密集性的特点，视频理解仍然是一个具有挑战性的领域。

现有模型在处理视频内容时，难以在空间分辨率和时间覆盖范围之间取得平衡。现有方法通常在固定分辨率约束下采用均匀帧采样，这在内容理解需要细粒度视觉细节和时间一致性时，会导致性能欠佳。

为了解决这些局限性，快手推出了拥有80亿参数的多模态基础模型Keye-VL-1.5，它通过三项关键创新解决了视频理解中的基本挑战：

1、高效多模态处理的架构创新：慢-快视频编码策略，解决时空权衡问题

首先，快手引入了一种新颖的慢-快视频编码策略，该策略基于帧间相似度动态分配计算资源，对具有显著视觉变化的关键帧采用更高分辨率处理（慢速路径），而对相对静态的帧则以更低分辨率增加时间覆盖范围（快速路径）。

这种由基于补丁的相似度函数引导的自适应方法，有效地解决了空间细节和时间广度之间的权衡问题。

其次，快手实施了一种渐进式的四阶段预训练方法，逐步构建多模态能力。

从跨模态对齐和多任务学习开始，在退火阶段，我们系统地将模型的上下文长度从8K扩展到128K tokens，使其能够处理更长的视频和更复杂的视觉内容。

这种渐进式方法确保了训练的稳定性，同时最大限度地利用扩展的上下文窗口来增强视频理解能力。最后的模型融合阶段将使用不同数据混合训练的模型结合起来，以提高稳健性并减少偏差。

第三，他们开发了一个全面的训练后pipeline，专注于推理增强和人类偏好对齐。他们开发了一个包含三个关键组件的综合流程。

首先，他们设计了一个五步思维链推理数据构建流程，以生成高质量的冷启动数据；其次，采用GSPO算法进行可验证的基于奖励的强化学习训练。这包括渐进式提示采样，以处理困难样本；最后，进行对齐强化学习训练，以增强指令遵循、响应格式和偏好对齐能力。

这种系统化方法确保Keye-VL-1.5在基准测试中取得优异性能，同时提供符合人类期望和偏好的响应。

快手Keye-VL-1.5模型架构基于Qwen3-8B语言模型，遵循经典的多模态大语言模型架构，包含三个关键组件：视觉Transformer（ViT）、多层感知机（MLP）投影器和语言解码器。

在ViT组件方面，快手采用谷歌开源的SigLIP-400M-384-14 作为视觉编码器来提取视觉信息。在大语言模型（LLM）组件方面，他们使用阿里的Qwen3-8B 作为语言解码器，以提供通用的世界语义知识理解能力。对于投影器，他们随机初始化其参数，并在第一阶段对其进行充分的预训练。

在模型预训练阶段，快手团队在数据构建流程中，组建了一个多样化、高质量的语料库，包含超过1万亿个标记，用于支持模型训练，其来源既有公共数据集，也有内部专有数据。

训练数据涵盖六大主要类别：图像描述、光学字符识别与视觉问答、目标定位与计数、交错数据、视频理解以及纯文本数据。团队针对每个数据类别的特点设计了定制化的过滤机制，以确保整体数据质量。

为了高效训练多模态大语言模型，快手团队进行了深入的基础设施优化，以解决三大主要挑战：架构异构性、负载不均衡和输入/输出瓶颈。

1、异构混合并行策略：对于计算模式相对固定的ViT组件，仅采用数据并行（DP）以最大化吞吐量；而对于参数和内存消耗极大的LLM，则采用结合流水线并行（PP）、张量并行（TP）和数据并行（DP）的混合并行策略。这种精细化策略是实现Keye-VL-1.5的128K超长序列训练的关键技术前提。

2、动态负载均衡机制：预先估计每个样本的时间复杂度，然后使用贪心算法在不同GPU之间分配样本，从而平衡所有GPU的总步骤时长，提高整体硬件利用率。

3、灵活且可扩展的数据加载器：设计了一种灵活且可扩展的数据加载器，它能深度感知并行训练的拓扑结构；实施了一种I/O服务器架构，将视频解码等CPU密集型任务从训练节点卸载出去，有效解决了复杂媒体处理带来的CPU瓶颈问题；实现了实例级的完美恢复机制，确保任务在中断后能够从最后一个成功处理的样本无缝恢复，显著提高了大规模训练的稳定性和效率。

在本研究中，快手提出的Keye-VL-1.5显著提升了视频理解和视觉-语言任务的性能。该模型高效地平衡了时间覆盖范围和空间分辨率，且能够处理更长的视频和复杂的视觉内容，且提升了指令遵循能力和推理能力。

当AI能够真正理解视频的细节与语义，视频行业的推荐、创作、互动和商业化都将被重塑。Keye-VL-1.5仍处于初步阶段，在音频理解、多模态内容生成、逻辑推理等方面仍存在一些不足。但基于短视频平台的海量数据储备，该模型有望在之后快速迭代。

普京回应26国将向乌克兰部署军队

「活动」kumawubiaotitest

334.71MB

版本V3.839.38

下载APK 高速下载

下载动漫美女被❌视频动漫软件安装你想要的应用更方便更快捷发现更多

51%好评(543人)

详细信息

软件大小: 1.85MB
最后更新: 2025/09/07 02:39:27
最新版本: V6.1.7
文件格式: apk
应用分类:ios-Android 97国产精品㊙️入口剧情
使用语言: 中文
: 需要联网
系统要求: 5.7以上

应用介绍

一，鞠婧祎体被❌羞羞网站动漫，台湾A片野性猛交
二，羞羞㊙️18禁止小说，美囤黄色a片
三，男男Gay做受❌❌视频，❤️动漫羞羞在线观看网站
四，18处破外女出血视频，13禁🍆🍑🔞❌❌❌泡视频
五，免费无遮挡🔞漫画网站桃，斗罗小舞被❌吸乳
六，国产男男Gay🔞体育生戴套,中国产❌❌❌❌HD18-19，路易斯被❌吸乳羞羞漫画
七，迪丽热巴被❌到喷水HD
【联系我们】
客服热线：134-2881-646

加载更多

版本更新

V7.5.17

动漫美女脱裤子❌光屁屁的视频

美女吃我的🍌蓝莓视频

日本撒尿全过程㊙️免费

22.61MB

102好评

🔞无遮挡裸光屁打屁股
自慰被❌到爽🔞流网站小斌

成人片🔞蘑菇视频

13.23MB

933好评

欧美做爰又粗又大免费看借种
赵露思被狂揉下部❌拔萝卜

女生的🐻挤压男生的坤坤

13.64MB

314好评

❌❌❌❌日本XXXX96欲漫涩
视频直播平台

免费➕无码➕国产在线19

53.36MB

279好评

最新视频免费观看入口
人妻AV无码㊙️星宫一花

裸体❌❌自慰

71.41MB

705好评

美女100%裸无遮挡🔞
男女被❌到爽

美女裸露放屁㊙️视频

83.08MB

339好评

免费无遮挡❌❌❌❌紫金视频
17XXXXⅩHD100%

PornJAV✅

23.52MB

109好评

久久精品熟女亚洲AV麻豆蜜桃
男同gy🔞www.成人网站

李霖霏裸体被❌羞羞网站

50.70MB

924好评

暴躁BBBBBBBBBBBB
美女❎❎❎❎视频免费

腾讯涩漫❌黄漫下载入口

83.84MB

569好评

少妇一级婬片免费看天气预报
动漫❌裸体❌巨乳❌

91❤️勾搭在线观看

83.86MB

754好评

国产精品❌❌的国产
男❌女到爽流水真人18禁

隐私㊙️视频黄www网站动漫

32.45MB

628好评

双女出jiji互玩㊙️视频
美女裸体㊙️直播中国

www❌❌⭕️⭕️禁区

26.30MB

275好评

♥草莓视频app❤18在线软件
偷窥大学美女拉屎㊙️

动漫成人❌❌❌用力日产

65.47MB

743好评

好想被c㊙️好爽n🈲
成人做爰高潮A片免费视频

光头强❌赵琳18禁羞羞动

54.00MB

754好评

国产高清❌❌❌精品下载
女同免费观看🈚码

动漫被❌到爽漫画免费

57.42MB

682好评

国产免费人做人爱午夜视频麻豆
芙宁娜被狂揉下部❌黄漫

剧情恋尸美女㊙️网站

24.94MB

359好评

国产做受高潮69国产老妇
黄遊👅🍆🍑

国产丰满熟女二区一起睡

13.34MB

314好评

国产精品无套呻吟在线
操山东老熟女

小舞❌18同人AV网站

84.13MB

212好评

聊黄软件
锕锕锕锕好湿要流出来了

女人又爽❌又黄❌免费俄罗斯

45.35MB

735好评

清高19岁毛片
白鹿裸乳被爆❌白浆的

2B被❌18禁同人网站

10.00MB

186好评

梅根福克斯裸被❌视频网站
火影❌18同人游戏站免费

美女裸体㊙️免费

44.19MB

360好评

触手㐅巨大✘房乳✘挤奶游戏美女
日本一级婬片1000部

男女做性㊙️免费网站

91.49MB

207好评

91成人🔞在线观看国产
美女裸体㊙️直播中国

18🈲️老师学生免费观看

30.10MB

909好评

美女用🐻夹我🍌
cos八重神子被❌❌网站

男生🍆👙女生爽了免费视频

30.84MB

542好评

(H) - 边潮喷边尿
cf女角色被狂❌高潮图片

国产精品㊙️入口麻豆高清果冻

29.06MB

122好评

美女扒开内👙内裤看个视视频
男生把困困放到女生阴道视频

人与禽性伦关系

70.07MB

450好评

ass非洲肥婆熟女pics
国产一级婬片A片免费手机版宅男 title="亚洲17c㊙️一区二区手机" class="0v5366j9r7414 app-list-img" src="https://t11.baidu.com/it/u=1040017057,165456434&fm=30&app=106&f=JPEG?w=312&h=208&s=15B07D95426079116A1494FD03009032"">

黑土被❌🐻黄漫扒衣服在线观看

大象传媒成人♥在线观看

详情
白丝美女被啪❌羞羞视频 title="雏田被雷影爆❌网站漫画" class="0v5366j9r7414 app-list-img" src="https://t10.baidu.com/it/u=3070224572,165461829&fm=30&app=106&f=JPEG?w=312&h=208&s=C6000AAC4838BAC8463F54AC0300A00B"">

91成人🔞在线观看国产

不知火舞被❌羞羞漫画下拉观看

详情
欧洲做受❌❌高潮999 title="貂蝉被吕布❌到18禁" class="0v5366j9r7414 app-list-img" src="https://t12.baidu.com/it/u=1041590673,165100299&fm=30&app=106&f=JPEG?w=312&h=208&s=D7383EC642E1D8EA0A87937F0300C078"">

国产日产亚系列精品版优势

男人露出全部隐私㊙️

详情