2025/09/07 03:51:13 1,750次浏览

新智元报道

编辑:LRST

【新智元导读】LLM.265研究发现,视频编码器本身就是一种高效的大模型张量编码器。原本用于播放8K视频的现成视频编解码硬件,其实压缩AI模型数据的效率也非常高,甚至超过了许多专门为AI开发的方案。该工作已被世界微架构大会MICRO-2025正式接收,相关成果将于今年10月在首尔进行展示与讨论。

在大模型的发展历程中,提升参数规模已被多次证明是提升模型智能的最有效手段之一。

然而,随着模型参数量的增加,GPU内存容量和互联带宽已成为限制未来更大规模模型训练和部署的主要瓶颈。

在有限的硬件资源下,如何更有效地训练和推理更大规模的模型,已成为一个备受关注且具有显著经济价值的课题。

为应对这一挑战,压缩技术逐渐成为研究的重点,尤其是在大模型的训练和推理过程中,内存和通信带宽已成为最关键的瓶颈。

压缩技术通过减少数据量,直接缓解了系统瓶颈,使得压缩率的提升往往能直接转化为系统效能的增强。

模型压缩的巨大潜力吸引了大量研究者探索多种方法,致力于压缩大模型训练和推理过程中的各类张量,以提升整体效率。

来自杜克大学、卡耐基梅隆大学和香港科技大学的研究团队发现,视频编码器本身就是一种有效的张量编码器。

论文链接:https://arxiv.org/abs/2407.00467

代码链接:https://github.com/Entropy-xcy/llm.265

更重要的是,视频编解码器具备许多对于大规模模型系统至关重要的特性。

灵活的码率控制

传统的量化压缩方法通常局限于整数存储,这使得存储空间只能以整数位来控制(例如3bit、4bit每个元素)。然而,视频编解码器能够灵活控制码率,支持任意实数的位数(例如每个元素平均3.1415bit),从而更加高效地利用存储空间。

多种张量的压缩

传统的量化压缩算法通常只针对少数几种张量进行压缩。而LLM.265方法发现,视频编解码器在处理模型参数、激活函数、KV缓存、参数梯度和反向传播梯度等多个张量时,具有卓越的压缩效果。

通过使用统一的压缩算法对整个系统中的大部分张量进行压缩,极大地降低了AI系统的复杂度。

硬件支持

现有的GPU已自带视频编解码器,LLM.265可以直接利用现有GPU的硬件视频编解码单元加速张量压缩。

此外,视频编解码硬件的实现效率高且已有几十年的成熟经验,因此直接利用或调整视频编解码器进行张量压缩,对于大模型加速器的设计与实现是一种切实可行的方案。

为什么是视频编码器?

视频编解码器是一个神奇的怪物。

时间x宽度x高度x色彩,最初在计算机上播放视频的工程师一定想不到,这个庞大四维视频张量,可以在几十年后做到在8K,240fps的分辨率下,在手掌大小的移动设备上通过无线网络播放。

诚然,摩尔定律提供了算力基石,然而除此之外更加难以置信的是,视频编解码器的发展,使得视频矩阵可以在被压缩几千倍的情况下,让人类视觉上几乎看不出和原视频的差别。

如今,在计算机体系结构领域的顶会中,大模型加速器是毫无疑问的兵家必争之地,是当今时代毫无疑问的「杀手级应用」。

殊不知,30年前体系结构领域也有一个「杀手级应用」,就是视频编解码!

可以说,30年前的视频编解码这个话题的卷的程度,丝毫不弱于当今的大模型加速器。

然而在这卷的过程中,视频编解码器和其硬件实现也已经被卷得优化到了极致,让今天做大模型加速和压缩的研究者回头望去,就好像历史在重演,让人不自觉的便要学习之前的经验。

然而视频编码器正是这么一个具象的经验,在大模型压缩领域的很多研究,都有意或无意的借鉴了许多视频编码器的工作流程,比如说DeepCompression的熵编码,QuaRot和QUIP,和MXFP的分组量化。

然而纵使借鉴,却未有人尝试直接利用视频编解码器,LLM.265改变了这一「灯下黑」的现状。

下面用两个更具体的例子抛砖引玉,展示视频编码器可以高效压缩张量的原理。

正交编码均摊离群值(Outlier)的编码压力

在信息论领域,高效压缩服从正态分布的数据早已涌现出众多成熟方案。

然而,对现代大模型而言,无论是权重还是激活,往往呈现「正态主体+离群值」的混合分布(见图a、c),既跨度大又要求对分布中心保持高分辨率。

这种「宽动态范围+高精细度」的双重需求让传统压缩/量化方法进退维谷:不是浪费大量比特覆盖离群值,便是牺牲中心区域精度,或直接截断离群值,结果都难以令人满意。

然而视频编解码器中的正交变化(如H.264中的DCT)为此提供了一条更为优雅途径。

有时候,模型参数中会出现一些特别大的数字,就像炒菜时放进一大块盐,如果没拌匀,整道菜就会忽咸忽淡。

而DCT(离散余弦变换)就像一把把盐搅拌均匀的勺子,把「盐味」分散到周围,让整锅菜的味道更均衡、协调。如图a→b所示,DCT先把含离群值的分布「整形」成更规整的近正太分布。

从具体例子来说,在图c→d过程中,DCT可以将「128」这一极端值的能量分散到邻近系数,把原本集中的编码压力均匀摊薄。

最终,虽然整体幅值略有升高,但离群值被彻底吸收,后续的编码管线的复杂度和存储开销都大可以大降低。

帧间预测+残差编码

谈及视频编码,首先必须提到其灵魂技术——预测编码。正是预测编码,使得视频压缩效率达到了前所未有的水平。预测编码的核心思想是「预测而非直接存储 」 。

如果我们能够依据已有信息对待编码的数据块进行精准预测,那么该块本身就无需再存储;即便预测并不完美,也无需担心,只要能够得到数据块的大致轮廓,随后计算出真实数据与预测之间的残差,并仅保存能量更低的残差信息即可。

相比直接保存完整数据块,仅存残差便能大幅缩减所需比特数。

上图概述了视频编码器在张量压缩中的工作链路。编码器首先对输入帧进行边缘预测(见图b):一旦判断出存在连续边缘,便直接记录「从(x₁,y₁)到(x₂,y₂)的像素均为蓝色」这类几何描述,而非逐像素存储。

凭借这种轮廓级表达,数据体积骤减,压缩比随之倍增。类似地,LLM的权重、激活和梯度张量也蕴含可视化意义上的「边缘」。

这些张量通常呈轴向分布,即沿同一轴方向的数据整体偏高或偏低(见图b)。

视频编码器可以把这类轴向结构视作「可预测」的边缘区域,先用预测值勾勒大致轮廓,再只编码预测与真实之间的低能量残差(见图c)。

对残差先进行正交变换,再进行量化后,其信息熵会进一步降低(见图d),于是需要传输或存储的比特数大幅减少,压缩率显著提升。

实验结果

实验结果表明,在几乎所有模型压缩的场景中,无论是推理还是训练,也不论是单卡还是分布式环境,使用视频编解码器对张量进行压缩都能取得显著的效果。

针对权重压缩的实验,LLM.265将传统的4 bit量化进一步推进至2.5 bit,在仅用2.5 bit的预算下仍能够实现与原来4 bit相当的性能,几乎与全精度基准线持平,未出现可感知的精度下降。

在训练过程中,LLM.265将每参数的平均通信比特从之前的3.5 bit降至1.4 bit,通信量因此缩减约2.5倍,同时收敛速度也超过了此前的最先进方法。这些结果充分说明视频编解码器在张量压缩方面具备卓越的潜力。

关于未来加速卡设计、编码器和LLM系统的思考

用更多计算换更小数据量会越来越划算

随着模型规模的持续扩大,摩尔定律的效应趋于衰减,计算能力的提升相对受限,而通信和内存带宽的瓶颈在硬件成本、能耗以及可扩展性方面表现得尤为突出。

在此背景下,数据压缩作为一种「用计算量换取更小数据规模」的技术手段,对缓解内存和通信压力具有重要意义。

研究结果发现,视频编码模块在芯片上占用的面积不足GPU面积的百分之一,这意味着在现有GPU上额外集成若干视频编码单元即可显著提升系统级能效,降低整体成本;若进一步研发专用于张量的编码单元,效益将更加突出。

不再强求无损压缩,有损有更高的自由度

过去的压缩加速器研究大多聚焦于无损方案,而无损压缩的理论上限通常不超过两倍的压缩率。

LLM.265的实验表明,在允许适度有损的前提下,只要在性能与精度之间进行合理的权衡,就可以实现远高于无损的压缩率,同时在训练和推理阶段仍能保持模型效果和精度的可接受水平。

更重要的是,有损压缩方案往往只需对现有硬件进行少量改动,即可在需要时切换回无损模式,保持灵活性。

通用还是专用,that is the question

LLM.265的实验提示可以从两条路径进行探索:

一是将现有视频编码器精细化为专门的张量编码器,去除与张量无关的功能模块,强化对张量有价值的部件,并加入针对张量特性的专用模块,以追求极致性能;

二是将张量编码的功能融入视频编码器之中,利用视频、图像以及通用文件压缩流水线之间的高度相似性,实现硬件压缩加速器的模块共享。

若能够构建一个能够服务多种压缩场景的共享加速器,则有望在硬件资源利用率和系统整体效率上获得更大收益。

结语

通用抑或专用,计算体系结构自诞生伊始便笼罩着激烈的争论。千位架构师、千种应用,恰似千人千面、千个哈姆雷特,孕育出万般设计。

正是这种无限的自由度,造就了体系结构与架构设计的独特魅力,也促成了芯片史上无数大胆、疯狂的创新。

然而,架构师面对的并非舞台上「文无第一」的妙语横生,而是「武无第二」的沙场血战。

在无数基准测试的天平下,所有的架构设计都高下立判。每一次架构抉择,都足以左右一个企业的兴衰存亡——此为即决高下,也决生死。我想,这正是芯片架构设计最令人着迷之所在。

参考资料:

https://arxiv.org/abs/2407.00467

通用LLM压缩算法,居然藏视频编码里!2.5bit实现4bit性能,硬件无缝支持
通用LLM压缩算法,居然藏视频编码里!2.5bit实现4bit性能,硬件无缝支持

这才是真正的普通人穿搭

「活动」kumawubiaotitest

18.71MB
版本V3.41.38
下载免费无遮挡🔞视频在酒店里男女安装你想要的应用 更方便 更快捷 发现更多
喜欢 51%好评(643人)
评论 16
通用LLM压缩算法,居然藏视频编码里!2.5bit实现4bit性能,硬件无缝支持截图0 通用LLM压缩算法,居然藏视频编码里!2.5bit实现4bit性能,硬件无缝支持截图1 通用LLM压缩算法,居然藏视频编码里!2.5bit实现4bit性能,硬件无缝支持截图2 通用LLM压缩算法,居然藏视频编码里!2.5bit实现4bit性能,硬件无缝支持截图3 通用LLM压缩算法,居然藏视频编码里!2.5bit实现4bit性能,硬件无缝支持截图4
详细信息
  • 软件大小: 8.51MB
  • 最后更新: 2025/09/07 03:51:13
  • 最新版本: V6.074.7
  • 文件格式: apk
  • 应用分类:ios-Android 色情午夜🈚️码电影麻豆
  • 使用语言: 中文
  • : 需要联网
  • 系统要求: 5.03以上
应用介绍
一,刻晴被❌到爽🔞高潮痉挛游戏,男生把小困困进男生困里电影免费看
二,91➕国产➕爽爽黄➕,麻酥酥🔞在线观看
三,.裸体美女❌❌免费软件,A片无码🔞羞羞漫画
四,纲手裸乳被爆❌白浆3D视频,黄十八🈲APP
五,大但38人文艺术,温迪被钟离扒开腿坐做❌文
六,成人直播❌❌❌,动漫美女胸乳奶👙,亚洲18🔞在线pegging
七,l月同人♥本子♥网站
【联系我们】
客服热线:134-2881-646
加载更多
版本更新
V7.5.17
把🍌伸进女人的🍑做运动国产
  • 美女㊙️露视频

    日韩裸体乳🍑免费看

    少妇我被躁爽到高潮A片白洁

    98.96MB
    107好评

    男男gaYGAYS✅男同网站

  • 美女C逼视频网站苍井空一级电影叫什么名字

    国产❌❌❌69熟妇视频网站情人

    疯狂❌喷水自慰爽w啵啵

    482.83MB
    924好评

    轻点~太深了~啊~进去了

  • 润媞美女🍑被路飞娜

    国产➕无码➕91

    美女裸露全㊙️遮挡奶头酒店

    13.96MB
    316好评

    暴躁少女3最漂亮的三个人

  • XXXXXXX泡妞🍆🍑睡着

    富婆玩小伙子一级A片

    宁荣荣张开双腿被强❌视频

    53.30MB
    273好评

    打白嫩屁屁㊙️网站

  • 国产做受❌❌❌麻豆东京热

    日本熟妇毛茸茸❌❌❌

    日韩在线视频免费观看高清中文版网站下载大全

    71.80MB
    700好评

    女性脱👙给我揉🐻的网站

  • 无尽❌裸体❌白丝❌漫画

    女高中生打屁股♥网站

    大陆裸体脫衣舞DVD

    83.24MB
    330好评

    ▓■成人向日葵视频▓免费看

  • yy4080影院❤旧里番蒂法

    动漫18❌动漫免费观看

    动漫❌爆乳❌3D网站

    23.43MB
    102好评

    小日本做❤️视频

  • 龙珠布尔玛被爆❌羞羞视频

    小🐤🐤戳进🍑无遮挡www

    mwow88888

    50.49MB
    920好评

    成人国产精品㊙️鲁鲁3d

  • 成人免费版❌❌欧美州

    二次元女被多触手怪❌吸乳

    Japanese無碼熟女伦

    83.24MB
    568好评

    蜜桃🍑黄瓜🥒91

  • 姬小满被爆❌羞羞漫画

    AAA毛片视频免费观看

    做爰视频毛片下载蜜桃视频。

    83.61MB
    753好评

    姬小满被爆❌羞羞视频网站紫金

  • 回民色情A片免费播放

    美女裸体被❌动漫麻豆禁漫app

    全彩里番⭐️ACG海贼王罗宾

    32.55MB
    622好评

    午夜体验试看120秒❤

  • 嗯~啊~快点🌿死我免费观看

    火影小樱被❌无码视频

    8x8拔擦拔擦在线观看免费视频

    26.32MB
    275好评

    宿友c我🌿男男开车知乎

  • 国产成人片《羞羞》上映让他、c c

    国产51精品㊙️入口开车视频

    蜡笔小新美冴疯狂❌喷水自慰

    65.85MB
    743好评

    免费无遮挡🔞视频网站下载蜜臀

  • 动漫裸体被❌羞羞动漫网站

    🖤禁漫天堂🖤羞羞小说

    扒开疯狂揉❌难受粉红女郎

    54.27MB
    759好评

    国产91无码精品㊙️入囗

  • 美女被❌吸乳得到大胸91

    2D动漫❌❌❌Japanese

    美女隐私㊙️裸露双奶头

    57.51MB
    681好评

    朱竹清❌到喷水18禁视频

  • 中国少妇与动交ZoZ0zHD

    美女的胸㊙️免费网站

    嗯~啊~弄嗯~啊h高潮视频

    24.84MB
    350好评

    3Dmax亚洲NINEBOXmod

  • 灰原哀被爆❌羞羞图片白丝

    女同被❌到爽🔞流网站

    美女露出🐻强行被男生揉

    13.76MB
    313好评

    把🍌伸胡桃的🍑WWW视频

  • 成人🔞一区三区视频

    羞羞羞啪啪成人╳╳♥♥男女直播

    学生跪床❌❌被🌿小说

    84.55MB
    218好评

    妈妈帮我打脚枪视频大全

  • 蜜桃91精品㊙️入口内裤

    洗澡爆❌❌乳❌❌❌

    宋雨琦❌❌自我安慰

    45.58MB
    737好评

    qq免费看片➕V群谁有啊

  • 91麻豆精产国品一二三产品

    FreegGaySexGVTV.com

    十八岁姑娘麻BB性生活三级了片播放片播放

    10.02MB
    182好评

    欧美⭕⭕⭕⭕XXXX96动漫

  • 美女被❌到高潮喷出白酱

    91在线无码精品㊙️国产三年

    男女被❌到爽🔞流尿91

    44.09MB
    365好评

    ai换脸章若楠被❌又疼又叫

  • 二次元动漫被❌视频

    动漫男同裸体被❌游戏软件

    麻酥酥cos西施自慰白浆

    91.82MB
    204好评

    我和邻居少妇做爰高潮全过程

  • 美女㊙️拉屎pooping网站

    桃子冰♈丰满熟女视频

    九色国产精品㊙️入口原神

    30.15MB
    907好评

    我用🍆蹲同桌的🐻

  • 原神芙宁娜裸体❌网站

    男男互摸Gay夹🐔

    99在线无码精品㊙️入口涩爱

    30.32MB
    545好评

    免费XXXX18美国人

  • 做受❌❌❌高潮95

    FuckGgy❌❌❌潮喷

    麻豆美女胸黄18禁❌视频

    29.36MB
    120好评

    扒开动漫疯狂揉❌羞羞男同

  • 69俄罗斯ⅩXX

    原神胡桃18❌AV黄网站

    动漫美女被❌❌无尽免费

    70.38MB
    454好评

    91在线精品㊙️在线观看男同

  • 人妖裸体㊙️男生扒开🍑伸进🍌❌软件 title="kendalljenner❌超污网站" class="0v5366j9r7414 app-list-img" src="https://t11.baidu.com/it/u=1040017057,165456434&fm=30&app=106&f=JPEG?w=312&h=208&s=15B07D95426079116A1494FD03009032"">

    男性脱👙给我揉🐻亲嘴

    中国❌❌❌free少妇6

  • 云缨同人❌羞羞羞亚洲AV无码㊙️新有菜 title="91玩精品㊙️入口" class="0v5366j9r7414 app-list-img" src="https://t10.baidu.com/it/u=3070224572,165461829&fm=30&app=106&f=JPEG?w=312&h=208&s=C6000AAC4838BAC8463F54AC0300A00B"">

    特黄A片。无码做爱

    18+🔞🈲www蜜桃流水在线观看

  • 白丝美女被❌❌wwwwai换脸国产➕又黄➕又爽刺激原耽 title="男生扒开🍑伸进🍌❌推特" class="0v5366j9r7414 app-list-img" src="https://t12.baidu.com/it/u=1041590673,165100299&fm=30&app=106&f=JPEG?w=312&h=208&s=D7383EC642E1D8EA0A87937F0300C078"">

    我和一个十八发的买淫少妇日批

    涩涩18🈲

{{.转码Keywords}} 类似软件

猜你喜欢

相关攻略
包含 饿了么 的应用集
包含 饿了么 的应用集
评论
  • 千仞雪的隐私㊙️脱裤子 9天前
    18🈲超刺激拔萝卜漫画
  • 2025亚洲精品㊙️一区二区三小 8天前
    小🐔🐔伸进🈲🔞🔞9幺蓝莓视频
  • 玛奇玛裸体被❌ 1天前
    wwwwxxxx黄片一狼
  • 欧美另类丰满熟妇乱Xx 4天前
    原神3D同人18❌AV黄漫网站
  • 袖珍人一级A片 1天前
    百合gl网站㊙️
  • 裸体被❌涩涩的视频 5天前
    亚洲🈚️码成人
  • 星穹铁道涩涩同人3D❌18禁 2天前
    美女的尿囗㊙️撒尿
  • 娜美裸乳被爆❌白浆的同人 7天前
    GV➕无码➕高潮➕
  • 91级特大黄 5天前
    被粗大的🐔巴捣出白浆91
  • 动漫学生疯狂❌喷水自慰 9天前
    免费无遮挡🔞视频网站在酒店里