环球微动态丨研究人员尝试用稳定扩散方法压缩图像结果竟然优于JPEG_科技讯

搜索

环球微动态丨研究人员尝试用稳定扩散方法压缩图像结果竟然优于JPEG

2022-09-28 21:33:44 来源：cnBeta.COM

上周，瑞士软件工程师 Matthias Bühlmann 发现 —— 流行的图像合成模型“Stable Diffusion”，可实现较现有的 JPEG 或 WebP 格式更高的位图图像压缩比、且视觉伪影也更少。即便如此，Stable Diffusion 也不是那么完美。作为一种 AI 图像合成模型，其通常根据文本描述（所谓的“提示”）而生成图像。

访问：

(资料图片)

Parallels Desktop 18 今年首次促销：限时75折

用锯齿彩块来描绘的图像压缩概念（via ArsTechnica）

AI 模型通过研究从互联网上提取的数百万张图像来学习这种能力，在训练过程中，模型在图像和相关词之间建立了统计关联。

然后对每张图像的关键信息添加更小的“表示”和赋予“权重”，后者代表了 AI 图像模型所掌握的数学值。

当稳定扩散分析、并将图像“压缩”为权重形式时，它们就处在了所谓的“潜在空间”中 —— 它们以一种模糊潜力的形式存在，且能够在解码时于图像中复现。

这项研究中用到的 Stable Diffusion 1.4，其权重文件大小约为 4GB —— 代表了该 AI 模型掌握的数亿张图像的知识。

使用稳定扩散压缩图像的示例

尽管大多数人使用了带文本提示的稳定扩散，但 Bühlmann 还是斩断了文本编码器、而是强制通过稳定扩散图像编码器来处理。

该过程将低精度的 512×512 图像、转换为更高精度的 64×64 潜在图像空间表示。此时图像存在的数据量较原始文件小得多，但仍可将之解码扩展回 512×512 图像、并获得相当良好的结果。

测试期间，Bühlmann 发现使用稳定扩散压缩的新图像，可在更高的压缩比（更小的文件大小）下，主观上看起来较 JPEG 或 WebP 更佳。

以这张美洲鸵的照片为例，其原始文件大小为 768 KB 。尽管 JPEG / WebP 格式分别可压缩到 5.68 和 5.71 KB，但稳定扩散方法可进一步压缩到 4.98 KB 。

与对照的图像压缩格式相比，稳定扩散似乎具有更多可分辨的细节、以及明显更少的压缩伪影。

不过 Bühlmann 也指出了现阶段的一个很大局限性 —— 它不太适合面容或文本，且在某些情况下会让解码图像中的细节特征产生“幻象”。

这些特征可能在源图像中并不存在，更别提解码需要动用高达 4GB 的稳定扩散权重文件、以及额外的解码时间。

即便如此，这种非常规稳定扩散用例，还是较实际的解决方案更加有趣，甚至有望开辟图像合成模型的未来新用途。

感兴趣的朋友，可移步至 Google Colab 查看 Bühlmann 的示例代码，或在有关 Towards AI 的帖子中找到实验中的更多技术细节。

关键词：人工智能研究人员尝试用稳定扩散方法压缩图像

推荐

我国在西昌卫星发射中心发射长征二号丁运载火箭成功将遥感三十六号卫星送入预定轨道

从中国航天科技集团获悉，9月26日21时38分，我国在西昌卫星发射中心发射长征二号丁运载火箭，成功将遥感...

来源：科技日报 2022-09-28
东南亚电商巨头大规模要求被裁员工赔偿电脑损伤苹果电脑2500起

网传东南亚电商巨头 Shopee 公司大规模要求被裁员工赔偿电脑损伤，苹果电脑都是 2500 起，Shopee ...

来源：凤凰科技 2022-09-27
股市状况不佳软银正努力在ARM上市前提高其估值

在面向英伟达的出售交易失败后，软银集团把旗下芯片设计巨头 ARM 的未来寄托在了 IPO 上。然而，股...

来源：凤凰科技 2022-09-26
健康的肥胖不存在脂肪含量和全因死亡之间具有线性因果关系

从重庆医科大学附属第一医院获悉，该院内分泌科李启富教授团队基于基因分析探讨了脂肪含量与死亡风险的...

来源：科技日报 2022-09-23
与亚马逊Audible展开竞争 Spotify在美国推出有声读物服务

已在美国推出有声读物服务，此举欲与亚马逊的 Audible 展开竞争。Spotify 称，用户可在 Spotify Ap...

来源：TechWeb 2022-09-22
YouTube视频网站中“不感兴趣”按钮几乎没有任何作用类似相关视频还会出现

有一项新的研究发现，即使用户对 YouTube 中某些类型视频选择了不感兴趣，但是类似相关的视频还会出现...

来源：凤凰科技 2022-09-21
阿里巴巴将在核心科技上持续投入助力全球产业链供应链韧性与稳定

阿里巴巴集团董事会主席兼首席执行官张勇表示，国际地缘政治冲突加剧、逆全球化思潮涌现等因素给全球产...

来源：网易科技 2022-09-20
为获得税收抵免资格特斯拉打算让电池回归美国制造

知情人士称，特斯拉公司暂停了在德国生产电池芯的计划，因为该公司正在考虑获得美国电动汽车和电池制造...

来源：凤凰科技 2022-09-16
Instagram短视频功能发展正趋于停滞观看时长不及TikTok十分之一

几个月来 Instagram 一直在努力发展其短视频项目 Reels，但据一份内部报告显示，短视频功能的发展正...

来源：TechWeb 2022-09-15
5G高空瞭望智能“监督员”24小时在岗鹤壁打造5G智慧社区

守在大屏前，小区各处安全状况一览无余;不用跑医院，5G健康小屋帮你体检;在公园座椅休息时，可以同时充...

来源：人民邮电报 2022-09-13

直播更多》

美国麻省理工学院开发出无电池无线水下相机能效比其他海底相机高出约10万倍

科学家估计，超过95%的地球海洋从未被观...
美国麻省理工学院开发出无电池无线水下相机能效比其他海底相机高出约10万倍

科学家估计，超过95%的地球海洋从未被观...
新建改造通信宏基站95座广西南崇高铁5G网络建设忙

连日来，中国铁塔广西分公司的工作人员...
龙族大战指环王流媒体迈入大片时代

当流媒体迈入大片时代，拼实力的时候到...
2022无锡（北京）科技合作洽谈会74个重大项目签约总金额达到202.34亿

在近日举行的2022无锡(北京)科技合作洽...
构建网络安全保障体系天津滨海高新区在信创安全领域持续发力

9月上旬，天津滨海高新区内企业麒麟软件...

关闭

资讯更多》

焦点