作者:Lucien,文章来源:北格逻辑
本文围绕 JPEG XS 与 JPEG 2000 两种图像编解码算法的应用场景展开分析。二者均可运行于 FPGA 并以 IP 形式交付,但设计哲学、压缩效率、资源占用及适用场景差异显著。作为 FPGA IP 供应商,客户常有选型困惑:“这两者到底有什么区别?我的项目该用哪一个?”
一、设计原理与性能差异
要理解 JPEG XS 与 JPEG 2000 的性能差异,首先需要从两者的编码架构入手——二者虽然都基于离散小波变换(DWT),但设计目标完全不同:JPEG XS 是为"超低延迟、极低资源"而生的夹层编码;JPEG 2000 则为精准的码率分配而生——靠全图率失真最优,在同等压缩比下榨出最高画质。
1.1 JPEG XS——为“快”而生
- 小波分解级数:垂直方向仅支持 0~2 级分解(常用 1~2 级,Subline 模式为 0 级),水平方向最多 5 级。垂直分解级数少,只需缓存少量行数据大幅节省 BRAM,实现行级延迟。
- 编码粒度(Precinct):每个 Precinct 对应原始图像中的若干行(典型 2 行)。码率控制器在每个 Precinct 内独立调节量化步长,输出恒定码率(CBR),延迟极低,硬件简单;但码率分配缺乏全局协调。
- 熵编码:比特面计数,将 4 个系数为一组编码,极简设计,资源极低,但压缩效率有限。
- 码率控制:局部、粗略分配,每个 Precinct 独立定长,无需等待整帧,延迟 ≤32 行;缺点:不同区域复杂度差异大时,复杂区损失明显、简单区码率过剩甚至填充数据以保恒定。这种线级恒定码率特性使 JPEG XS 非常适合 SMPTE ST 2110 等需要实时 CBR 传输的 IP 化制作场景。
- 外部内存需求:基线配置(High/Light/Main 等)无需外部 DDR,仅用内部 BRAM 即可工作。但第 3 版 TDC Profile 因需压缩帧缓冲(FBB)实现帧间预测,需要额外 DDR 存储参考帧。
1.2 JPEG 2000——为"画质"而生
- 小波分解级数:水平和垂直均可支持 3~6 级甚至更高,频域分解更彻底,压缩效率更高;但 BRAM 使用量大且 band 之间的调度逻辑复杂。
- 编码粒度(Code-Block):以 Code-Block(如 32×32、64×64)为熵编码单元,可并行处理。小波变换与编码可流水进行,无需等待整帧变换完成。
- 熵编码:EBCOT + MQ 算术编码,上下文建模与算术编码复杂,逻辑资源多,时序收敛困难,但压缩效率高。
- 码率控制:后压缩率失真优化(PCRD-opt),整帧范围内为各码块搜索最优截断点,在给定码率下最小化全图总失真,使 PSNR 最大化。JPEG 2000 本身不具备恒定码率(CBR)控制机制,编码输出是变码率(VBR)码流。
- 外部内存需求:始终需要外部 DDR,用于存储整帧小波系数、码块编码中间结果及率失真优化所需信息。
二、核心特性总览
维度 | JPEG XS | JPEG 2000 |
|---|---|---|
| 定位 | 夹层编码,替代无压缩视频,超低延迟+低复杂度+视觉无损 | 高保真静止图像压缩,支持无损/有损,纯帧内编码 |
| 压缩倍数范围 | 典型 2:1~10:1(视觉无损);第 3 版 TDC Profile 最高 20:1(图形类内容经 Flawless Imaging Profile 可达约 36:1) | 数学无损约 2~3:1;典型图像 15:1 时仍视觉无损,50:1 以内仍保持良好画质 |
| 延迟 | ≤32 行(编码+解码合计,对应 <1ms) | 约 1~1.5 帧(典型 20ms,可优化至 8.5ms);纯帧内、无 GOP 缓冲,远低于 H.264 等帧间编码 |
| 视觉质量 | 视觉无损(典型 10:1 以内),ISO/IEC 29170-2 定义 | 典型图像15:1 以内视觉无损;相同压缩比下JPEG2000 PSNR 更高 |
| 数学无损支持 | 支持。第 2 版 MLS 配置文件,像素级完美重建 | 原生支持。Part1 核心即支持无损(5/3 小波) |
| 帧间压缩支持 | 原生支持(第 3 版 TDC Profile),小波域帧间预测 | 标准不支持,但北格逻辑 FPGA IP 扩展实现了帧间压缩 |
| Profile 配置体系 | 共 18 个 Profile:High、MLS、TDC、Light/Main、RAW Bayer 等 | 多个 Part(Part1 核心,Part2 扩展等) |
| 外部内存需求 | 基线无需 DDR;TDC Profile 需 DDR(帧缓冲) | 始终需要 DDR |
| 码率控制特性 | 线级 CBR,适合 SMPTE ST 2110 | 无内置 CBR,输出 VBR 码流 |
| 编解码对称性 | 基本对称 | 不对称 |
| 专利费用 | Vectis IP 专利池(FRAND) | Part1 核心免收专利费 |
| 软件支持情况 | FFmpeg 8.1、GStreamer、intoPIX SDK、Intel SVT-JPEG-XS、Adobe Premiere 插件 | OpenJPEG、FFmpeg、ImageMagick、Photoshop 插件、macOS 预览等 |
| 核心优势 | 资源最低、延迟最低、多代稳健、基线无 DDR | 压缩效率最高、低延迟、支持无损/ROI/渐进式传输 |
| 核心局限 | 压缩比高于约 10:1 后画质下降明显;数学无损模式压缩比有限(约 2:1) | FPGA 资源大、需外部 DDR |
三、典型配置下的 FPGA 资源对比
本节以 4096×2160@60fps ,RGB 8-bit 为典型配置,数据基于北格逻辑 IP 实测值(JPEG XS 为 Main Profile 基线版本,无 DDR;JPEG 2000 为标准有损模式,5 级小波分解,64×64 码块)。下表 LUT、BRAM、DSP 三项以相对值(★)表示——以最轻的 JPEG XS 解码器为 1★ 基准,★ 数值越大代表资源占用越多;具体绝对数值属敏感信息,如需请邮件咨询。
资源项 | JPEG XS 编码器 | JPEG XS 解码器 | JPEG 2000 编码器 | JPEG 2000 解码器 |
|---|---|---|---|---|
| LUT | 1.5★ | 1★ | 5.5★ | 4.5★ |
| Block RAM | 1.5★ | 1★ | 8.5★ | 5★ |
| DSP | 1★ | 1★ | 4.5★ | 7★ |
| 外部内存带宽(DDR) | 0 | 0 | ≈40 Gbps (5 GB/s) | ≈26 Gbps (3.25 GB/s) |
四、实测数据对比
为了直观展示 JPEG XS 与 JPEG 2000 在实际应用中的性能差异,本节选取四张典型测试图像,在 3:1~25:1 共 23 个整数压缩倍数 下,对二者的 PSNR 进行了独立测试。
测试配置:JPEG XS 取 MAIN 与 HIGH 两个 Profile(定码率 CBR,bpp=24/R);JPEG 2000 统一取 5 级分解(6 分辨率层),分别采用 9/7 不可逆变换(j2k_97)与 5/3 可逆变换(j2k_53,与 JPEG XS 同小波)。PSNR 在 RGB 三通道整体计算(10·log10(255²/MSE))。
4.1 测试图集介绍

test_pic1 · 树冠秋叶(1024×683)

test_pic2 · 珊瑚水族(960×640)

test_pic3 · 微距昆虫(1920×1280)

test_pic4 · 薄荷叶丛(960×640)
4.2 客观质量对比(PSNR 曲线图)
各测试图像在不同压缩倍数下的 PSNR 对比曲线如下(横轴压缩倍数 R,纵轴 PSNR/dB)。每图四条曲线:jxs_main/jxs_high(JPEG XS MAIN/HIGH),j2k_97/j2k_53(JPEG 2000,均 5 级分解,分别为 9/7 不可逆与 5/3 可逆变换);5/3 在极易压缩图的低压缩比下达到数学无损(∞),曲线在该区间断开。
test_pic1(树冠秋叶)

细节最密、最难压缩;两个 JPEG 2000 配置都明显领先 JPEG XS。
test_pic2(珊瑚水族)

全压缩比区间 JPEG 2000 都领先 JPEG XS。
test_pic3(微距昆虫)

极易压缩内容:5/3 在低压缩比下达数学无损;JPEG XS 因填满码率,低压缩比时反而短暂反超被精度上限钳住的 9/7。
test_pic4(薄荷叶丛)

JPEG 2000 整体领先 JPEG XS。
4.3 结果分析
整体规律:在常规自然图像(树冠、珊瑚、薄荷叶)上,相同压缩比下 JPEG 2000 的客观画质(PSNR)全程领先 JPEG XS,且压缩比越高、领先越稳定。原因在于 JPEG 2000 在整幅图范围内做最优码率分配——把平滑背景省下的码率集中给复杂区域;而 JPEG XS 为压低延迟,只能小范围、粗略地分配码率。
关键特例:对极易压缩的内容(如大面积虚化背景),JPEG 2000 的 5/3 可逆变换在低压缩比下可达数学无损;而 JPEG XS 因严格定码率(CBR)填满码流,低压缩比时画质甚至能短暂反超。
结论:常规图像上 JPEG 2000 的客观 PSNR 全程优于 JPEG XS;但 JPEG XS 的核心价值不在 PSNR,而在于 1~32 行的超低延迟、严格 CBR、以及低复杂度的 FPGA/ASIC 实现。两者面向不同需求,并非简单的优劣替代。
五、应用场景选型指南
5.1 核心选型逻辑:以压缩倍数为首要决策因子
① 不使用帧间压缩(单张图像、画面切换频繁、对画质稳定性要求高)
所需压缩倍数 | 推荐算法 | 理由 |
|---|---|---|
≤10:1 | JPEG XS 基线 | 视觉无损,资源最低、无需 DDR、延迟极低 |
>10:1 | JPEG 2000 有损 | 10:1 以上 JPEG XS 画质下降明显,JPEG 2000 在 10~50:1 仍保持良好画质 |
② 允许使用帧间压缩(视频场景,可接受画面切换时画质波动,典型如 AV-over-IP)
所需压缩倍数 | 推荐算法 | 理由 |
|---|---|---|
≤20:1 | JPEG XS TDC | 第 3 版 TDC 通过帧间预测将视觉无损压缩提升至 20:1 |
>20:1 | JPEG 2000 有损 | 超过 20:1 后 JPEG 2000 压缩效率优势显著(北格逻辑帧间预测版本) |
5.2 辅助考量因素
(1)FPGA 资源与硬件成本:详见第三章。若硬件成本敏感且压缩比 ≤10:1,优先选择 JPEG XS 基线版本。
(2)软件兼容性与行业规范
对比项 | JPEG XS | JPEG 2000 |
|---|---|---|
| 软件生态 | FFmpeg/GStreamer 原生支持,Adobe Premiere 插件 | 几乎所有图像软件原生支持,生态最成熟 |
| 编解码不对称场景 | 若 PC 端播放需安装相应解码器 | PC 端可直接播放,无需额外插件 |
| 行业规范 | SMPTE ST 2110-22(广电 IP 化强制),IPMX/AVoIP 主流 | DCI 数字影院强制,DICOM 医学影像标准 |
5.3 综合选型决策矩阵(按场景)
应用场景 | 典型压缩比 | 允许帧间预测? | 推荐算法 | 推荐理由 |
|---|---|---|---|---|
广电专业制作(ST 2110) | 2:1~8:1 | 否 | JPEG XS High/Light | 行业规范强制,线级 CBR |
AV-over-IP(静态画面) | 10:1~20:1 | 是 | JPEG XS TDC | 压缩效率高,资源比 JPEG 2000 低很多 |
车载传感器/嵌入式 | 2:1~10:1 | 否 | JPEG XS 基线 | 无需 DDR,成本敏感 |
医学影像存档(DICOM) | 2~3:1(无损) | 否 | JPEG 2000 无损 | 规范强制,ROI 必需 |
数字影院发行(DCI) | 约 20:1 | 否 | JPEG 2000 有损 | 规范强制 |
卫星遥感/档案存储 | 20:1~50:1 | 否 | JPEG 2000 有损 | 高压缩比,渐进式传输 |
桌面远控/云桌面 | 10:1~20:1 | 是 | JPEG XS TDC | 静态画面多,增益大 |
数学无损+低延迟 | 约 2~3:1 | 否 | JPEG XS MLS | 无需 DDR,完美重建 |
高精度+帧间增益 | 10:1~30:1 | 是 | 北格逻辑 JPEG 2000 帧间扩展 | 延迟较低,画质高 |
提示:以上为通用建议。实际选型还需结合 FPGA 平台资源预算、是否已有 DDR 设计、以及编解码端是否对称等综合判断。
六、北格逻辑编解码 IP 产品介绍
6.1 产品线概览
北格逻辑同时提供 JPEG XS IP 和 JPEG 2000 IP 两大编解码系列,覆盖不同应用场景的压缩需求。两个系列均采用 RTL(Verilog)编写,可部署在 AMD(Xilinx)、Altera(Intel)、紫光同创等多家厂商的 FPGA 上。
产品系列 | 版本类型 | 核心特性 | 典型应用 |
|---|---|---|---|
| JPEG XS IP | 基线版本(High/Light/Main) | 无需 DDR,资源紧凑,线级 CBR 延迟,支持多种 Profile | 广电 ST 2110、车载传感器、Pro AV/KVM |
TDC 版本 | 需 DDR 实现帧间预测,压缩效率最高 20:1 | AV-over-IP | |
| JPEG 2000 IP | 标准版本 | 完全符合 Part1 Amd1 规范,可与官方参考软件互解 | 数字电影、医学影像存档、卫星遥感 |
低延迟增强版 | 北格逻辑专有帧间编码机制,延迟<8.5ms,支持渐进式传输 | AV-over-IP |
6.2 核心优势
- 资源紧凑:采用经过深度工程优化的紧凑设计,逻辑资源使用量显著低于同类方案。JPEG XS 基线版本无需 DDR 即可工作;JPEG 2000 IP 在保障高画质的同时保持较低的资源占用,适用于小容量 FPGA。
- 充分验证:JPEG 2000 IP 已在 Xilinx Kintex-7 和 UltraScale/UltraScale+ 系列 FPGA 上充分验证并批量使用,达到稳定商用状态;可提供基于 Xilinx KU3P FPGA 的硬件平台用于演示编解码。JPEG XS IP 也已进入成熟商用阶段。
- 灵活定制:支持针对特殊分辨率、帧率及色深的定制开发,并提供从 720P 到 8K 的不同性能版本,客户可按 FPGA 容量灵活选择。
- 完整生态支持:除编解码 IP 外,还提供配套的 VPSS 视频处理子系统(最多 16 路视频源的裁剪、缩放、开窗、图层叠加等)、网络传输模块(UDP/IP、组播、时钟同步等)以及 White Tiger Z1 核心板等完整解决方案,帮助客户快速搭建分布式视频系统。
6.3 核心板与参考方案
White Tiger Z1 是北格逻辑专门为视频分布式应用打造的编解码核心板,基于 Kintex UltraScale+ FPGA,支持 4K@60fps 实时编解码,单块核心板可实现 1-25 倍压缩效果。JPEG 2000 端到端延迟可控制在 10ms 以内,JPEG XS 端到端延迟可控制在 1ms 以内。
总结
JPEG XS 与 JPEG 2000 并非简单的优劣替代关系,而是面向不同场景的两种专业化工具:
JPEG XS
核心理念:实时、轻量、近无损传输
延迟:超低(<1ms,≤32 行)
FPGA 资源:低(无需 DDR)
典型场景:广电 ST 2110、AV-over-IP、传感器
JPEG 2000
核心理念:高保真存档、极限压缩效率
延迟:低(约 10~20ms)
FPGA 资源:高(需 DDR)
典型场景:数字电影 DCI、医学影像 DICOM、档案存储
本文完整版本,敬请关注北格逻辑公司官网:www.berglogic.com。也可以通过邮箱联系我们:zhouyihua@berglogic.com.
文章来源:北格逻辑