视频编码算法
1. 视频压缩基础原理
- 视频冗余类型:
- 时间冗余:连续帧之间的相似性
- 空间冗余:单帧图像中相邻像素的相似性
- 视觉冗余:人眼感知不敏感的高频信息
- 统计冗余:像素值分布的不均匀性
- 编码架构基础:
- 宏块/编码单元划分
- 变换编码(DCT/小波变换)
- 量化与熵编码
- 运动估计与补偿
2. 主流编码标准分析
- H.264/AVC:
- 基本结构:I/P/B 帧类型及其组织方式
- 核心技术:多参考帧、1/4 像素运动估计、CABAC 熵编码
- 典型应用:广播电视、流媒体视频、Blu-ray 光盘
- 编码模式:Baseline/Main/High Profile 比较
- H.265/HEVC:
- 性能提升:相比 H.264 节省约 50% 码率
- 技术突破:CTU 结构 (最大 64×64)、35 种帧内预测模式
- 复杂度增加:编码计算量提高约 8 倍
- 适用场景:4K/8K 高分辨率内容、HDR 视频
- AV1/VP9:
- 开源无专利费的替代方案
- AV1 压缩率比 HEVC 高约 30%
- 复杂度与实现挑战
- 技术特点:超大块划分 (128×128)、非二次变换
3. 专业编解码格式
- 中间编解码:
- ProRes:苹果开发的编辑友好型编码,多种质量等级
- DNxHD/DNxHR:Avid 开发的专业编辑格式
- JPEG2000:数字电影标准 (DCI) 使用的编码格式
- 无损与低压缩编码:
- FFV1:开源无损视频编码,档案保存使用
- HQX:GoPro 开发的高质量编码,中间格式
- 各编码在调色、特效制作中的适用性分析
4. 编码决策与优化
- 速率控制策略:
- CBR:恒定码率,适合直播/流媒体
- VBR:可变码率,适合离线视频制作
- CRF:恒定质量因子,追求视觉质量一致性
- 编码预设选择:
- 编码速度 vs 压缩效率的权衡
- 两遍编码 vs 单遍编码比较
- 多核 CPU/GPU 并行编码优化
- 特殊编码场景:
- 屏幕内容编码优化 (如游戏录制)
- 低延迟编码要求 (如视频会议)
- HDR 内容编码特殊考量
5. 编码质量评估
- 客观评价指标:
- PSNR:信噪比评价,简单但有局限
- SSIM/MS-SSIM:结构相似度,更接近视觉感知
- VMAF:Netflix 开发的机器学习评分系统
- 编码效率测试方法:
- BD-Rate 评价方法
- 编码器对比测试流程
- 典型测试序列选择
