参考文档 L2 词汇表

L2 词汇表:3D Gaussian Splatting 核心术语

本词汇表汇总 L2: Gaussian Splatting 原理 中引入的全部关键术语。如需回顾 NeRF 相关术语,请参阅 L1 词汇表

A

Alpha 混合 Alpha Blending 渲染步骤

按深度顺序将半透明物体的颜色与其透明度加权累加,合成最终像素颜色的过程。

在 3DGS 中,每个投影后的 2D 高斯视为一个半透明"印迹",从前到后依次混合:像素颜色 = 前面颜色 × (1 - 后面透明度) + 后面颜色 × 后面透明度。这与传统图形学中的标准 Alpha 混合完全一致,GPU 有硬件加速支持。

自适应密度控制 Adaptive Density Control 训练机制

训练过程中根据重建质量动态增加(致密化)或减少(剪枝)高斯数量的机制。

3DGS 从稀疏点云初始化,初始高斯数量远不足以表达复杂场景。自适应密度控制通过监测每个高斯位置上的梯度大小来判断是否需要分裂(致密化),通过不透明度阈值来判断是否需要删除(剪枝),最终形成"恰到好处"的高斯分布。

G

3D 高斯 3D Gaussian 基元/表示单元

三维空间中的椭圆体概率分布,中心处密度最大、向边缘逐渐衰减。3DGS 用成千上万个 3D 高斯作为场景的基本构建块。

每个 3D 高斯由均值向量 μ(位置)和协方差矩阵 Σ(形状/朝向)定义。协方差矩阵通过特征分解可得到三个主轴方向和对应的尺度,从而将球形高斯变形为扁平盘或细长条,以贴合不同几何形状。

3D Gaussian Splatting 3D Gaussian Splatting, 3DGS 方法/模型

一种用显式 3D 高斯点云表示三维场景的方法,通过 GPU 光栅化实现实时渲染,由 Kerbl 等人于 2023 年提出。

3DGS 的核心创新是放弃隐式神经网络表示,改用可直接光栅化的显式基元。它在渲染速度(>100 FPS)和训练速度(分钟级)上相比 NeRF 有数量级的提升,但内存占用更大,且对初始化点云质量有一定依赖。

光栅化 Rasterization 渲染技术

将几何基元(如三角形、椭圆)转换为像素网格上颜色值的过程。现代 GPU 的核心功能。

3DGS 的光栅化与传统游戏渲染不同:传统光栅化处理的是硬边三角形,而 3DGS 光栅化的是柔和边缘的 2D 高斯椭圆。这种"软光栅化"使场景没有锯齿边缘,天然具有抗锯齿效果。

K

可见度 Transmittance / Visibility 渲染概念

光线穿过一组半透明介质后仍"存活"的比例。在体积渲染和 Alpha 混合中,可见度决定了后方物体对最终像素的贡献权重。

在 3DGS 的可微分光栅化中,精确记录每个高斯在每条光线上的可见度是反向传播的关键。通过追踪透射率,可以计算"把这个高斯向左移动一点,最终像素会如何变化"——这是训练得以进行的数学基础。

可微分光栅化 Differentiable Rasterization 关键技术

使光栅化过程的输出对输入参数(如位置、颜色)可求导的技术,从而支持通过反向传播优化几何参数。

传统光栅化涉及排序和离散化,本身不可微分。3DGS 采用基于瓦片的策略:将屏幕划分为 16×16 的瓦片,对每个瓦片内的高斯排序和混合,并记录每个像素的混合路径。这种"记账式"方法使梯度能够精确回传到每个高斯参数。

协方差矩阵 Covariance Matrix, Σ 几何属性

定义 3D 高斯形状和朝向的 3×3 对称正定矩阵。通过特征分解可得到三个主轴方向和对应的特征值(尺度)。

协方差矩阵是 3DGS 表达力的核心:各向同性时高斯为球体,特征值差异大时可压扁为盘子或拉长为细条。实际实现中,协方差通过缩放向量 S 和旋转四元数 q 参数化(Σ = R·S·S^T·R^T),以保证正定性并减少优化自由度。

Q

球谐函数 Spherical Harmonics, SH 颜色/视角建模

定义在球面上的正交基函数系,用于表示与方向相关的信号。3DGS 用 SH 系数替代 MLP 来建模视角相关的颜色变化。

类比:傅里叶变换用正弦/余弦基表示一维信号,球谐函数用球面基表示方向信号。3DGS 通常存储 3 阶 SH(每通道 9 个系数,RGB 共 27 个),渲染时根据观察方向查表计算颜色。阶数越高,能表达的视角变化越丰富,但存储和计算开销也越大。

S

Splatting Splatting (泼溅/抛雪球) 核心算法

将 3D 高斯投影到 2D 屏幕并按深度排序、Alpha 混合的渲染过程。3DGS 的核心渲染技术。

"Splat"字面意思是"啪的一声落下",形象地描述了 3D 高斯被"拍"到屏幕上的过程。与 NeRF 的体积渲染不同,Splatting 不需要沿光线采样——每个高斯对像素的贡献可以直接用 2D 高斯解析式计算,这是 3DGS 速度优势的主要来源。

致密化 Densification 训练操作

自适应密度控制中的"增"操作:将一个大高斯分裂为两个较小的高斯,或克隆一个副本沿梯度方向移动,以提升局部重建精度。

触发条件:某个高斯在视图空间中的位置梯度超过阈值。梯度大意味着该高斯覆盖的区域在多个训练视角下存在不一致(重建质量差)。分裂策略适用于"过大"的高斯,克隆策略适用于"欠重建"区域。

剪枝 Pruning 训练操作

自适应密度控制中的"删"操作:删除不透明度 α 过低的高斯,减少冗余参数并加速渲染。

不透明度 α 接近 0 的高斯对最终图像几乎没有贡献,但仍在排序和混合过程中消耗计算资源。定期剪枝可以保持高斯集合的"精干"。此外,异常大的高斯(可能出现在训练初期)也会被剪枝。

T

瓦片 Tile 渲染优化

屏幕被划分为的 16×16 像素小块。3DGS 基于瓦片进行高斯预筛选和排序,以并行化和加速光栅化。

瓦片化的核心作用有二:(1)预筛选:只处理与当前瓦片相交的高斯,大幅减少每帧需要排序的基元数量;(2)并行化:不同瓦片可由 GPU 的不同线程块独立处理。这是 3DGS 能在消费级 GPU 上实现实时渲染的关键工程优化。

X

显式表示 Explicit Representation 核心概念

用离散数据结构直接存储几何信息的方法。3DGS 使用显式的 3D 高斯点云作为场景表示,与 NeRF 的隐式 MLP 形成对比。

显式表示的优势:渲染快(可直接光栅化)、易于编辑(可直接增删改高斯)、可解释性强。劣势:存储开销大(数百万高斯 vs 数 MB 网络权重)、分辨率受限于基元密度。3DGS 通过自适应密度控制在"足够精细"和"不过度冗余"之间取得平衡。

不透明度 Opacity, α (alpha) 几何属性

控制 3D 高斯"实心程度"的标量参数,范围通常在 [0, 1]。α 越大,高斯越不透明,对后方物体的遮挡越强。

不透明度是 3DGS 中唯一控制"存在感"的参数(对应 NeRF 中的体积密度 σ)。在 Alpha 混合中,每个高斯的权重正比于其 α。训练过程中,α 过低的高斯会被剪枝;α 过高的区域则可能触发致密化以分配更多高斯。

速查对照表

术语 一句话记忆
3D Gaussian Splatting 用显式高斯点云 + GPU 光栅化实现实时神经渲染
3D 高斯 场景的基本颜料 blob,位置 + 形状 + 颜色 + 透明度
协方差矩阵 控制高斯是球、盘还是条——贴合不同几何
Splatting 把 3D 高斯"拍"到屏幕上,投影 + 排序 + 混合
Alpha 混合 从前到后累加半透明颜色,得到最终像素
可微分光栅化 记录每笔贡献,让反向传播知道该调谁
致密化 梯度大的地方分裂高斯,提升局部精度
剪枝 删除几乎透明的高斯,减少冗余
球谐函数 SH 方向的调色板,替代 MLP 建模视角颜色
瓦片 Tile 16×16 像素小块,并行渲染的基本单元
使用建议

本词汇表应与 L2 课程 配合使用。L1 中已定义的术语(如显式表示体积渲染等)请交叉参考 L1 词汇表。理解 3DGS 时,始终将它与 NeRF 的隐式方法对比,会加深记忆。

如发现术语定义有误或需要补充,请随时提出。