本词汇表汇总 L1: NeRF 原理 中引入的全部关键术语。每个条目包含:中文名称、英文原名、简明定义、以及与 NeRF 上下文的关联说明。建议打印或在学习时随时查阅。
描述相机在空间中的位置和朝向的参数,通常表示为 3×3 旋转矩阵 + 3 维平移向量(共 6 自由度)。
在 NeRF 中,每张训练图像都必须提供对应的相机位姿。位姿通常由 COLMAP 等 Structure-from-Motion 工具预先估计。没有准确的位姿,网络无法建立像素与空间坐标的正确映射。
渲染图像与真实照片之间的像素级颜色差异,通常用均方误差(MSE)或 L1 损失度量。
NeRF 的训练目标就是让光度误差最小化。网络通过反向传播调整权重,使得从新视角渲染的图像与对应的真实照片尽可能一致。这是整个训练流程中唯一的监督信号。
一种全连接前馈神经网络,由多个线性层(带权重矩阵和偏置)和激活函数(如 ReLU)交替堆叠而成。
原始 NeRF 使用约 8 层、每层 256 个单元的 MLP。它不依赖卷积或注意力机制,纯粹通过全连接层学习从坐标到密度/颜色的映射。这种简单的结构反而使 NeRF 具有极佳的可解释性。
神经辐射场。一种用神经网络隐式编码三维场景的方法,输入空间坐标和观察方向,输出体积密度和颜色,通过体积渲染生成任意视角的图像。
NeRF 的核心创新在于:不存储显式几何(点云、网格、体素),而是让网络"学会"描述整个场景。2020 年由 Mildenhall 等人提出,已成为新视角合成领域的里程碑工作。
从观测图像反推场景的底层物理属性(几何、材质、光照)的过程。NeRF 的训练过程本质上就是一种逆渲染。
正向渲染:给定场景 → 生成图像(如游戏引擎)。逆渲染:给定图像 → 恢复场景(如 NeRF)。逆渲染通常更困难,因为多个不同的场景可能生成相似的图像。
将低维连续坐标映射到高频正弦/余弦函数组合的技术,使神经网络能够表达空间中的精细细节。
MLP 天然偏好输出平滑的结果。如果不加位置编码,NeRF 重建的场景会像打了马赛克一样模糊。位置编码相当于给坐标加上了"放大镜",强制网络感知细粒度变化。后续改进方法(Instant-NGP 的哈希编码、NeRFstudio 的傅里叶特征)继承了同一动机。
用神经网络(而非显式数据结构)编码三维场景或信号的方法。查询任意坐标时,网络实时计算该位置的属性值。
与显式表示(点云、三角网格、体素)相对。隐式表示的优势:存储开销与分辨率无关、天然支持任意精度查询、易于通过梯度下降优化。劣势:需要前向推理才能"看见"几何、渲染速度慢。
NeRF 的输入向量,由三维空间位置 (x, y, z) 和二维观察方向 (θ, φ) 拼接而成,共 5 个分量。
5D 坐标的拆分是关键设计:位置 (x,y,z) 决定密度 σ,位置和方向共同决定颜色 c。这种分离让网络学会"物质的实体性与视角无关,但外观与视角有关"这一物理直觉。
沿光线在空间中取若干离散点,查询这些点的密度和颜色,用于后续的体积渲染积分。
采样策略直接影响渲染质量和效率。原始 NeRF 使用均匀采样 + 重要性采样(先粗略估计密度分布,再在密集区域增加采样点)。更先进的方法(mip-NeRF、NeRF++)采用圆锥体采样或反走样采样来处理抗锯齿问题。
描述空间中某位置物质"实在程度"的标量值。σ 越大表示该位置越密实,光线越难穿透。
体积密度只依赖于空间位置 (x,y,z),与观察方向无关。在体积渲染中,高密度区域会遮挡其后方区域的颜色贡献——就像雾天开车时浓雾挡住远处景物一样。σ 的物理单位通常是"每单位长度的吸收概率"。
沿光线积分采样点的颜色和密度,按"累积可见度"加权累加,得到最终像素颜色的过程。
体积渲染是连接"点属性"与"像素颜色"的桥梁。它模拟光线穿过参与性介质(如烟、雾、云层)时的物理过程。NeRF 的创新在于:将体积渲染做成可微分的,使得场景表示可以通过照片直接优化。
直接用离散数据结构存储几何信息的方法,如点云、三角网格、体素网格、深度图等。
显式表示的优势:渲染快(直接光栅化)、易于编辑(可以直接修改顶点)。劣势:存储开销随分辨率增长、难以表达精细细节、拓扑变化困难。NeRF 的隐式表示与显式表示互补,后续方法(如 3D Gaussian Splatting)试图结合两者的优点。
| 术语 | 一句话记忆 |
|---|---|
| NeRF | 用神经网络"记住"整个场景的函数表示 |
| 隐式表示 | 不存数据,query 时才计算 |
| MLP | 从坐标到颜色+密度的映射函数 |
| 5D 坐标 | 位置 (xyz) + 方向 (θφ),位置决定密度、位置和方向决定颜色 |
| 体积密度 σ | "这里有多实",越实越挡光 |
| 体积渲染 | 沿光线"边走边看",累加颜色 |
| 位置编码 | 给坐标加"放大镜",让网络看见细节 |
| 光度误差 | 渲染图与真图的差异,训练的目标 |
| 相机位姿 | 拍照时相机在哪、朝哪 |
本词汇表应与 L1 课程 配合使用。遇到不熟悉的术语时,先查看词汇表的定义建立基本理解,再阅读关联说明理解它在 NeRF 中的具体作用。速查对照表适合在复习时快速唤起记忆。
如发现术语定义有误或需要补充,请随时提出。