L1 词汇表 — NeRF 核心术语

本词汇表汇总 L1: NeRF 原理中引入的全部关键术语。每个条目包含：中文名称、英文原名、简明定义、以及与 NeRF 上下文的关联说明。建议打印或在学习时随时查阅。

相机位姿 Camera Pose 输入数据

描述相机在空间中的位置和朝向的参数，通常表示为 3×3 旋转矩阵 + 3 维平移向量（共 6 自由度）。

在 NeRF 中，每张训练图像都必须提供对应的相机位姿。位姿通常由 COLMAP 等 Structure-from-Motion 工具预先估计。没有准确的位姿，网络无法建立像素与空间坐标的正确映射。

光度误差 Photometric Loss 训练目标

渲染图像与真实照片之间的像素级颜色差异，通常用均方误差（MSE）或 L1 损失度量。

NeRF 的训练目标就是让光度误差最小化。网络通过反向传播调整权重，使得从新视角渲染的图像与对应的真实照片尽可能一致。这是整个训练流程中唯一的监督信号。

多层感知机 MLP, Multilayer Perceptron 网络结构

一种全连接前馈神经网络，由多个线性层（带权重矩阵和偏置）和激活函数（如 ReLU）交替堆叠而成。

原始 NeRF 使用约 8 层、每层 256 个单元的 MLP。它不依赖卷积或注意力机制，纯粹通过全连接层学习从坐标到密度/颜色的映射。这种简单的结构反而使 NeRF 具有极佳的可解释性。

NeRF Neural Radiance Fields 方法/模型

神经辐射场。一种用神经网络隐式编码三维场景的方法，输入空间坐标和观察方向，输出体积密度和颜色，通过体积渲染生成任意视角的图像。

NeRF 的核心创新在于：不存储显式几何（点云、网格、体素），而是让网络"学会"描述整个场景。2020 年由 Mildenhall 等人提出，已成为新视角合成领域的里程碑工作。

逆渲染 Inverse Rendering 概念

从观测图像反推场景的底层物理属性（几何、材质、光照）的过程。NeRF 的训练过程本质上就是一种逆渲染。

正向渲染：给定场景 → 生成图像（如游戏引擎）。逆渲染：给定图像 → 恢复场景（如 NeRF）。逆渲染通常更困难，因为多个不同的场景可能生成相似的图像。

位置编码 Positional Encoding, PE 关键技术

将低维连续坐标映射到高频正弦/余弦函数组合的技术，使神经网络能够表达空间中的精细细节。

MLP 天然偏好输出平滑的结果。如果不加位置编码，NeRF 重建的场景会像打了马赛克一样模糊。位置编码相当于给坐标加上了"放大镜"，强制网络感知细粒度变化。后续改进方法（Instant-NGP 的哈希编码、NeRFstudio 的傅里叶特征）继承了同一动机。

神经隐式表示 Implicit Neural Representation 核心概念

用神经网络（而非显式数据结构）编码三维场景或信号的方法。查询任意坐标时，网络实时计算该位置的属性值。

与显式表示（点云、三角网格、体素）相对。隐式表示的优势：存储开销与分辨率无关、天然支持任意精度查询、易于通过梯度下降优化。劣势：需要前向推理才能"看见"几何、渲染速度慢。

5D 坐标 5D Coordinate 输入格式

NeRF 的输入向量，由三维空间位置 (x, y, z) 和二维观察方向 (θ, φ) 拼接而成，共 5 个分量。

5D 坐标的拆分是关键设计：位置 (x,y,z) 决定密度 σ，位置和方向共同决定颜色 c。这种分离让网络学会"物质的实体性与视角无关，但外观与视角有关"这一物理直觉。

采样 Sampling 渲染步骤

沿光线在空间中取若干离散点，查询这些点的密度和颜色，用于后续的体积渲染积分。

采样策略直接影响渲染质量和效率。原始 NeRF 使用均匀采样 + 重要性采样（先粗略估计密度分布，再在密集区域增加采样点）。更先进的方法（mip-NeRF、NeRF++）采用圆锥体采样或反走样采样来处理抗锯齿问题。

体积密度 Volume Density, σ (sigma) 输出属性

描述空间中某位置物质"实在程度"的标量值。σ 越大表示该位置越密实，光线越难穿透。

体积密度只依赖于空间位置 (x,y,z)，与观察方向无关。在体积渲染中，高密度区域会遮挡其后方区域的颜色贡献——就像雾天开车时浓雾挡住远处景物一样。σ 的物理单位通常是"每单位长度的吸收概率"。

体积渲染 Volume Rendering 核心算法

沿光线积分采样点的颜色和密度，按"累积可见度"加权累加，得到最终像素颜色的过程。

体积渲染是连接"点属性"与"像素颜色"的桥梁。它模拟光线穿过参与性介质（如烟、雾、云层）时的物理过程。NeRF 的创新在于：将体积渲染做成可微分的，使得场景表示可以通过照片直接优化。

显式表示 Explicit Representation 对比概念

直接用离散数据结构存储几何信息的方法，如点云、三角网格、体素网格、深度图等。

显式表示的优势：渲染快（直接光栅化）、易于编辑（可以直接修改顶点）。劣势：存储开销随分辨率增长、难以表达精细细节、拓扑变化困难。NeRF 的隐式表示与显式表示互补，后续方法（如 3D Gaussian Splatting）试图结合两者的优点。

速查对照表

术语	一句话记忆
NeRF	用神经网络"记住"整个场景的函数表示
隐式表示	不存数据，query 时才计算
MLP	从坐标到颜色+密度的映射函数
5D 坐标	位置 (xyz) + 方向 (θφ)，位置决定密度、位置和方向决定颜色
体积密度 σ	"这里有多实"，越实越挡光
体积渲染	沿光线"边走边看"，累加颜色
位置编码	给坐标加"放大镜"，让网络看见细节
光度误差	渲染图与真图的差异，训练的目标
相机位姿	拍照时相机在哪、朝哪

使用建议

本词汇表应与 L1 课程配合使用。遇到不熟悉的术语时，先查看词汇表的定义建立基本理解，再阅读关联说明理解它在 NeRF 中的具体作用。速查对照表适合在复习时快速唤起记忆。

L1 词汇表：NeRF 核心术语

C

G

M

N

P

S

V

X

速查对照表