Diffusion Model
Diffusion Model
扩散现象是指物质粒子从高浓度区域向低浓度区域移动的过程,如往水中滴入墨水。DDPM受到启发,将前向加噪也看成是扩散过程,逐步将有意义的原图像完全变成无意义的噪声。
前向加噪
对于一张图片X,通过随机采样生成符合标准正态分布的高斯噪声ε,ε具有与X相同的形状大小,然后对它们做加权平均,得到混合后的下一步图像,需要满足它们权重平方和为1,可写为:
\sqrt{\beta} \times \epsilon+\sqrt{1-\beta} \times x于是乎,
\begin{aligned}& x_1=\sqrt{\beta_1} \times \epsilon_1+\sqrt{1-\beta_1} \times x_0 \\& x_2=\sqrt{\beta_2} \times \epsilon_2+\sqrt{1-\beta_2} \times x_1 \\& x_3=\sqrt{\beta_3} \times \epsilon_3+\sqrt{1-\beta_3} \times x_2\end{aligned}Generally,
\begin{ ...
服务器搭建
本人记忆着实一般,这几天新得了几台服务器的权限,要记录下来,怎么开坑,方便自己遇到此类问题。寻来方便。。
毕竟,前一天刚开一个服务器;第二天就忘了具体咋操作了
本人是做deep learning的,故本文仅仅适合DL的同学来看,其余不是很确定???
在/home/mazipei/目录下,下载miniconda/anaconda(看个人喜好,mini够用)
下载 Miniconda (Python3 version)
1wget https://repo.anaconda.com/miniconda/Miniconda3-latest-Linux-x86_64.sh
安装
1bash Miniconda3-latest-Linux-x86_64.sh
随后一直按回车,所有都yes安装好后,source ~/.bashrc
设置清华源
12python -m pip install --upgrade pippip config set global.index-url https://mirrors.tuna.tsinghua.edu.cn/pypi/web/simp ...
math博客收藏
记录一些数学知识,方便以后忘记时回来
SVD:主要用途,解欠定、超定方程
nerf_3dgs博客收藏
记录一些nerf,3dgs的前置知识及讲解的博客和视频
知乎收藏夹:
https://www.zhihu.com/collection/949437601
nerf 解读:
原理:https://zhuanlan.zhihu.com/p/481275794
代码:https://zhuanlan.zhihu.com/p/482154458
相机参数与坐标系变换:https://zhuanlan.zhihu.com/p/593204605/
球协函数:
http://www.yindaheng98.top/%E5%9B%BE%E5%BD%A2%E5%AD%A6/%E7%90%83%E8%B0%90%E7%B3%BB%E6%95%B0.html#%E5%9F%BA%E5%87%BD%E6%95%B0
python realted博客收藏
记录一些在看代码时遇到的一些问题及博客,方便以后忘记时回来
知乎收藏夹:
https://www.zhihu.com/collection/947243718
csdn收藏夹:
https://i.csdn.net/#/user-center/collection-list?type=1&folder=36818606&key=1
模型save and load:
https://www.cnblogs.com/Zhuohome/p/15599792.html
命令行参数:
https://www.bilibili.com/video/BV1U4411j7xb/?spm_id_from=333.337.search-card.all.click&vd_source=738644d63e97553d6e3dc1cd66a642d6
cuda版本:
https://cloud.tencent.com/developer/article/1731440
Python装饰器:
https://foofish.net/python-decorat ...
NeRF 笔记
NeRF 笔记
写在前面这原是我图形学课上论文阅读的一个作业,现放在自己博客里面,也当是我学习NeRF的一个小结。
NeRFAbstractNeRF提出了一种通过使用输入视图的稀疏集来优化底层连续体积场景函数,进而实现复杂场景的新视图合成的最先进的结果的方法。使用全连接(非卷积)深度网络,输入有五个维度(空间坐标$(x,y,z)$,视角方向$(\theta,\phi)$),输出是该空间位置的体积密度$\sigma$和视角相关的color。再通过传统的体渲染技术得到最后的像素值。通过比较生成图像和ground truth作为loss,来训练神经网络。
NeRF的意义是什么?经典的图形学渲染流程中,我们是通过对输入的图像进行三维建模,再去进行自由视角的渲染。这就要求构建出非常高质量的三维模型才能渲染出精细的结果。但是很多情况下,三维模型的构建是比较困难的。但是NeRF基于深度学习的流程,通过对三维场景的神经表达,结合可微分渲染,可以实现端到端的训练。最终可以实现在任意视角下对模型的渲染。
NeRF的基本原理NeRF的流程基本上可以用这幅图概括:
沿着相机光线,采样5D坐标合成图像 (位 ...