当前位置: 首页 > news >正文

网站视频模块配置参数树莓派可以做网站空间吗

网站视频模块配置参数,树莓派可以做网站空间吗,百度搜图入口,西安公司注销NeRF:Representing Scene as Neural Radiance Fields for View Synthesis 笔记 摘要 实现了一个任意视角视图生成算法:输入稀疏的场景图像,通过优化连续的Volumetric场景函数实现;用全连接深度网络表达场景,输入是一个连续的5维…

NeRF:Representing Scene as Neural Radiance Fields for View Synthesis 笔记

摘要

实现了一个任意视角视图生成算法:输入稀疏的场景图像,通过优化连续的Volumetric场景函数实现;用全连接深度网络表达场景,输入是一个连续的5维坐标,3D坐标+2D角度(航向、俯仰角),输出Volume density和依赖于视图的emitted radiance,查询5维坐标并用经典的Volume Rendering把输出的颜色与强度投影到图像。

介绍

a. march camera rays,我理解为从焦点投射射线到场景,获取3D坐标点。
b. 用3D点 x \bold{x} x与对应的2D角度(用单位向量 d \bold{d} d)输入,输出颜色 c \bold{c} c和强度 σ \sigma σ
c. 合成图像。

Neural Radiance Field场景表达

F θ : ( x , d ) → ( c , σ ) F_{\theta}:(\bold{x},\bold{d})\rarr(\bold{c},\sigma) Fθ:(x,d)(c,σ)
输出 σ \sigma σ只与输入位置坐标 x \bold{x} x有关, c \bold{c} c则与 x \bold{x} x d \bold{d} d有关。

网络结构,输入 x \bold{x} x的8层全连接层,均为256通道,各层带ReLU激活,输出 σ \sigma σ、256维特征,此特征再与 d \bold{d} d聚合,输入一层带ReLU的全连接层,输出 c \bold{c} c

Volume Rendering

位置坐标 x \bold{x} x表达为相机射线 r \bold{r} r r ( t ) = o + t d \bold{r}(t)=\bold{o}+t\bold{d} r(t)=o+td,t是从焦点 o o o出发的长度,积分上下界是远端、近端。
C ( r ) = ∫ t n t f T ( t ) σ ( r ( t ) ) c ( r , d ) d t T ( t ) = e x p ( − ∫ t n t σ ( r ( s ) ) d s ) C(\bold{r})=\int_{t_{n}}^{t_{f}} T(t)\sigma(\bold{r}(t))\bold{c}(\bold{r},d)dt\\T(t)=exp(-\int_{t_{n}}^t\sigma(\bold{r}(s))ds) C(r)=tntfT(t)σ(r(t))c(r,d)dtT(t)=exp(tntσ(r(s))ds)

T ( t ) T(t) T(t)的含义从 t n t_n tn t t t累积的transmittance,“the accumulated transmittance along the ray”,是射线从 t n t_n tn t t t未遇到其他粒子的概率。
求该积分的数值方法,Deterministic quadrature,笔者初步理解是一种数值计算方法,离散化近似:将区间分为N段,从每一段随机取样。
t i ∼ U [ t n + i − 1 N ( t f − t n ) , t n + i N ( t f − t n ) ] t_i\sim U[t_n+\frac{i-1}{N}(t_f-t_n),t_n+\frac{i}{N}(t_f-t_n)] tiU[tn+Ni1(tftn),tn+Ni(tftn)]
参考Volume Rendering综述,
C ^ ( r ) = ∑ i = 1 N T i ( 1 − e x p ( − σ i δ i ) ) c i T i = e x p ( − ∑ j = 1 i − 1 σ j δ j ) δ j = t j + 1 − t j \hat C(\bold{r})=\sum_{i=1}^NT_i(1-exp(-\sigma_i\delta_i))\bold{c}_i\\ T_i=exp(-\sum_{j=1}^{i-1}\sigma_j\delta_j)\\ \delta_j=t_{j+1}-t_j C^(r)=i=1NTi(1exp(σiδi))ciTi=exp(j=1i1σjδj)δj=tj+1tj

两项技术改进

只有上述设计不能达到SOTA,为此添加了两项重要改进,其中第二项是为了高效地实现第一项。

  1. 位置编码

    直接输入上述5维做渲染,在场景中颜色和几何的高频变化的条件下表现较差,有参考证明深度网络偏向于学习低频函数,并发现在输入网络前用高频函数将数据映射到更高维,网络能更好拟合含有高频变化的数据。5维输入的各个元素 p p p被映射为长为2L的向量
    γ ( p ) = ( s i n ( 2 0 π p ) , c o s ( 2 0 π p ) , . . . , s i n ( 2 L − 1 π p ) , c o s ( 2 L − 1 π p ) ) \gamma(p)=(sin(2^0{\pi}p),cos(2^0{\pi}p),...,sin(2^{L-1}{\pi}p),cos(2^{L-1}{\pi}p)) γ(p)=(sin(20πp),cos(20πp),...,sin(2L1πp),cos(2L1πp))
    其中,位置元素L=10,方向元素L=4;各维元素均归一化到 [ − 1 , 1 ] [-1,1] [1,1]
    Transformer有相似处理,但它的目的是给序列提供位置标签,因为Transformer结构不能标记顺序;NERF中的位置编码则是为了将输入升维以使得它的MLP能拟合更高频函数;从投影重建蛋白质3D结构的模型方法也使用了该思路。

  2. 多层采样
    采用两个网络,一个粗略,一个精细。首先用第一个网络生成颜色,每条射线输入 N c N_c Nc个位置,然后用其结果引导重新采样,使得 N f N_f Nf个采样点集中到体元附近,提高有效信息位置的样本权重,使用两次的采样来渲染。

http://www.yayakq.cn/news/298411/

相关文章:

  • 网站开发框架是什么24小时在线地址失效域名
  • 网站建设 微信开发设计之家房屋装修游戏破解版
  • 常德网站seo淘宝客怎样建设网站
  • 建立网站目录的时候wordpress下载面板美化
  • 网站突然在百度消失了机械加工图纸标注符号大全
  • 有关天猫网站开发的论文重庆装修公司推荐
  • 宣城做网站的公司wordpress头部文件
  • 创办一个网站的流程灌南网站建设
  • 网上购物型网站昆明做网站做的好的公司
  • 昆明建设网站的公司平面设计价格收费表
  • 注册 网站开发 公司wordpress 存储视频
  • 苏州网站建设建网站高端的饰品行业网站开发
  • 域名空间做网站部队网站建设建议
  • 滨海网站建设服务商怎么做站旅游网站上泡到妞
  • 做果蔬行业的网站青岛网站推广怎么选
  • 广州app开发网站建设wordpress文章链接自定义
  • 网页代理访问网站制作app的公司有哪些
  • 商城网站开发哪家好网站二维码代码
  • 纵横天下网站开发北京市建设厅网站首页
  • 绵阳网站建设推广广告设计基础教程
  • 网站开发技能证书对海尔网站建设水平的评价
  • 如何做网站对比用v9做的网站上传服务器
  • 服务专业的网络建站公司网站首页广告图片伸缩代码又关闭
  • 在门户网站做产品seo奢侈品手表网站
  • 寻花问柳-一个专做男人的网站淄川区住房和城乡建设局网站
  • 宣武青岛网站建设电商直播
  • h5手机网站发展趋势网页版梦幻西游下载
  • 59zwd一起做网站wordpress运行c语言
  • 如何建设自己的网站 知乎做网站推广需要哪些知识
  • 安徽建设厅网站网址开发者是什么职业