本文经自动驾驶之心公众号授权转载,转载请联系出处。在解释代码之前,首先对NeRF(神经辐射场)的原理与含义进行简单回顾。而NeRF论文中是这样解释NeRF算法流程的:“我们提出了一个当前最优的方法,应用于复杂场景下合成新视图的任务,具体的实现原理是使用一个稀疏的输入视图集合,然后不断优化底层的连续体素场景函数。我们的算法,使用一个全连接(非卷积)的深度网络,表示一个场景,这个深度网络的输入是一个单独的5D坐标(空间位置(x,y,z)和视图方向(xita,sigma)),其对应的输出则是体素密度和视图关联的辐射向量。我们通过查询沿着相机射线的5D坐标合成新的场景视图,以及通过使用经典的体素渲染技
DuelingNetwork在CartPole中,一般的DQN网络如下所示DuelingQ-Network的结构如下:优势函数:A(s,right)=Q(s,right)−V(s)A(s,right)=Q(s,right)-V(s)A(s,right)=Q(s,right)−V(s)在CartPole任务中,动作价值函数QQQ与状态sss有关,可以获得动作的累计折扣奖励。例如可以取向右推或者向左推的动作使杆子跌倒所获得的总回报非常小。换句话说,QQQ函数所具有的信息分成仅有状态sss组成的部分,和该动作确定的部分。因此DuelingQ-Network将Q函数分离为仅有状态sss确定的部分V(s
1、加法运算A=torch.arange(20,dtype=torch.float32).reshape(5,4)B=A.clone()#通过分配新内存,将A的一个副本分配给BA,A+B#tensor([[0.,1.,2.,3.],#[4.,5.,6.,7.],#[8.,9.,10.,11.],#[12.,13.,14.,15.],#[16.,17.,18.,19.]]),#tensor([[0.,2.,4.,6.],#[8.,10.,12.,14.],#[16.,18.,20.,22.],#[24.,26.,28.,30.],#[32.,34.,36.,38.]])2、乘法运算A*B#ten