Typing...

整理思考的地方

paper list 202506

“Lift, Splat, Shoot: Encoding Images from Arbitrary Camera Rigs by Implicitly Unprojecting to 3D” “Uncertainty-Aware CNNs for Depth Completion: Uncert

深度转视差代码

内参fx可以从镜头焦距F,sensor_width直接计算得到 import cv2 import numpy as np import matplotlib.pyplot as plt depth_l = np.load('stereo_pinhole/0000.npy') depth_r =

2025.1.2实验:二维深度图Depth-first Point Filtering

现象描述 因为安装位置的关系,LiDAR在鱼眼相机的上面,导致点云投影到鱼眼相机时,鱼眼相机不可视的点投影到了图像上,且与近处点云交错重叠。如图,左边显示器顶部出现了深度交错。 解决思路 类似Z-buffering的原理,思路是用前面的点过滤掉后面的点。根据透视原理,近处点云所投影的像素面积是会比远

continue to train from best checkpoint rather than last one

背景 通常我们会选择连续若干个epoch后train loss不下降时就降低lr(为方便讨论,这里统一选择减半lr)的策略。具体来说,train的时候通过计算eval分数判断best weight,同时记录last weight。但是在发现train loss无法下降时其实已经不是最好的时机,通过实

batch size,学习率,与泛化性

一般来说batch size越小,越接近实际推理变化丰富的实际情况,小bs训练出的模型在val set上分数更高。 可以一开始尽可能的大bs训练,然后再在bs=1下继续收敛。 learning rate使用cosine退火策略可能有2%左右的提升。但是耗费的时间多得多,属于最后考虑的策略。 在实验开