D-FINE: Redefine Regression Task in DETRs as Fine-grained Distribution Refinement
·
Study/computer vision
D-FINE: Redefine Regression Task in DETRs as Fine-grained Distribution RefinementPeng, Yansong, et al. "D-FINE: Redefine Regression Task in DETRs as Fine-grained Distribution Refinement." arXiv preprint arXiv:2410.13842 (2024).RT Detection SOTA D-fine에 대해 리뷰 진행.AP와 Latency 사이에서 둘 다 굉장히 우수한 DETR 기반의 RT Detector이다.아마도 이 정도의 FPS와 box AP의 성능이라면,End-to-End 방식이라는 점과 결합하여 Yolo를 밀어낼만한 충분한 detector라고 생각한..
BoostTrack++: using tracklet information to detect more objects in multiple object tracking
·
Study/computer vision
BoostTrack++ : using tracklet information to detect more objects in multiple object trackingStanojević, Vukašin, and Branimir Todorović. "BoostTrack++: using tracklet information to detect more objects in multiple object tracking." arXiv preprint arXiv:2408.13003 (2024).2024년 8월23일 sumitted한 최근 논문인데, 현재 SOTA로 등록되어 있어서 해당 논문을 리뷰한다(아직 논문 accept는 아지만...)너무 최근꺼라 리뷰한 글이 없는거 같아서, 오히려 좋아~ 1. Introducti..
RT-DETR project
·
Study/computer vision
현재 Real-time detection SOTA에MOT20에 대해 tracking sota를 달성하고 있는 boosttrack에서의 tracking algorithm만 빼와서 적용시켜볼 계획,우선 boosttrack에 대한 리뷰 후, 해당을 진행하도록 하겠다.해당 과정은 계속 update할 것이며, github가 먼저 update되니 참조https://github.com/yeongjinHwang/RT-DETR(실제로 detection하고, tracking도 가능해야 영상 데이터에 대해서, 다른 frame에서 서로 같은것임을 판단할 수 있으므로)우선, boosttrack에 대해 리뷰를 할텐데, 성능과 latency사이에서, real-time에 적합하지않다고 생각한다면,다른 tracking paper들도 ..
RT-DETR : DETRs Beat YOLOs on Real-time Object Detection
·
Study/computer vision
2024.12.10 - [Study/computer vision] - DETR : End-to-End Object Detection with TransformersRT-DETR : DETRs Beat YOLOs on Real-time Object DetectionZhao, Yian, et al. "Detrs beat yolos on real-time object detection." Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition. 2024.2024년에 따끈따끈하게 올라온 DETR을 Real-Time Object Detection하기 위해 나온 논문이다.(accept는 2024년이지만 아카이브는 2023년에..
DETR : Inference code review
·
Study/computer vision
2024.12.10 - [Study/SOTA paper] - DETR : End-to-End Object Detection with TransformersLib, Config: Inference용도이기에 backpropagation gradient Falsefrom PIL import Imageimport requestsimport matplotlib.pyplot as plt%config InlineBackend.figure_format = 'retina'import torchfrom torch import nnfrom torchvision.models import resnet50import torchvision.transforms as Ttorch.set_grad_enabled(False)Modelin..
DETR : End-to-End Object Detection with Transformers
·
Study/computer vision
2024.12.10 - [Study/SOTA paper] - DETR : Inference code reviewDETR : End-to-End Object Detection with TransformersCarion, Nicolas, et al. "End-to-end object detection with transformers." European conference on computer vision. Cham: Springer International Publishing, 2020.1. Introductionobject detection target : each object of interet에 대해 bounding box와 category labels prediction현재 기술들은 proposals..
[ResNet] Skip connection 제대로 이해
·
Study/computer vision
여러 자료를 봤는데... skip connection에 대해 설명이 어려워서 이해하기 쉽도록 수정해보았다.Degradation Problem이전에는 layer를 쌓아도 error rate가 증가하는 문제: layer가 깊어졌을 때 model이 수렴했음에도 레이어가 적을 때보다 모델의 error (training, test)가 더 커지는 현상이 발생, 이것은 overfitting 문제가 아니라, layer가 깊어짐에 따라 optimize가 잘 안되기에 발생하는 문제Skip connectionresnet에서 deep한 layer를 쌓기 위해   위의 문제를 해결하기 위한 skip connection 제안input(x)에 대해 만들고 싶은 것을 H(x)라고 가정이것을 기존에는 F(x)로 만들었다. Redisu..
pose estimation occlusion problem related works
·
Study/computer vision
카테고리1. Data Augmentation Techniques      1-1-1: Synthetic occlusion generation during training     1-1-2: Randomized part masking to improve model robustness     1-1-3: Introducing artificial occlusion patterns in training datasets2. Advanced Neural Network Architectures     2-1-1: Multi-branch networks with occlusion-aware feature extraction     2-1-2: Attention mechanisms that can handle parti..
황공진
'Study/computer vision' 카테고리의 글 목록