ML·DL/CV

·ML·DL/CV
Swin Transformer: Hierarchical Vision Transformer using Shifted Windows This paper presents a new vision Transformer, called Swin Transformer, that capably serves as a general-purpose backbone for computer vision. Challenges in adapting Transformer from language to vision arise from differences between the two domains, such as arxiv.org CNN을 사용하지 않아서 접근 방법이나 데이터가 돌아가는게 기존의 방식과는 매우 달라짐 ViT(Vision..
·ML·DL/CV
U-Net: Convolutional Networks for Biomedical Image Segmentation U-Net: Convolutional Networks for Biomedical Image Segmentation Medical Image Computing and Computer-Assisted Intervention (MICCAI), Springer, LNCS, Vol.9351: 234--241, 2015 Abstract: There is large consent that successful training of deep networks require lmb.informatik.uni-freiburg.de U-Net은 Biomedical 분야에서 Image Segmentation을 목적으..
·ML·DL/CV
Overview Object Detection&Segmentation Object Detection의 경우 1. object인지 아닌지를 판단 2. object의 localize를 어떻게 할 것인지 두가지 포인트가 있다. localization은 sliding window, object proposal 등의 기법이 있고 object인지 아닌지를 판단하는 경우 localized object를 분류를 통해 판단을 한다. SVM(Support Vector Machine) 지도학습 기법이며 가장 잘 분류하는 초평면을 찾는 것을 목표로 한다. 가장 강력한 분류기이며 작은 학습 데이터 크기로도 잘 작동하지만 멀티 클래스 분류로의 직접적인 확장이 없다는 것이 단점이다. HOG(Histogram of Oriented ..
210B
'ML·DL/CV' 카테고리의 글 목록