2년차 시작
내가 커야 한다
해야 할 것들
- Pytorch , 3회차
- 운동 1시간, 수학 1시간, 코딩 1시간
- SLAM 다시 공부하기.
신년맞이
어찌저찌 2026년이다. 그래도 작년 한해 버텨온 나에게 소소한 축하를 보내본다.
잘하고 있는것인지. 잘 할 수 있을 것인지에 대해서는 아직도 확신이 서질 않는다.
더해서 공부의 템포가 느려지고 있는건 아닌지 정말 심각하게 고민해봐야 할 듯하다. 벌써 늘어지네.
타이트하게 시간을 쓰고, 무리하지 말자. 운동도 빼먹지 말자.
NetVLAD 에 관련한 잡설
산학과제 겸, 연구 과정으로 NetVLAD를 보고 있다.
간단히 요약해보자면, 이미지를 CNN을 통과시켜 텐서로 변환하면, 그것을 VLAD 레이어에서 벡터로 변환하고, 이 벡터들사이에서의 유사도를 찾아 장소를 구분한다는 내용이다.
이 한줄을 이해 못해서, 무려 2~3주간 헛짓을 했다. GPT를 통해 코드를 짜다보니, 내가 NetVLAD를 작성하고 있는것인지, 아니면 다른걸 하고 있는지 감도 못잡았었다.
새삼 내가 짠 코드가 어떤 기능을 하는지 제대로 파악하지도 못했다. 시간이 없었다기엔 내가 너무 무심했던것 같다.
NetVLAD 오리지널 논문을 참조한다면, 빅모델을 통해 환경이미지를 Pre-train 과정을 거쳐 모델을 freezing 해야 하는데, ChatGPT의 가이드대로 실습용 코드작성에만 매몰되다보니, 사실상 AP-GeM 코드를 짜버렸다. 아니다. 오히려 DenseVLAD인가? 딥러닝이 없다고는 말 못하니. AP-GeM이 맞겠다. 읽어볼 논문이 많아졌네…
서베이를 찾아보니 결국 VPR
VPR이란 용어를 이제사 처음보네. 이미지를 가지고 장소를 추정하는게 가능할거란 생각은 했는데, Visual Place Recognition 명칭으로 기술이 정형화 되어있다는건 첨 알았다. 읽어볼 논문이 늘었다…. 아놔.. Survey 논문을 하나 찾았는데, 이건 또 리뷰할려면 얼마나 걸릴려나.. 걱정이네.
댓글남기기