분류 전체보기 613

Stable-SCore: A Stable Registration-based Framework for 3D Shape Correspondence

내 맘대로 Introduction많고 많은 mesh간의 correspondence를 추정한 다음, registration하는 논문. 간단히 말하면 형상이 다른 mesh를 A->B로 registration하는 방법. 광범위한 correspondence 데이터셋을 활용해서 최적화에 사용할 flow를 뱉어주는 네트워크를 사전에 학습시킨게 핵심이고 뒤에 최적화의 경우 diff-rendering을 사용한 익숙한 방법. 디테일 적으로 NJF를 이용해서 최적화하거나 하는 부분도 좋은 듯.확실한 prior를 갖고 시작하다보니 기존 방식 대비 왜곡이 적은 것 같다. 메모전체 파이프라인은 2D correspondence에 강하게 의존한다. SD-DINO를 기본으로 feature extractor를 만들었는데, 이 네트워크..

Paper/Others 2026.01.20

Gaussian Opacity Fields: Efficient Adaptive Surface Reconstruction in Unbounded Scenes

내 맘대로 Introduction Gaussian-to-Mesh에 속하는 논문인데, 3DGS에는 3DGS->2DGS로 내려찍는 방식으로 하는데 반대로 조금은 느리겠지만 NeRF에서 원래 하던 방식대로 pixel-to-ray를 만들고 ray tracing하면서 3DGS를 적분해나가는 식으로 바꾼 논문. 왜 이 불편함을 감수하느냐. ray 단위로 다시 시선을 바꾼 다음 적분하기 시작하면 NeRF에서 그랬듯 surface를 찾기 쉬워지기 때문이다. 이 논문에서는 3DGS를 학습할 때 surface를 쉽게 찾아 meshing 난이도를 낮추기 위한 loss로 제안하지만 그보다 더 핵심은 어떻게 주어진 3DGS에 NeRF에서 쓰던 ray 단위의 적분을 적용할 것이냐다. 메모세팅은 일반 3DGS랑 완벽히 동일함...

Paper/3D vision 2026.01.20

AnyUp : Universal Feature Upsampling

내 맘대로 Introduction이전에 FeatUp이라는 논문을 보고 모델마다 새학습, 샘플마다 새학습 문제로 범용성이 매우 떨어진다고 생각하고 말았는데, 범용성을 개선한 버전이 나왔다. 래퍼런스 논문들을 보니 이 foundation feature 해상도를 높이는 연구가 간간히 되어왔던 것 같긴 하다. 컨셉은 아주 간단하고 어찌보면 가장 쉽게 생각할 수 있는 방식인 것 같다. 구조를 어떤식으로 썼는지와 학습을 안정적으로 한 것에 의미가 좀 더 있는 듯. 메모해상도, 모델따라 재학습을 최소화한게 장점. 그림이 설명을 너무 잘해서. 그럼보면 끝.고해상도에서 feature 뽑고 crop한거랑저해상도에서 feature 뽑고 upsample 한거랑 같도록 함. cossim + l2로 학습구조적 핵심은 local ..

Paper/Others 2025.11.12

Animal Avatars: Reconstructing Animatable 3D Animals from Casual Videos

내 맘대로 Introduction동물 논문은 예전에 SMAL 이후로 본 적이 사실 없는데, 그 이후로 그렇게 발전한 것 같진 않다. 데이터가 없을 뿐더러 관심도 낮아서 연구가 그리 많이 안된 느낌. 이해도 가는게 움직이는 개를 어떻게 찍나...그리고 개를 그렇게 많이 모으는 것도 힘들고 털이 많아서 reconstruction도 애초에 안되니 데이터를 모을 수가 없다. (어찌 보면 블루 오션인 것 같기도) 이 논문은 주어진 개 video에서 해당 개랑 가장 닮은 SMAL 파라미터를 뽑아주고, NeRF 컨셉을 이용해서 texture를 발라주는 논문이다. SMAL에 색상을 입히는 방식이기 때문에 정확도가 엄청 높진 않다. 하지만 여태까지 다뤘던 논문 대비는 완성도가 많이 올라간 버전. 핵심은 CSE가 동물 ..

Paper/Others 2025.11.10

DualPM: Dual Posed-Canonical Point Maps for 3D Shape and Pose Reconstruction

내 맘대로 Introduction point map representation이 인기를 얻으면서 누군가는 canonical point map을 다룰 것이라고 바로 생각했었는데, 역시나 있다. 정말 naive하게 camera space point를 예측함과 동시에 canonical space point를 픽셀 별로 예측하는 걸 추가한 것. 새로운 formulation 없이 output에 추가되었다는 것은 좀 아쉬운 점. GT가 존재해야만 풀 수 있는 문제이므로, 일반화할 수 없는게 아쉽다. 뭔가 self-supervised 요소를 넣어서 풀었다면 확장이 가능하니까 더 좋았을 것 같은데... 누군가 곧 하겠지 deformed-canonical 구도에서 주 대상은 역사적으로 사람이었는데, 사람은 변화 자유도가..

Paper/Others 2025.11.10

curope, RoPE cuda version 설치 실패하는 문제

DUST3R 붐의 기저 연구인 CrocoV2 에서 사용하면서 요새 간간히 사용하는게 보이는 RoPE. 속도가 일반 PE보다 느리긴 해서 학습 효율을 위해 CUDA로 구현된 코드가 같이 제공된다. Croco든 dust3r든 human3r인든 같은 코드를 쓰고 설치는 웬만하면 다음과 같이만 안내된다.cd models/curope/python setup.py build_ext --inplacecd ../../ 문제는 한 방에 안 될때가 많다는 것. 오류명을 봐도 뭐가 문젠지 몰라서 감을 못잡다가 최근에 우연히 해결했다. 원인결국 torch 버전 문젠데 torch 버전이 올라가면서 못 따라오는 문제. 내 생각엔 2.6 버전 이후부터 이런 것 같다. tokens.type()라고 쓰는 문법이 deprecated ..

ImHead: A Large-scale Implicit Morphable Model for Localized Head Modeling

내 맘대로 Introduction 어쩌면 NPHM의 후속작이라고 불릴 수 있을 것 같은데, 약간의 Local controllability를 향상시키고 데이터셋의 범위를 크기 넓혀서 만들었다. 데이터셋을 4000 id 규모로 공개하고 학습에 이용했는데, 직접 스캔한 것을 이렇게 공개했나 하고 대단하다고 생각했었는데 있는 안면부 데이터를 completion해서 사용했다. MimicMe 데이터셋에 NPHM을 피팅해서 사용하는 방식 + 약간의 후처리를 곁들였다. 메모1. mimicme에서 4000개 subject 20개 expression 얼굴 스캔을 가져옴2. FLAME fitting해서 좌표계 맞추고 스케일 맞추고. 3. NPHM을 피팅함. 4. NPHM mesh를 얻어낸 다음, 얼굴부만 NICP로 한..

Paper/Human 2025.10.27

Generative Human Geometry Distribution

내 맘대로 Introduction Geometry Distributions 을 준비하면서 동시에 준비한 듯한 논문. 데이터의 표현법을 고민했으니, 이 표현법을 사용해서 뭔가 새로운 시도를 해보고 싶었을 것이다. 그 결과 3D generative model의 새로운 접근을 보여준다. 기존 방식들은 SDF representation을 사용하므로 학습이 굉장히 어렵다. surface point sampling 방식에 따라서, 그리고 네트워크 크기에 따라서 말이다. 저자들이 이전 논문에서 제안한 방식은 학습만 된다면 데이터를 효과적으로 표현하는 대체재를 만들기 때문에 좀 더 효율적인 모델 학습이 가능할 것으로 기대된다. 일단 budget의 한계인지 사람 데이터로 scope를 줄여서 시도했다. objaverse..

Paper/Human 2025.10.27

Geometry Distributions

내 맘대로 Introduction ICCV 2025에 가서 현장에서 본 포스터 중 눈에 띄어서 읽어본 논문. mesh의 surface point를 gaussian distribution으로 압축하고, 나중에 이 distribution만 갖고 다시 mesh surface points를 복원해낼 수 있도록 한 논문. 일종의 새로운 3D 표현법 이면서 압축률까지 가져갈 수 있는 방식. mesh resolution, 처리 가능한 point의 개수, watertightness 등 3D 데이터를 처리할 때 발목을 붙잡는 많은 이슈들이 있는데 그걸 해결해보고자 시도한 방식. 나 또한 메모리가 한정된 상황에서 그리고 데이터마다 퀄리티가 다른 상황에서 이걸 어떻게 동일한 기준으로 encoding하여 사용할 수 있을지 고..

Paper/Others 2025.10.27