반응형
내 맘대로 Introduction
Neural ICP라는 이름에서 바로 느낌 오듯이 기존 ICP 알고리즘에서 distance measure를 neural net으로 대체한 논문이다. euclidean distance로 nearest-neighbor를 찾아 거리를 좁히는 방식인데, nearest match가 잘되었을 때만 효과적이고 잘못되었을 때는 완전히 망가지는 방식이기 때문에 network가 semantic 정보를 기반으로 무조건적 nearest를 좀 걸러주길 기대하는 방식.
ICP도 그렇듯 초기화가 굉장히 성능을 좌지우지하는데, 이 역시 아무리 network를 쓴다고 해도 target shape에서 크게 벗어난 초기값에서 시작하는 것을 무리다. 그래서 기존 방식을 stage 1으로 붙이고 제안하는 방식을 stage 2에 붙이는 방식으로 구현했다.
메모
![]() |
기존 방식은 target shape point cloud가 query로 들어오고, 이 query들로부터 각 template vertex까지의 offset를 계산하는 방식이다. 일명 NF 모든 걸 네트워크 예측값에 의존하기 때문에 데이터 distribution 즉 도메인 안에서만 잘된다는 문제가 있다고 지적함. -> 그래서 뒤에 NICP ( distance measure만 neural net.이고 나머지는 최적화인 형태)를 붙인 것. |
![]() |
|
![]() ![]() ![]() |
NF + NICP + chamfer distance로 최종 다듬기 순서 (match 간에만) 앞에 NF를 학습시킬 때는 조금 변형시켜서 MLP를 여러개 두고, part-part 마다 각각 학습시켰음 이때 파트를 나누는 방식은 Template mesh에 laplace beltrami-operator 적용해서 eigen vectecor 뽑고, 탑 16을 뽑아서 사용함 ->mesh가 heatmap처럼 16개로 쪼개져 있을 것 ![]() -> 맞네 -> 나머지는 LVD 논문 참조. -> IF net은 저해상도 3d conv net. |
![]() |
ICP 돌릴 때 target shape pointcloud가 주어지면 network에 던짐 -> 나오는 값이 template vertex 개수만큼 나옴 -> 최소값 이랑 매칭 -> 해당 최소값이 0이 되도록 학습 ----------- self-supervised 형태임. GT match가 명확히 존재하지 않기 때문에 애초에. 잘못될 수 있음. 하지만 수렴할 때까지 반복하다보면 알아서 찾아가나봄. target shape 바뀔때마다 새로하는게 맞음. 근데 몇 초 안걸린다고 함. |
![]() |
최종적으로 target shape에 완전 갖다붙이기 위해서 charmfer distance + laplace로 마지막 튜닝. |
![]() |
![]() |
![]() |
|
![]() ![]() |
반응형
'Paper > Human' 카테고리의 다른 글
HeadCraft: Modeling High-Detail Shape Variations for Animated 3DMMs (0) | 2024.12.27 |
---|---|
Topo4D: Topology-Preserving Gaussian Splatting for High-Fidelity 4D Head Capture (0) | 2024.12.26 |
FFHQ-UV: Normalized Facial UV-Texture Dataset for 3D Face Reconstruction (0) | 2024.12.11 |
Pixel Codec Avatars (0) | 2024.12.03 |
Cross-view and Cross-pose Completion for 3D Human Understanding (0) | 2024.11.14 |