분류 전체보기 439

Timezone, geographic area 설정으로 인한 Docker build 무한 대기 해결법

간혹 Dockerfile 내 설치하는 패키지 중 time zone, greographic area처럼 유저가 직접 설정하는 내용이 있을 경우, docker build가 더 진행되지 않고 대기 상태에 빠져 무한 루프 돌고 있을 때가 있다.  해결법1. 직접 입력해주기ENV $TIMEZONE=Asia/SeoulRUN ln -snf /usr/share/zoneinfo/$TIMEZONE /etc/localtime 2. 무시하도록 하기ENV DEBIAN_FRONTEND=noninteractive 개인적으로 후자로 박아넣는 것이 더 좋더라. interactivate input을 받는 내용 중 크리티컬한 것들은 별로 없었음.

Trouble/Docker 2024.05.07

Delicate Textured Mesh Recovery from NeRF via Adaptive Surface Refinement

내 맘대로 Introduction 알고리즘적 개선이 아닌 파이프라인 논문. NeRF + diff.renderer를 이용한 refinement를 붙여서 품질 좋은 mesh를 얻어내는 파이프라인을 만들고 그 속도를 최대한 가속한 논문. 최종 출력이 Blender나 unity 같은 상용툴에 입력으로 쓰일 수 있는 OBJ 같은 형태.  상용툴에서 색상을 diffuse + specular로 분리해서 다루므로 논문에서도 diffuse, specular로 색깔을 나누어 다루었을 뿐 나머지는 전부 기존 논문들과 같다. 가져다 쓴 조합형 논문. 가속화하고 구현해낸 것에 의의가 있음. 메모총 2 stage1) stage1- grid-based NeRF로 빠르게 coarse geometry + appearance 복원2) ..

POCO: 3D Pose and Shape Estimation with Confidence

내 맘대로 Introduction top-down 방식의 HMR 논문들의 공통점은 추정값에 대한 confidence가 없다는 것이다. keypoint는 애초에 heatmap으로 추정하기 때문에 confidence를 쉽게 얻어낼 수 있지만 파라미터를 추정하는 HMR 시리즈는 confidence를 얻어내기 어렵다. 생각해보면 당연히 필요한 것이었는데 명확히 방법론이 없어서 구현되지 못했던 내용. 조건은 기존 HMR에 그대로 갖다 붙일 수 있도록 구현해야하는 것 + confidence가 실제 uncertainty를 잘 반영할 것 2가지다. 핵심은 생각보다 간단하다. 그냥 uncertainty(혹은 confidence)를 추정하는 네트워크를 추가하고 loss term의 분모에다 갖다 붙이는 것이다. 그러면 po..

Paper/Human 2024.05.07

Learning an Animatable Detailed 3D Face Model from In-The-Wild Images

내 맘대로 Introductionsingle image to 3d animatable avatar. 일종의 HMR 처럼, 3DMM FLAME 모델 파라미터를 추정하는 backbone인데 In-the-wild 이미지를 학습 데이터로 사용했기 때문에 데이터 양에서 강점이 있다. 더불어 모델 파라미터만 추정하는 것이 아니라, light, albedo, subject-specifi detail (displacement map) 같은 것을 같이 추정하도록 설계한 것이 차이점. 핵심은 3DMM FLAME 파라미터가 미처 표현하지 못하는 subject-specific detail을 추정하도록 네트워크를 설계한 점과, 이 둘이 각각 다른 feature를 사용하도록 분리했다는 점이다. 직관적으로 표정이나 뚱뚱한 정도가 ..

Paper/Human 2024.05.07

타이탄의 도구들

끄적끄적제목이 워낙 알려진 유명한 책이지만 대놓고 이렇게 해라, 저렇게 해라 하는 자기계발서일 것 같아서 미뤄두다가 추천을 받아 읽게 되었다. 문득 읽다보니 이래라 저래라 하는 책을 안 좋게 보는 선입견이 왜 생겼나 생각하게 되었는데 검증된 책이라면 믿어도 좋을 것 같다. 사회적으로 인정받는 사람 1명 당 조언 1개로 엮인 책인데 선택적으로 몇 개만 취해도 좋은 내용들이다. 이제는 사소한 것이 큰 차이를 만든다는 생각, 태도가 전부라는 생각을 하게 된 시점에 다시 보니 이런 책들이 정수를 담은 책인가 싶다. 읽어보기 충분히 좋은 책. 짧은 후기책을 읽는 동안 전역한 미국 해군 맥 레이븐 대장이 한 연설에서 성공하고 싶으면 아침에 일어나서 이불을 개라고 말한 것이 생각났다. 매일 아침에 만든 작은 성공을 ..

Book/Motivation 2024.05.06

Instant Volumetric Head Avatars (a.k.a INSTA)

내 맘대로 Introduction monocular head video to animatable implicit head avatar. 같은 문제를 푸는 논문이 워낙 많아서 입력, 출력은 여느 논문과 같다. 이 논문은 비교적 나온지 오래된 논문이고 InstantNGP랑 같은 원리로 가속했고, 3DMM expression parameter를 컨디션으로 주었다.  핵심 아이디어는 역시나 expression parameter를 컨디션으로 주고 deformation field를 계한 뒤, 알짜 학습은 canonical space에서만 한다는 것. 그리고 grid hasing을 이용해 가속했다는 점. 참고 포인트는 deformation field를 "예측"한 것이 아니라 3DMM tracking 결과를 이용해서 ..

Paper/Human 2024.05.03

AvatarMAV: Fast 3D Head Avatar Reconstruction Using Motion-Aware Neural Voxels

내 맘대로 Introduction monocular video로부터 NeRF 컨셉 기반의 implicit animatable head avatar를 만드는 방법. 역시나 표정 변화를 위해 3DMM을 활용했다.  핵심 아이디어는 3DMM expression coefficient 1개 1개마다 voxel basis를 붙여서 3D 공간을 더 잘 표현함과 동시에 3DMM과는 implicit하게 엮여있도록 유지했다는 점이다. 단순한 아이디어이지만 SIGGRAPH 게재 논문이고 속도 개선과 성능 개선이 둘 다 돋보이는 논문. 메모NeRF 컨셉인데 기본 표현 구조는 voxel grid (feature volume)을 사용함. 이는 메모리 사용량과 속도 때문.1) canonical apperance voxel grid..

Paper/Human 2024.05.03

SNARF: Differentiable Forward Skinning for Animating Non-Rigid Neural Implicit Shapes

내 맘대로 Introduction3D mesh + joint set이 sequence로 있을 때 skinning weight를 찾아내는 방법이다. 각 frame mesh마다 correspodence를 찾는 일이 쉽지 않기 때문에 일단 explicit mesh (vertex)를 이용해 correspondence를 찾진 않고 implicit field를 이용해 correspondence를 찾는다. 그리고 correspondence를 기반으로 forward skinning을 수행한 뒤 loss를 먹여 skinning weight를 업데이트하는 방식. 말이 길었는데 진짜 skinning weight 자동으로 찾는 논문이다. backward skinning이 아니라 forward skinning을 사용한 이유가 ..

Paper/Human 2024.05.02

AG3D: Learning to Generate 3D Avatars from 2D Image Collections

내 맘대로 Introduction 제목에서도 느껴지듯이 EG3D의 human 버전 확장판이라고 볼 수 있다. EG3D 확장답게 3D GAN + Multi-planes을 차용한 구조를 사용한다. 핵심 아이디어는 3D 데이터 없이 많은 2D 데이터를 먹여서 generator를 학습시키는 것이다. discriminator도 여러개 붙이고 super resolution module까지 붙여서 조금 조잡한 느낌이 나지만 그래도 준수한 논문. 메모1) 3D generator가 canonical SDF 예측하도록 함2) pose-conditioned deformation 후 volume rendering3) rgb, normal 2레벨에서 discriminator 적용4) super resolution 붙여서 고화질..

Paper/Human 2024.05.02

InstantID: Zero-shot Identity-Preserving Generation in Seconds

내 맘대로 Introduction IPadapter + ControlNet을 붙여서 face-identity 유지 잘 되는 SD model 만드는 방법론을 제시한 논문. 알고리즘적 발전보다는 조립을 어떻게 하니까 잘 되더라 발견한데 의의가 있는 논문으로 약간 조립형 논문 같아 보인다.  핵심 아이디어는 Face embedding을 기존 face detection + ReID를 잘하는 모델을 가져와서 쓴 것이다. 이외 facial condition을 keypoint 5개만 쓴다거나 text embedding 대신 ID embedding을 ControlNet에 넣어주거나 하는 트릭은 경험치 정도의 의미가 있는 것 같다. 메모1) Face detector + ReID 모델 + MLP 조합으로 Face embe..

Paper/Generation 2024.04.30