자율주행을 위한 공간 인식 기술
정밀지도(HD Map) 구축과 주행 환경 이해를 위한 핵심 3D Reconstruction 오픈소스를 분석합니다. COLMAP과 같은 고전적 기하학 기반 방식부터 SurroundOcc와 같은 최신 Occupancy Network까지 주요 기술의 특성을 비교합니다.
기술 분포도 (Landscape)
주요 오픈소스 프로젝트들의 실시간성(Real-time Capability)과 재구성 정밀도(Geometric Accuracy) 상관관계를 분석합니다. 차트의 포인트를 클릭하여 상세 정보를 확인하세요.
Performance vs. Accuracy Matrix
Click points to explore좌측 차트의 알고리즘을 선택하여
핵심 요약 정보를 확인하세요.
핵심 알고리즘 심층 분석
Geometric Approach vs. Deep Learning Approach
COLMAP 개요
범용적인 Structure-from-Motion (SfM) 및 Multi-View Stereo (MVS) 파이프라인입니다. 이미지가 주어졌을 때 카메라 포즈를 추정하고 희소/밀집 포인트 클라우드를 생성합니다.
- ● 용도: HD맵 구축을 위한 Ground Truth 생성, NeRF 학습 데이터 전처리.
- ● 장점: 매우 높은 기하학적 정확도, 강건성.
- ● 단점: 느린 연산 속도, 텍스처가 없는 영역(흰 벽, 도로 등)에서 실패 가능성.
COLMAP Pipeline Flow
(SIFT)
(Epipolar Geometry)
(SfM)
(MVS)
Reconstruction Time Distribution (Example)
이미지 수 증가에 따른 연산 시간 (Non-linear Growth)
SurroundOcc 개요
다중 카메라 이미지를 입력받아 3D Occupancy Grid를 예측하는 딥러닝 모델입니다. NeRF의 렌더링 방식과 유사한 방식을 사용하여 희소한 LiDAR 데이터 없이도 Dense한 3D 정보를 학습합니다.
- ● 용도: 동적 객체 인식, 주행 가능 영역 판단, BEV(Bird's Eye View) 지도 생성.
- ● 핵심 기술: 2D-3D Spatial Attention, Volumetric Rendering Supervision.
- ● 혁신성: Dense한 복원을 위해 비싼 3D Labeling 대신 2D Supervision 활용 가능.
SurroundOcc Architecture
Features
nuScenes Validation Set (mIoU %)
주요 클래스별 의미론적 분할(Semantic Segmentation) 성능
3D Gaussian Splatting (Emerging Tech)
최근 자율주행 맵핑 분야에서 급부상 중인 기술입니다. 수백만 개의 3D Gaussian 타원체를 이용해 장면을 표현합니다. NeRF보다 학습과 렌더링 속도가 훨씬 빠르며, 실시간 시각화가 가능합니다.
종합 비교 분석
| Category | COLMAP (SfM) | SurroundOcc | 3D Gaussian Splatting |
|---|---|---|---|
| 입력 데이터 | 이미지 세트 (순서 무관 가능) | Surround View Images (Video) | 이미지 + COLMAP Poses |
| 출력 형태 | Dense Point Cloud / Mesh | 3D Occupancy Grid (Voxel) | 3D Gaussians (Ellipsoids) |
| 의미론적 이해 (Semantics) | 불가능 (순수 기하학) | 강력함 (Dense Semantics) | 확장 가능 (Semantic Gaussian) |
| 동적 객체 처리 | 취약 (Ghosting 발생) | 가능 (4D Occupancy) | 연구 진행 중 (Dynamic GS) |
| 주요 활용 | 오프라인 정밀지도 구축, GT 생성 | 실시간 주행 판단, 경로 계획 | 시뮬레이션 렌더링, 시각화 |
주요 용어 해설 (Glossary)
Structure from Motion. 2D 이미지의 움직임에서 3D 구조를 복원하는 기술.
공간을 격자(Voxel)로 나누고 각 격자가 차있는지(Occupied) 비어있는지(Free) 확률로 표현.
Bird's Eye View. 하늘에서 내려다본 시점으로 변환하여 거리 왜곡 없이 주행 상황을 인지.
mean Intersection over Union. 예측 영역과 실제 영역의 교집합/합집합 비율로 정확도 측정.