본문 바로가기

논문 리뷰(Paper Review)

Scribble-Supervised LiDAR Semantic Segmentation

서론

- Lidar Point Cloud Dense 어노테이션은 시간/돈이 많이 든다

- 현재까지 Weak supervision 관련 문헌 존재 X

- Scribble(낙서, 날림으로 작성한 것) 어노테이션 된 Scribble-Kitti 데이터셋 공개

- Weak-Annotation을 사용할 때 발생하는 성능 격차를 줄이기 위한 파이프라인 제시

- 본 논문의 파이프라인은 모든 LiDAR Semantic Segmentation 모델과 결합할 수 있는 세 가지 독립된(Stand-Alone) 기능으로 구성되어 8%의 라벨링된 포인트만 사용하면서 완전 감독 성능의 최대 95.7%를 달성한다.

 

본문

세가지 독립된 기능

1) A teacher-student consistency loss on unlabeled points

    : Consistency Loss를 통해 라벨링 지정되지 않은 지점에서 Weak-Supervised 학습을 먼저 시도

2) Self-training scheme designed for outdoor LiDAR scenes

    : 라벨링 되지 않은 지점에 대한 모델의 자신감 있는 예측(?)을 고정하고, pseudo-labels을 사용한 self-training을 사용하여 감독 학습을 강화하였다.

3) A novel descriptor that improves pseudo-label quality

    : 표준 Self-training 전략은 자율주행 Scenes에 내재된 클래스의 long-tailed 분포(?)와 라이다 데이터에 내재된 다양한 범위에 걸친 큰 포인트 밀도 변동에 의해 확증 편향(?)의 경향이 짙다.

    : 이러한 문제를 해결하기 위해 클래스 범위의 균형 잡힌 pseudo-label 전략을 개발하여, 모든 클래스 범위에서 균일하게 타겟 라벨 샘플링을 수행한다. 마지막으로, pseudo-label 품질을 개선하기 위해, 다수 해상도에서 각 포인트 들에 대해  Local Surrounding에 대한 의미론적 사전 지식을 제공하는 새로운 Descriptor를 사용하여 입력 포인트 클라우드를 증강하였다. 

 

이러한 기술을 바탕으로 중간(mean) 교사 프레임워크를 사용하여 8% 라벨링된 데이터로 Fully Labeled 되어 학습한 모델 성능의 95.7%를 달성하였다.

 

 

학습 단계

 

 

 

확증 편향(確證偏向: Confirmation bias)은 원래 가지고 있는 생각이나 신념을 확인하려는 경향성이다. 흔히 하는 말로 “사람은 보고 싶은 것만 본다”와 같은 것이 바로 확증 편향이다. 인지심리학에서 확증 편향은 정보의 처리 과정에서 일어나는 인지 편향 가운데 하나이다. 사람들은 자신이 원하는 결과를 간절히 바랄 때, 또는 어떤 사건을 접하고 감정이 앞설 때, 그리고 저 마다의 뿌리 깊은 신념을 지키고자 할 때 확증 편향을 보인다. 확증 편향은 원하는 정보만 선택적으로 모으거나, 어떤 것을 설명하거나 주장할 때 편향된 방법을 동원한다.

(확증 편향 - 위키백과, 우리 모두의 백과사전 (wikipedia.org)

반응형