sensor fusion for semantic segmentation of urban...

Sensor Fusion for Semantic Segmentation of Urban Scenes

Richard Zhang1, Stefan A. Candra1, Kai Vetter12, Avideh Zakhor1

1University of California, Berkeley2Lawrence Berkeley National Laboratory

Presented at ICRA, May 2015

1

Goal

• Extract semantic information by fusing multiple modalities• Image

• LiDAR scan

• Challenges• Incorporate information from

multiple scales

• Fuse information from multiple modalities with non-overlapping sensor coverage

2

Top Level Pipeline

3

Previous WorkSegmentation Image Features Point cloud features Fusion

Sengupta et al.ICRA 2013

none Descriptive none majority votingof image

classifications in 3DHe and Upcroft.IROS 2013

Single segmentationimage only

Descriptive none

4






Descriptive none

Cadena and Košecká. ICRA 2014.


Simple Simple Early fusion

5






Descriptive none

Cadena and Košecká. ICRA 2014.


Simple Simple Early fusion

Oursmultiple segmentations

both domainsDescriptive Descriptive Late fusion

6

Segmentation

• Treating each pixel/point separately is computationally intensive

• Under-segmentation & Over-segmentation errors

Multiple segmentations performed to get superpixels/supervoxels

7

Segmentation

• Treating each pixel/point separately is computationally intensive

• Under-segmentation & Over-segmentation errors

Multiple segmentations performed to get superpixels/supervoxels

8

Feature Extraction

9

Point cloud supervoxel featuresImage superpixel features

Early FusionImage

features

Point cloudfeatures

Image-only segmentation

10

Imageinformation

only

Early FusionImage

features

Point cloudfeatures


Point cloud-onlysegmentation

11

Imageinformation

only

Point cloudinformation

only

Early FusionImage

features

Point cloudfeatures

Overlappingsensor

coverage

Fused segmentation



12

Imageinformation

only


only

Early FusionImage

features

Point cloudfeatures

Overlappingsensor

coverage

Fused segmentation



Large feature spaceLess training data

13

Imageinformation

only


only

Late Fusion

Imagefeatures

Point cloudfeatures

Image-onlysegmentation

Overlappingsensor

coverage

Point cloud onlysegmentation

Fused segmentation



14

Late Fusion

Imagefeatures

Point cloudfeatures

Image-onlysegmentation

Overlappingsensor

coverage

Point cloud onlysegmentation

Fused segmentation



15

Mid-level

feature

Fusion

PC onlyPoint cloud unimodal segmentation

Ground Truth

16

Image unimodal segmentation

Fusion

PC only


Ground Truth

Point cloud unimodal segmentation(projected onto image)

17

Fusion

Ground Truth

Late-fused multi-modal segmentation

18

PC only



PC only



Fusion

Ground Truth


19

PC only



Fusion

Ground Truth


20

Fusion

Ground Truth


Fused segmentation & Post-processingConditional Random Field (CRF) 21

PC only



Fusion

22

PC only Image only FusedPerformance on overlapping region

Fusion

23


Fusion

24


Fusion

25


Results

• Quantitative Results• Train and test on KITTI1 dataset, augmented with

additional annotations

• 252 images across 8 sequences• 140 images for training, 112 for testing

1Geiger, et al. KITTI. CVPR 12 26

Results





Thank you!

30

sensor fusion for semantic segmentation of urban...

Documents