관리 메뉴

코딩하는 락커

[Week3] 컴퓨터 비전 본문

[2020] 📚 DSC 겨울방학 스터디

[Week3] 컴퓨터 비전

락꿈사 2020. 1. 20. 16:02

https://youtu.be/ArPaAX_PhIs

 

딥러닝의 발전은 여러 분야의 발전을 야기하고 있다. 그 중 하나가 바로 '컴퓨터 비전'!

 

딥러닝 컴퓨터 비전이라 함은 다른 차나 보행자를 인식해서 피할 수 있게 하거나,  휴대폰 잠금 해체나 문 열기 등에서 사용되는 얼굴 인식 기능을 더욱 빠르고 정확하게 하도록 한다.

 

물론 얼굴 뿐 아니라 음식이나 풍경 등의 이미지도 사용할 수 있다.

 

그렇다면 딥러닝 컴퓨터 비전이 관심을 받는 이유는 뭘까?

 

그 이유는 새롭고 다양한 어플리케이션이 만들어질 수 있으며, 컴퓨터 비전이 다른 여러 분야의 신경망 구조와 알고리즘에 많은 영감을 주기 때문이다. (컴퓨터 비전의 개념이 음성인식에 사용되는 것처럼!)

 

 


 

 

 

여튼... 이러한 컴퓨터 비전은 두 가지 문제를 다루고 있다.

 

첫 번째는 Image Classification이다. 64 X 64 사이즈의 사진을 넣고 이게 무슨 사진인지 알아보는 문제이다.

 

두 번째는  Object detection이다. 단순히 물체가 있는지 없는지만 따지는 것이 아니라, 물체 주변에 네모 박스를 그리거나 하는 방식으로 물체가 어느 위치에 있는지를 식별하는 문제이다. 

 

세 번째는 Neural Style Transfer이다. 컨텐츠 이미지를 스타일이 이미지로 그려서 새로운 이미지를 만드는 것과 같은 문제이다.

 


 

 

딥러닝 컴퓨터 비전에는 해결해야 할 문제점이 하나 있는데, 그것은 고해상도의 이미지에서 발생한다.

 

예를 들어 1000x1000 사이즈의 이미지가 있다고 했을 때 신경망에는 3백만개의 입력값이 들어가야만 한다...!! 웁스..

 

결국 이 신경망은 1000x3,000,000의 크기를 가진 어마무시하게 큰 행렬이 될 것이고, 이 행렬은 또 30억개의 어마무시하게 많은 변수를 가지게 될 것이다. 

 

이렇게 변수가 많으면 과적합을 방지하기 어려우며 계산량이 많아지고 메모리를 많이 차지하게 되고... 하여튼 안 좋다. 

 

하지만 합성곱 연산을 사용한다면, 즉 CNN을 구현한다면 이러한 문제점을 해결할 수 있다고 한다.  진짜 대박이다. 합성곱 신경만 CNN이 미국  케이블 뉴스 CNN보다 엄청난 놈이었던 것이다...!

Comments