| 일 | 월 | 화 | 수 | 목 | 금 | 토 |
|---|---|---|---|---|---|---|
| 1 | ||||||
| 2 | 3 | 4 | 5 | 6 | 7 | 8 |
| 9 | 10 | 11 | 12 | 13 | 14 | 15 |
| 16 | 17 | 18 | 19 | 20 | 21 | 22 |
| 23 | 24 | 25 | 26 | 27 | 28 | 29 |
| 30 |
- 백준스택
- 이것이자바다
- BOJ
- 백준평범한배낭
- 백준가운데를말해요
- 웹개발기초
- 윤곽선검출
- 코드트리
- 스파르타코딩클럽
- 이것이자바다확인문제
- 딥러닝
- 가운데를말해요
- 합성곱연산
- 카카오코테
- 코딩테스트실력진단
- KT포트포워딩
- 코테
- BOJ1655
- 백준9012
- 백준온라인저지
- 백준10828
- 냅색알고리즘
- 2019카카오코테
- 백준괄호
- java
- 확인문제
- 이것이자바다9장
- 컴퓨터비전
- 운영체제
- 백준
- Today
- Total
목록분류 전체보기 (168)
코딩하는 락커
https://youtu.be/8oOgPUO-TBY 풀링은 합성곱 연산을 할 때 표현 크기를 줄임으로써 계산속도를 높이고 특성을 더 잘 검출해내는 방법이다. Max Pooling은 이미지의 구역을 뒤, 그 구역에서의 최대값을 출력값으로 지정하여 결과행렬을 도출해내는 것이다. 이것은 마치 2 x 2 사이즈에 stride=2 짜리 필터를 사용하는 것과 같다. 그렇다면 Max Pooling은 왜 사용하냐? 음...그것은 최대값이 원본 이미지의 어떤 특성을 나타낼 수 있기 때문이다. 마치 고양이의 눈처럼 말이다. Max Pooling을 사용하는 것은 대부분 구역의 최대값을 통해 구역별 이미지의 특성을 직관적으로 볼 수 있기 때문이라는 것과, 성능이 좋다는 데에 이유가 있다. Max Pooling의 또 한가지 특..
https://youtu.be/jPOAS7uCODQ 앞선 포스팅 입체형 이미지에서의 합성곱에서 구한 4 x 4 x Nc 사이즈의 결과 이미지를 합성곱 신경망 층으로 만들기 위해서 해야 할 마지막 일은 각각에 편향Bias을 곱해 주는 것이다. 이 때 Bias값은 실수여야 하며 모든 요소에 동일한 수를 더해주어야 하며 ReLU와 같은 비선형성을 적용해주어야 한다. 다른 채널의 결과 이미지도 마찬가지이다. 그리고 결과 이미지를 모두 쌓으면 비로소 신경망의 한 계층이 되는 것이다. 이제 합성곱이 아닌 표준 신경망의 한 계층으로 연결시켜보자. 전파의 바로 전 단계는 z[1] = w[1]a[0](=x)+b[1]에 비선형성을 적용해줌으로써 a[1]=g(z[1])를 얻는데, 여기서 a[0]는 6 x 6 x 3 사이즈의..
https://youtu.be/KTB_OFoAQcc 자 이제 2D 이미지의 합성곱에서 3D 이미지의 합성곱으로 넘어가보자. 이 때 3D 이미지란 우리가 생각하는 진짜 그...입체 이미지가 아니라 R,G,B와 같은 여러 채널이 있는 이미지를 의미한다. 위 이미지와 같은 6 x 6 x 3(R,G,B채널) 사이즈의 이미지가 있다고 했을 때 3 x 3 x 3 사이즈의 필터와 합성곱 연산을 한다고 해보자. 중요한 점은 이미지와 필터의 채널의 수가 같아야 한다. 이 연산을 하기 위해서 먼저 필터를 이미지의 맨 왼쪽 맨 위 에 두고 3x3x3=27개의 각각의 숫자들을 빨강,초록,파랑 각 채널의 9개에 값에 곱해주고 주면 4 x 4 결과 이미지의 맨 왼쪽 맨 위 값을 구할 수 있다. 이런식으로 계산을 완료하면 결과 이..
https://youtu.be/tQYZaDn_kSg 스트라이드 합성곱은 합성곱 신경망의 기본 요소이다. 예제를 통해 stride=2인 경우에 대해 알아보자. 먼저 7x7 사이즈의 원본 이미지와 3x3 사이즈의 필터를 합성곱 연산한다고 할 때, 위 이미지에서 볼 수 있듯 4x4 사이즈의 결과 이미지의 최상단 맨 왼쪽의 결과값은 91이 나온다. 그리고 다음 합성곱 연산을 한다고 할 때, 한 픽셀 옆으로 것이 아니라 두 픽셀 옆으로 이동하는 것이다. 바로 아래 이미지처럼 말이다. 이렇게 두 픽셀을 뛰어넘어 합성곱 연산을 한 결과 100이 나오고, 그 다음에 아까 한 것과 같이 두 픽셀을 또 뛰어넘는다. 그리고 합성곱 연산한 결과 결과 이미지의 최상단 맨 오른쪽의 결과값은 83이 나오게 된다. 그 다음 아래쪽으..
https://youtu.be/smHa2442Ah4 패딩은 합성곱 신경망을 변형하는 한 방식이라고 한다. 지금까지는 nxn 이미지를 fxf필터로 합성곱을 한 결과로 n-f+1x n-f+1이 나오는 것을 보았다. 그래서 6x6 이미지의 경우 6-3+1 = 4 이므로 4x4 이미지가 나온 것이다. 히지만 아주 치명적인 단점이 좀 있다. 첫 번째는 바로 합성곱 연산을 할 때마다 이미지가 작아진다는 것이다. 이 것이 왜 문제냐면, 합성곱 신경망에서 수백 개의 층에서 각 층마다 축소된다면 모든 층을 거치고 난 후에는 아주아주 작은 이미지가 나오게 되기 때문이다. 두 번째는 이미지의 어떤 부분, 그러니까 이미지의 가장자리 같은 경우는 결과값을 내는 데에 한번밖에 사용되지 않지만, 이미지의 중간 부분은 결과값을 내는..
https://youtu.be/am36dePheDc 이번에는 컴퓨터 비전에서 서로 다른 밝기의 전환을 찾아내는 방법, 그 외의 모서리 검출, 그리고 드디어...! 프로그래머의 코딩이 아니라 스스로 학습을 하는 알고리즘에 대해 알아보도록 하겠다. https://youtu.be/am36dePheDc 위 그림의 상단은 바로 전 포스팅에서 다룬 합성곱 계산을 통한 6x6크기의 흰검 이미지의 경계선을 추출을 나타낸다. 결과 이미지는 4x4사이즈의 회흰검 이미지가 나온다. 그렇다면 이 이미지를 뒤집어서 6x6크기의 검흰 이미지의 경계선을 추출하면 어떤 결과 이미지가 나올까? 위 이미지 하단의 4x4사이즈 결과 이미지는 '회흰회'이미지가 아닌 '회검회'이미지볼 수 있다. 회흰회냐 회검회냐가 뭐가 그렇게 중요하냐고? ..
https://youtu.be/XuD4C8vJzEQ 합성곱 신경망 CNN을 만들기 위해선 합성곱 작업을 해야한다. 넘 당연한 얘기다. 모서리 감지를 통해 합성곱이 어떻게 작용하는지 알아보자! 컴퓨터가 사진을 인식하게 하기 위해 하는 첫 번째 일은 이미지에서 '수직인 모서리'를 찾는 것이다. 수직인 모서리를 찾았다면 다음으로는 '수평인 모서리'를 찾아야 한다. 그러면 이 모서리를 대체 어떻게 찾는 걸까? 여기에 6x6짜리 그레이 스케일의 이미지가 있다고 할 때, 이 이미지의 수직 모서리를 알기 위해서는 우선 합성곱 신경망에서 '필터'라고 불리는 3x3짜리 행렬을 만들어야 한다. 필터를 만들었으면 10-110-110-1을 입력한 뒤, 6x6이미지와 합성곱==Convolution==*을 해준다. 합성곱의 결과..
https://youtu.be/ArPaAX_PhIs 딥러닝의 발전은 여러 분야의 발전을 야기하고 있다. 그 중 하나가 바로 '컴퓨터 비전'! 딥러닝 컴퓨터 비전이라 함은 다른 차나 보행자를 인식해서 피할 수 있게 하거나, 휴대폰 잠금 해체나 문 열기 등에서 사용되는 얼굴 인식 기능을 더욱 빠르고 정확하게 하도록 한다. 물론 얼굴 뿐 아니라 음식이나 풍경 등의 이미지도 사용할 수 있다. 그렇다면 딥러닝 컴퓨터 비전이 관심을 받는 이유는 뭘까? 그 이유는 새롭고 다양한 어플리케이션이 만들어질 수 있으며, 컴퓨터 비전이 다른 여러 분야의 신경망 구조와 알고리즘에 많은 영감을 주기 때문이다. (컴퓨터 비전의 개념이 음성인식에 사용되는 것처럼!) 여튼... 이러한 컴퓨터 비전은 두 가지 문제를 다루고 있다. 첫 ..