카테고리 없음

패턴인식 1

따옹 2022. 9. 18. 09:54

인식

 

사람- DNA에 패턴을 인식하도록 각인됨

컴퓨터 - 패턴을 인식할 수 있게 하는 것이 우리의 목표

 

과학적 접근

왜 패턴 인식인가?

사람의 뇌가 어떻게 패턴을 인식하는 가를 이해하고 뇌를 모방하여 컴퓨터 개발에 적용

(초기 )사람의 뇌 작동과 유사한 방식으로 많은 관심을 끎 ➡️ 낮은 성능으로 관심 식음 ➡️ 다시 붐 ➡️좌절 ➡️2010~

 

패턴인식은 대부분 신경망을 이용하며,

물체의 주요한 특징을 어떻게 추출하여 분류하고 인식할 것인가 (N명 중, 특정 1명을 인식)

최근 Deeplearning은 분류와 특징 추출을 자동화로 진행함.

 

공학적 접근

우리 주변의 많은 패턴인식을 활용한 기기들

영상 데이터 처리 음성 데이터 처리
우편물 분류기
PDA 필기 입력기
동작인식 핸드폰(모션 인식)

지문 인식 마우스
과속 단속기(땅에 매설된 센서 이용)
청소로봇
음성 인식기

패턴이란? 

A pattern is the opposite of a chaos; it is an entity vaguely defined, that could be given a name 

무질서하지 않은 모든 데이터 형태

 

ex) 발바닥 지문 신생아 신원확인 시 사용, 흑백으로 처리하면 컴퓨터의 이해가 쉬움, 얼굴 홍채

 

패턴을 어떻게 인식 하는가?

 

패턴 ➡️ 특징(feature) ➡️ 분류(인식) ➡️ 부류(class)

대표적인 분류기 svm, decision tree, KNN, 베이지언 분류기, regression

 

개념적 절차

얼굴 인식

feature화 - 얼굴의 크기, 코의 모양, 눈썹, 눈의 크기

분류(특징을 뽑아서 분류) - 작다, 뾰족하다, 짙다, 작다

 

class(category) 

생체 특징 제품 이미지 내부 패턴  
얼굴, 지문 - ID 로 매핑 정상, 비정상 분류 빨간색, 네모 유무 Yes/NO 분류

 

데이터 베이스를 어떻게 수집 할 것인가?

train / validation(과적합 방지를 위해 사용) / test

 

8x8 64개 픽셀(특징)

그림 1.6은 그림 1.5를 2차원 공간으로 매핑한 것

필기 숫자 특징 추출에서 왼쪽 1의 개수, 오른쪽의 1의 개수를 계산해 숫자를 분류

 

변별력을 높이기 위해 데이터를 늘려야하는데, 차원의 저주로 overfiting 이 발생할 확률이 높아짐

인식의 성능을 고려해서 의미있는 데이터를 추가할 수 있도록 한다.

 

decision line, curve 선형인지 아닌지에 따라 분류,

 

(a) 너무 단순한 모델, (b) linear < curve 유리 , (c) overfiting

 

가운데 선 decision hyperplane

크면 농어, 작으면 연어

feature space

overfiting - generalization이 좋지 않다

train set 성능 굳, test bad

 

curved가 linear보다 좋은 성능을 가지며, 모델이 simple한 것이 더 좋다.

 

 

TN 어디에도 사용되지 않는다.

 

정확률 - 정답이라(TP+FP) 맞춘 것 중 TP

재현률 - 전체 정답(T) 중 TP (정답 중 얼마나 맞췄는가)

 

FP, TP, TN, FN 무엇인지 이해

 

TP(2) FP(2) FN(1)
d1, d7 d5, d8 d6

정확률, 재현률 Positive를 얼마나 잘 찾았는가를 평가, 보편적으로 많이 사용한다. (분자에는 항상 TP가 포함되어 있다)

Acc error rate Recall Precison
TP+ TN / N 1-Acc TP/FN+TP TP/FP+TP

 

K- 겹 교차 검증

장) 모든 data를 평균, 분산에 참여 시킴

단)  학습 시간이 많이 걸린다

붓스트램(bootstrap)

중복을 허용하여 하나의 set 형성 ➡️  여러 버젼 생성 ➡️  각각 분류기 생성 ➡️ 성능 향상을 위해 bagging을 이용 (결과 합산)

 

classification 인식 recognition - 모양이 달라지면 feature를 다르게 인식할 수 있다.

clustering 인지 cognition (category 자체 학습) - feature에 따라 모델을 만들고 clustering 결과에 lable 부여

이미지 분류

객체 검출(박스) / segmentation(픽셀)

 

사람은 이미지 분류가 쉽지만 컴퓨터에겐

종류, 이미지 각도, 딱딱/말랑(ligidm non-ligid object), 회전

인식 가능 범위에 따라 변화가능성이 높아지며 난이도가 올라간다