본문 바로가기

머신러닝

(16)
CNN의 오토인코더(Autoencoders) 오코인코더란? 입력을 출력으로 복사하는 신경망이다. 그림을 보면 input image가 있고 hidden layer의 수를 입력층보다 작게 해서 데이터를 압축하거나 노이즈를 추가한 이후에 원본 이미지를 복원한다. 오토인코더를 이용해서 입력을 출력으로 바로 복사하지 못하도록 하며 데이터를 효율적으로 표현하는 방법을 학습하도록 제어한다. 오토인코더는 인코더와 디코더로 구성되어있다. 인코더는 입력을 내부 표현으로 변환하고 디코더는 내부 표현을 출력으로 변환한다. Convolution autoencoder란? Convolution autoencoder는 합성곱 계층을 이용한 방법이다. 가중치의 형태를 CNN형태로 가져온다.
이미지 분할(Image Segmentation), 이미지 증강(Image Augmentation), 객체인식(Object Recognition) 이미지 분할이란? 이미지에서 객체가 있는 위치, 개체의 모양, 특정 픽셀이 어떤 개체해 속하는지 알고 싶을 때 이미지를 분할하여서 이용하면 편할 것이다. 그래서 이미지의 픽셀의 각각의 레이블이 부여된다. 간단하게 말하면 이미지 분할은 이미지를 픽셀 단위의 분할로 출력하도록 신경망을 훈련시키는 것이다. 이미지 분할을 이용할 때는 Unet을 대부분 이용한다. Unet은 인코더와 디코더를 포함하는데 미리 훈련된 모델을 인코더로 이용할 수 있다. 데이터 증강이란? 이미지를 회전키거나 바꾸어서 훈련 데이터의 다양성을 증가시키는 기술이다. 객체인식이란? 객체인식은 사전에 학습된 이미지 분류 신경망을 이용하여 다중 객체를 검출하는 것이다.
spaCy를 이용한 자연어처리(1) 먼저 spacy의 english를 import 한다. spacy에서 한국어는 아직 지원되지 않으므로 영어로 자연어 처리를 한다. English()객체를 nlp로 만들어준 다음 nlp안에 Hello world!!를 넣는다. for문으로 돌려보면 token.text안에는 각각의 내용들이 들어있다. from spacy.lang.en import English nlp = English() doc = nlp("Hello world!!") for token in doc: print(token.text) span = doc[1:3] print(span.text) doc2 = nlp("It is 5coins...") print("Index : ", [token.i for token in doc]) print("Text..
딥러닝 독학 3) 신경망 학습 신경망은 데이터에 따라서 가중치의 값을 자동으로 결정해준다. rudolf-2434.tistory.com/31 딥러닝 독학 1)퍼셉트론에서부터 신경망 퍼셉트론이란? 퍼셉트론은 딥러닝의 기원이 되는 알고리즘으로 딥러닝을 이해하기 위해서 꼭 필요한 개념이다. 퍼셉트론은 여러가지의 신호를 input으로 하여 하나의 output 을 내는 알고리즘이다 rudolf-2434.tistory.com 위에서 정리한 퍼셉트론의 경우 사람이 직접 매개변수의 값을 정했다. 실제 신경망에서는 매개변수가 수천~수만가지 이기 때문에 퍼셉트론 방식처럼 사람이 정할수는 없기 때문에 신경망은 매우 중요하다. 신경망 학습에 필요한 손실함수 신경망 학습에서는 현재 상태를 하나의 지표로 표현한다. 가중치 매개변수를 찾아 지표를 좋게 만들어주는..
딥러닝 독학 2) 소프트맥스 함수 소프트맥스를 들어가기 전 항등 함수 먼저 살펴보겠다. 항등함수는 우리가 고등학교 시절 항등원을 배웠듯 입력을 그대로 출력하는 함수이다. 그래서 항등함수를 사용하면 입력 신호가 출력 신호가 되어서 그대로 출력된다. 소프트맥스 함수란? 소프트맥스 함수는 분류 문제를 풀 때 이용된다. 소프트맥스 함수를 쓰면 각각의 점수를 클래스별 확률로 바꾸어 각각 점수가 총 합쳐서 1이 되게 한다. 자연상수e는 exp()로 파이썬에서 구현할 수 있다. 여기서 보면 k는 출력층의 뉴런 수이고 i는 i 번째 출력을 뜻한다. 이렇게 보면 소프트맥스 함수에 대해서 이해가 잘 가지 않지만 코드를 보면서 이해해보자. # 임의의 1X3 배열을 만들어준다. 입력값이다. a = np.array([0.2, 3.3, 3.0]) # 지수 함수를..
딥러닝 독학 1)퍼셉트론에서부터 신경망 퍼셉트론이란? 퍼셉트론은 딥러닝의 기원이 되는 알고리즘으로 딥러닝을 이해하기 위해서 꼭 필요한 개념이다. 퍼셉트론은 여러가지의 신호를 input으로 하여 하나의 output 을 내는 알고리즘이다. 여기서 보면 X1, X2, X3은 입력신호, y는 출력신호이고 w1, w2, w3은 가중치를 말한다. 각각의 원은 노드 혹은 뉴런이라고 부르는데 하나의 입력 원이 다른 원으로 보내질 때 가중치가 곱해진다. 이 신호의 합이 임계값을 넘어갈 때만 1을 출력하고 넘어가지 않으면 0을 출력한다. 여기에 bias를 추가해서 식을 써본다. bias란 각각의 노드가 얼마나 쉽게 활성화되는지를 제어한다. bias를 추가해서 그림을 그려보겠다. 이 그림은 가중치가 b이고 입력이 1인 뉴런이다. 1, x1, x2, x3 이렇게 ..
Conda 가상환경 설치 //conda에 myconda로 되어있는 가상환경을 만든다. conda create --name 'myconda' //myconda를 실행해준다. source activate myconda //이거는 실행을 끌때 코드 //source deactivate myconda //이거는 가상환경 삭제 코드 //conda env remove --name 'myconda' //가상환경 리스트를 보여주는 명령어이다. conda env list //가상환경에 파이썬을 설치한다. conda install python ==3.8
[파이썬 머신러닝] 배깅 방식의 랜덤 포레스트 학습 랜덤 포레스트 알고리즘은 앙상블 알고리즘 중에 빠른 수행 속도를 가지고 있다. 장점은 결정 트리의 직관적인 모습을 가지고 있는데 랜덤 포레스트는 여러 개의 결정 트리 분류기가 각각의 데이터를 부트스트랩핑(샘플링)하여 개별적으로 학습을 수행하고 최종적으로 보팅을 통해 예측 결정을 한다. Pipeline 과 GridSearchCV 를 통해서 랜덤포레스트의 하이퍼 파라미터를 튜닝하여서 학습시켜 보겠다. www.kaggle.com/teejmahal20/airline-passenger-satisfaction Airline Passenger Satisfaction What factors lead to customer satisfaction for an Airline? www.kaggle.com 데이터는 캐글에서 위..
[파이썬 머신러닝] 머신러닝의 분류-앙상블 학습 앙상블 학습이란 ? 앙상블 학습은 여러개의 분류기를 생성하고 예측을 모아서 정확한 예측을 시행하는 것을 말한다. 예를 들면 한 문제의 답을 얻기 위해 여러 명의 전문가들이 모여서 다양한 의견을 모아서 결정하는 것이다. 이미지, 영상, 음성 등의 비정형 데이터는 딥러닝이 뛰어나지만 정형 데이터 분류는 앙상블 학습이 뛰어나다. 앙상블 학습의 대표적인 랜덤 포레스트, 그래디언트 부스팅 알고리즘이 있는데 부스팅 계열의 알고리즘은 캐글에서 인기가 많다. 요새 많이 쓰이는 XGBoost ,LightBGM 등이 있다. 앙상블 학습은 Voting, Bagging, Boosting 으로 나눌 수 있다. velog.io/@jiselectric/Ensemble-Learning-Voting-and-Bagging-at6219a..
머신러닝 분류 Classification 중 Decision Tree(결정 트리) 분류는 데이터를 피쳐값과 타겟 값(레이블 값)으로 나누어서 피쳐에 따라 타겟값의 값을 예측하는 것이다. 기존 데이터들을 이용해서 어떠한 피쳐에서는 어떠한 타겟 값들이 나올 것인가를 학습한 다음에 새로운 데이터 값이 주어지면 타겟값을 예측한다. 분류는 여러가지 알고리즘이 있는데 그 중 이때까지 배운것은 -Decision Tree -Logistic Regression -Ensemble 이 세가지 정도이다. 오늘은 결정 트리에 대해서 학습해보고자 한다. 데이터는 캐글의 www.kaggle.com/teejmahal20/airline-passenger-satisfaction Airline Passenger Satisfaction What factors lead to customer satisfaction for ..