전체 글 (45) 썸네일형 리스트형 머신러닝 분류 Classification 중 Decision Tree(결정 트리) 분류는 데이터를 피쳐값과 타겟 값(레이블 값)으로 나누어서 피쳐에 따라 타겟값의 값을 예측하는 것이다. 기존 데이터들을 이용해서 어떠한 피쳐에서는 어떠한 타겟 값들이 나올 것인가를 학습한 다음에 새로운 데이터 값이 주어지면 타겟값을 예측한다. 분류는 여러가지 알고리즘이 있는데 그 중 이때까지 배운것은 -Decision Tree -Logistic Regression -Ensemble 이 세가지 정도이다. 오늘은 결정 트리에 대해서 학습해보고자 한다. 데이터는 캐글의 www.kaggle.com/teejmahal20/airline-passenger-satisfaction Airline Passenger Satisfaction What factors lead to customer satisfaction for .. GridSearchCV의 Check the list of available parameters with `estimator.get_params().keys()` 에러 발생시 해결법 Check the list of available parameters with `estimator.get_params().keys()`. 에러가 발생했다 무엇이 문제인지 알아보고 있는데 dtc = DecisionTreeClassifier() parameters = { 'max_depth':[None], 'min_samples_split':[1, 2] } tree_pipeline = Pipeline(steps=[('num_pipeline', num_pipeline), ('classifier', dtc)]) grid_tree = GridSearchCV(tree_pipeline, param_grid=parameters, cv=2, refit=True) grid_tree.get_params().keys() 저 .. [파이썬 머신러닝]Pipeline 파이프라인 구축하기 머신러닝을 할 때 기본적으로 인코딩, 결측값 처리, 훈련, 테스트 집합으로 분할 등 등 필수로 해야 하는 것들이 있다. 매번 같은 작업을 반복해 해주는것보다 파이프라인을 이용하면 더 편하다. 파이프라인은 데이터의 변환을 순차적으로 적용한 다음 학습을 할 수 있다. 파이프라인을 사용하면 직관적으로 흐름을 읽을 수 있으며 순서가 파이프라인에 의해 정해지고 만들기 간편하다. 파이프라인을 만드는 코드는 밑에 있다. import pandas as pd import numpy as np from sklearn.datasets import load_wine from sklearn.tree import DecisionTreeClassifier from sklearn.model_selection import train_.. 이전 1 ··· 8 9 10 11 12 13 14 15 다음