머신러닝(+딥러닝)
-
랜덤 포레스트 & 랜덤 서치머신러닝(+딥러닝) 2023. 8. 10. 19:52
문제 랜덤 포레스트에 사용되는 최적의 하이퍼 파라미터를 랜덤 서치를 통해 찾아보고, 이 파라미터를 이용해 훈련해 보자 코드 랜덤 서치는 파라미터를 랜덤으로 조합해 모델을 생성 교차 검증으로 score 를 산출 최고 score 의 파라미터를 찾음 랜덤 포레스트는 결정 트리 (Decision Tree) 기반으로 앙상블 학습을 함 기본 세팅 Decision Tree 에서는 sklearn.preprocessing.StandardScaler 로 데이터를 표준화할 필요가 없다. import numpy as np import pandas as pd from sklearn.model_selection import train_test_split wine = pd.read_csv('https://bit.ly/wine_cs..
-
확률적 경사 하강법 (+ 로지스틱 회귀)머신러닝(+딥러닝) 2023. 8. 8. 17:43
문제 혼공머신 04-2: 생선의 weight, length, diagonal(대각선 길이), height, width 가 주어졌을때, 7가지(species) 생선중 어떤 생선일지를 맞춰보라. 코드 fish 데이터 준비 import pandas as pd fish = pd.read_csv('https://bit.ly/fish_csv_data') fish Input 데이터와 target 데이터 준비 fish_input = fish[['Weight', 'Length', 'Diagonal', 'Height', 'Width']].to_numpy() fish_target = fish['Species'].to_numpy() training 세트와 test 세트로 나누기 from sklearn.model_selecti..
-
릿지 회귀머신러닝(+딥러닝) 2023. 8. 8. 16:41
문제 혼공머신 03-3: 농어의 length, height, width 로 부터 농어의 weight 를 예측해 본다. 코드 Input 데이터 (농어의 length, height, width) 준비 import pandas as pd df = pd.read_csv("https://bit.ly/perch_csv_data") perch_full = df.to_numpy() perch_full # columns: length, height, width target 데이터 준비 import numpy as np # 타깃 데이터: length, height, width 일 때, weight perch_weight = np.array([5.9, 32.0, 40.0, 51.5, 70.0, 100.0, 78.0, 80...
-
sklearn 으로 학습한 모델을 파일로 저장하기머신러닝(+딥러닝) 2023. 8. 8. 15:15
sklearn 등을 통해 만든 모델을 파일로 저장해, 서비스에서 활용할 수 있어야 한다. https://medium.com/analytics-vidhya/save-and-load-your-scikit-learn-models-in-a-minute-21c91a961e9b 에서 세가지 방법을 소개하고 있다. python pickle 사용 sklearn.utils 의 joblib 사용 모델의 coef_ 와 intercept_ 를 json 으로 저장 pickle 이나 joblib 을 사용하면, python 에 의존성(파이썬 버전 등)이 발생하는 단점이 있다. json 으로 저장하면, 다른 언어(예: java) 로 서비스를 구현할 수 있지만 모델에 대한 이해가 필요하다는 단점이 있다. sklearn.utils 의 ..