반응형
반응형
이전 글에서 학습시킨 로지스틱 회귀 모델 인공지능의 데이터를 기반으로 작성되었습니다. 이전 글 확인하기 : https://luvris2.tistory.com/48 인공지능 머신러닝 - 로지스틱 회귀 모델(Logistic Regression) 로지스틱 회귀 (Logistic Regression) 종속 변수가 이분형일 때 수행할 수 있는 회귀 분석 기법의 한 종류 종속 변수(y)를 0과 1로 분류 기본 개념 자세히 알아보기 더보기 선형 회귀(Linear Regression)으로 luvris2.tistory.com 분류 결과표(Confusion Matrix) 실제값과 예측값이 일치하는지 갯수로 센 결과를 표로 나타낸 것 실제값은 행(row)에 표시, 예측값은 열(column)에 표시 0과 1의 이진 분류의 경..
로지스틱 회귀 (Logistic Regression) 종속 변수가 이분형일 때 수행할 수 있는 회귀 분석 기법의 한 종류 종속 변수(y)를 0과 1로 분류 종속 변수가 이분형 일 때, 즉 분류하기 위해 사용 (Classification) 기본 개념 자세히 알아보기 더보기 선형 회귀(Linear Regression)으로 표현 이와 비슷하게 생긴 함수가 이미 존재 (sigmoid function) 선형 회귀의 식을 시그모이드에 대입해서 일차 방정식으로 만들면 다음과 같다 아래와 같은 식을 가진 회귀 분석을 로지스틱 회귀라고 한다. 시그모이드 함수에 적용한 식을 통해 두 개로 분류 할 수 있다. (Action : 행동을 취한다 / 하지 않는다) 이를 가지고 X의 각 항목별로 확률을 확인 할 수 있음 p(Pro..
이 글은 단순 선형 회귀 모델의 글과 연관 있습니다. https://luvris2.tistory.com/45 인공지능 머신러닝 - 단순 선형 회귀 모델(Simple Linear Regression) # 선형 회귀(Linear Regression) 종속 변수 y와 한 개 이상의 독립 변수 X와의 선형 상관 관계를 모델링하는 회귀 분석 기법 독립 변수가 한개면 단순 선형 회귀, 두개 이상이면 다중 선형 회귀 데이터 luvris2.tistory.com 다중 선형 회귀(Multiple Linear Regression) 이전 글에서 종속 변수 y와 한 개의 독립 변수 X와의 선형 상관 관계를 모델링해보았다. 이번에는 예시를 통하여 두 개 이상의 독립 변수 X와의 선형 상관 관계를 모델링해보자. 다중 선형 회귀 함..
선형 회귀(Linear Regression) 종속 변수 y와 한 개 이상의 독립 변수 X와의 선형 상관 관계를 모델링하는 회귀 분석 기법 독립 변수가 한개면 단순 선형 회귀, 두개 이상이면 다중 선형 회귀 데이터를 수집해 분포를 만족하는 직선을 찾으려하는 것 알려지지 않은 파라미터는 데이터로부터 추정 선형 회귀 함수는 직선이기 때문에 일차 함수로 표현 y= ax + b (a=기울기, b=절편) 값의 추정 방법으로는 일반적으로 최소제곱법(OLS:Ordinary Least Squares) 사용 다른 기법으로도 선형 회귀 모델링 가능 최소제곱법이 가장 단순하고 계산이 간단해서 많이 사용 최소제곱법을 사용하여 예측된 값이 제곱의 합을 최소화하는 것을 목표 최소제곱법의 종류 SSE(Sum of Squares Er..
# train_test_split 데이터들을 학습용(Training)과 테스트용(Test)으로 분리 배열 또는 행렬의 임의의 기차(학습) 및 테스트(결과) 하위 집합으로 분할 X_train, X_test, y_train, y_test = train_test_split( 데이터X, 데이터y, test_size= 0~1 , random_state= n ) 데이터 X : 학습시킬 데이터 데이터 y : 학습시킬 데이터와 연관되있는 결과 값 test_size : 테스트에 사용될 자원. 0.0부터 1.0사이여야하며 기본 값은 0.25(25%) train_size = 학습에 사용될 자원, test_size를 지정해주면 남는 자원을 학습에 사용 random_state : 분할을 적용하기 전에 데이터에 적용되는 임의의 ..
# 카테고리컬 인코딩 컴퓨터는 텍스트를 인식 할 수 없기 때문에 데이터들을 숫자로 바꿔주는 작업 카테고리컬 인코딩의 종류 종류 Label Encoding : 카테고리컬 데이터를 숫자로 변환, 0부터 넘버링, 3개 이상일 경우 성능이 떨어짐 One-Hot Encoding : 카테고리컬 데이터를 0과 1의 숫자로 변환, 3개 이상의 카테고리컬 데이터일 경우 사용 # 라이브러리 호출 import matplotlib.pyplot as plt # 표를 만들기 위한 라이브러리 import pandas # 데이터프레임을 사용하기 위한 라이브러리 from sklearn.preprocessing import LabelEncoder, OneHotEncoder # 인코더를 사용하기 위한 라이브러리 from sklearn.c..