반응형
반응형
read_html 한글 출력하기 한글을 출력하기 위해서는 read_html을 할때 인코딩을 해주어야한다. 인코딩 호출 소스 코드 import requests url = 'html URL 주소' response = requests.get(url) pd.read_html(response.text, encoding='euc-kr')
아나콘다 가상환경 생성하기 터미널 혹은 아나콘다 프롬프트에서 입력 conda create -n 가상환경이름, python=버전 설치 진행 -> y 엔터 설치 확인 가상환경 활성화하기 conda activate 가상환경이름 가상환경 비활성화하기 conda deactivate 가상환경이름 가상환경 목록 확인하기 conda env list
__name__ 모듈의 이름이 저장되는 변수 __main__ 을 출력하면 해당 파일이 가장 먼저 실행되는 최상위 모듈 현재 모듈이 최상위 모듈로 수행되는지 여부 확인 가능 예) print(__name__) > __main__ : 현재 수행되는 파이썬의 이름으로 최상위 모듈 메인을 반환 예) print(모듈명.__name__) > 모듈명 : '모듈명'은 현재 이 파일에선 모듈로 호출한 것이므로 '모듈명' 이름을 반환 사용자 정의 모듈에 name을 활용하여 테스트 코드로 사용 가능 예) main 일 때 조건문을 적어서 테스트 모듈이 최상위 모듈로 사용 될 때만 실행 모듈로 하위 모듈로 활용 될 때는 무시 __name__ 활용 : __main__ 최상위 모듈 확인 예시 # test.py print("모듈 생성..
상관관계 두 변수는 서로 독립적인 관계이거나 상관된 관계, 두 변수간의 관계의 강도를 표현 -1 ~ 1 의 사이로 표현 1에 가까울수록 관계 있음 / -1에 가까울수록 관계 없음 데이터프레임에서 사용 corr : 전체 컬럼에 대한 상관관계 계수를 표현 corrwith : 특정 컬럼에 대한 상관관계 계수 표현 (시리즈의 상관관계 출력) 시리즈는 한개의 데이터이기 때문에 상관계수 표현 어려움 예시에 사용될 데이터프레임 movies_rating_df : 각각의 유저들이 영화의 평점을 기록 ratings_mean_count : 영화들의 평점과 평가수를 기록 movie_df = pandas.read_csv('movies_rating_df.csv', index_col=0) movie_df.head(5) 전체 컬럼의..
데이터 프레임 합치기 인덱스가 같은 시리즈와 데이터프레임을 합쳐야 할 때 어떻게 해야할까? 예시 예시로 이해해봅시다. 영화의 제목이 인덱스인 평가 점수가 담겨있는 시리즈 영화의 제목이 인덱스인 평가 인원수가 담겨있는 시리즈 인덱스가 같은 시리즈 합치는 방법 1 인덱스를 기준으로 merge 하기 merge( left_index=True, right_index=True ) : 두 데이터의 인덱스를 이용하여 합칠 수 있음 ratings_mean_count_df = pd.merge(ratings_df_mean, ratings_df_count, left_index=True, right_index=True) # 두 개의 이름이 같은 인덱스를 이용하여 merge ratings_mean_count_df.columns=..
파이썬에서 지원하는 datetime에 대한 설명을 좀 더 자세히 확인 할 수 있습니다. https://luvris2.tistory.com/23 표준 모듈(date, time)을 이용하여 라이브러리(library) 활용하기 - 2 해당 글은 글과 라이브러리 활용하기 1번 글과 이어진 내용이며, 이번 포스팅에서는 표준 모듈인 date와 time을 다룹니다. '표준 모듈(date)을 이용하여 라이브러리(library) 활용하기 - 1' 이전글 보 luvris2.tistory.com numpy와 pandas의 시계열 데이터에 대한 설명을 좀 더 자세히 확인 할 수 있습니다. https://luvris2.tistory.com/38 Numpy/Pandas - datetime # datetime64란? 날짜와 시간을..