
심심해서 하는 BTS - Permission to dance 가사 분석
2022. 11. 24. 17:38
TIL/01_Python
공부하기 싫어서 해보는 아주아주 간단한 데이터 분석ㅋㅋㅋ BTS 노래 듣다가 삘받아서 해봤다. 한글 가사보다 영어로 된 가사가 전처리하기 쉬울 것 같아 Permission to dance로 하기로 했다. Permission to dance 는 노래 제목이 말하듯이 '현실의 벽에 부닥치고 고단한 하루를 보낸 모두에게 "춤은 마음가는 대로, 허락 없이 마음껏 춰도 된다"' 라는 메시지를 전한다고 한다. 과연 가사 속에 이러한 메시지가 들어있는지 확인해보자! 1. 데이터 수집 구글에서 'permission to dance 가사' 검색. 가사 복사하기 후 메모장에 저장함 2. 데이터 불러오기 및 라이브러리 설치 Colab 환경에서 진행했다. 먼저, 라이브러리를 불러왔다. 나는 필요한 패키지를 한 곳에 몰아 넣는..
pandas 함수 정리 [ing]
2022. 6. 12. 20:17
TIL/01_Python
누락 데이터 처리 df.value_counts() : 해당 열의 데이터 파악 (default : dropna=True) df.value_counts(dropna=False) : NaN값까지 출력 df.isnull() : 메소드 누락 데이터 찾기 df.notnull() : null값이 아닌 데이터 값 차기 df.isnull().sum(axis=0) : 각 열의 누락 데이터(NaN) 개수 합 for 반복문 이용 각 열의 NaN 개수 계산 # for 반복문 각 열의 NaN 개수 계산하기(묘미****) null_df = df.isnull() for col in null_df.columns: null_count = null_df[col].value_counts() # 각 열의 NaN 개수 파악 try: print..
6/3 정리
2022. 6. 3. 14:22
TIL/01_Python
csv 파일 - path : 파일의 위치(파일명 포함), URL import pandas as pd file_path = 'read_csv_sample.csv' - sep(또는 delimiter) : 텍스트 데이터를 필드별로 구분하는 문자 - header : 열 이름으로 사용될 행의 번호 ( default : header = 0) header가 없고 첫 행부터 데이터가 있는 경우 None으로 지정 가능 df_noheader = pd.read_csv(file_path, header=None) df_noheader - index_col : 행 인덱스로 사용할 열의 번호 또는 열의 이름 # index_col df_index_col = pd.read_csv(file_path, index_col='c0') df_..