
Python_ml_pandas 04 시각화
2022. 6. 22. 23:00
TIL/02_Pandas 실전
4. 시각화 도구 1) Matplotlib - 기본 그래프 도구 1-1 선 그래프 기본 사용법 matplotlib.pyplot as plt df.fillna(method='ffill') 누락 데이터가 들어 있는 행의 바로 앞에 위치한 행의 데이터 값으로 채움 plt.plot(x축, y축) plt.plot(시리즈 or 데이터프레임 객체) df = df.fillna(method='ffill') # 서울에서 다른 지역으로 이동한 데이터만 추출 condition = (df['전출지별'] == '서울특별시') & (df['전입지별'] != '서울특별시') df_seoul = df[condition] df_seoul.drop(['전출지별'], axis=1) df_seoul.rename({'전입지별':'전입지'}, ..

Python_ml_pandas 05, 06 데이터 사전 처리
2022. 6. 22. 22:47
TIL/02_Pandas 실전
5. 데이터 사전 처리 1) 누락 데이터 처리 누락 데이터 확인 `info()` : 데이터프레임 요약 정보 - 유효한 값의 개수를 보여줌 `value_counts(dropna=False)` : 누락 데이터 개수 확인 ( default : **dropna = True**) ==isnull()== : **누락 데이터**면 True를 반환, 유요한 데이터가 존재하면 False를 반환 `df.isnull().sum(axis=0)` ==notnull()== : **유효한 데이터**가 존재하면 True를 반환하고, 누락 데이터면 False를 반환 누락 데이터 제거 열을 삭제하면 분석 대상이 갖는 특성(변수)를 제거 행을 삭제하면 분석 대상의 관측값(레코드) 제거 ==dropna(thresh=500)== # for ..

01 HTML 이해하기 [부스트코스]
2022. 6. 20. 09:03
TIL/05_HTML_CSS
01 HTML 이해하기 부스트코스의 '비전공자를 위한 HTML/CSS' 수업 정리 1) HTML 소개 HTML : Hyper Text Markup Language 웹 페이지를 만드는 언어 Hyper Text : 단순한 텍스트를 넘어서 웹 페이지의 특정 부분과 연결할 수 있는 기능을 가진 텍스트 즉, 링크를 의미 Markup Language : 프로그래밍 언어의 한 종류로, 정보를 구조적 계층적으로 표현 가능 확장자가 html 2) HTML 문법 - 태그 HTML 문법 태그 속성 태그의 중첩 빈 태그 공백 주석 태그란? 무언가를 표시하기 위한 꼬리표, 이름표 태극를 사용하는 방법 태그는 기호로 표현 h1 >> 태그 이름 `` : 시작 태그, `` : 종료 태그 Hello, HTML 요소란? ..
01 Stack&Que (Algorithm_Na)
2022. 6. 18. 03:01
TIL/03_알고리즘
스택 자료구조 먼저 들어 온 데이터가 나중에 나가는 형식(선입후출)의 자료구조 입구와 출구가 동일한 형태로 스택을 시각화할 수 있다. 삽입(5) - 삽입(2) - 삽입(3) - 삽입(7) - 삭제() - 삽입(1) - 삽입(4) - 삭제() 5 - 5 2 -5 2 3 - 5 2 3 7 - 5 2 3 - 5 2 3 1 - 5 2 3 1 4 -5 2 3 1 삽입 스택 구현 예제 # 스택 구현 예제 stack = [] # 삽입(5) - 삽입(2) - 삽입(3) - 삽입(7) - 삭제() - 삽입(1) - 삽입(4) - 삭제() stack.append(5) stack.append(2) stack.append(3) stack.append(7) stack.pop() stack.append(1) stack.appen..

04 Stack (Algorithm_doit)
2022. 6. 18. 03:00
TIL/03_알고리즘
공부중입니다. 04-1 스택이란? 스택 알아보기 스택(stack) 데이터를 임시 저장할 때 사용하는 구조 데이터 입력과 출력 순서는 후입선출LIFO방식 (=선입후출FILO) 푸시(push) : 스택에 데이터를 넣는 작업 팝(pop) : 스택에서 데이터를 꺼내는 작업 꼭대기(top) : 푸시하고 팝하는 윗부분 바닥(bottom) : 푸시하고 팝하는 아랫부분 스택 구현하기1 스택 배열 : stk 푸시한 데이터를 저장하는 스택 본체인 list형 배열 인덱스가 0인 원소를 스택의 바닥이라고 함 가장 먼저 푸시하여 데이터를 저장하는 곳은 stk[0] 스택 크기 : capacity 스택의 최대 크기를 나타내는 int형 정수 이 값은 배열 stk의 원소 수인 len(stk)와 일치 스택 포인터 : ptr 스택 포인터..

GITHUB 특강 0617 정리
2022. 6. 17. 18:04
TIL/00_Git
00_GIT_Day2_0617 수업 정리 GIT 기초 GIT Pull git pull: github 것을 받아오기 GIT branch git branch : 새로운 브랜치 작성 git branch : 브랜치 목록 전체를 확인 앞 부분에 *이 붙어있으면 현재 선택된 브랜치 GIT merge 작업을 하던 중 수정 사항이 생길 때 사용 master 브랜치에서 메인 작업을 진행 새로운 이슈나 수정이 필요한 사항이 생기면 새로운 브랜치를 생성하여 수정 새로운 브랜치를 master 브랜치와 Merge 작업 순서 git branch git checkout git add-> git commit git checkout git merge merge 할 때 conflict >>> head .... >> ====
GITHUB 특강 0616 정리
2022. 6. 16. 14:36
TIL/00_Git
00_GIT_Day1_0616 수업 정리 Git - 분산 버전 관리 시스템 버전 관리 : 언제 무엇을 썼는지 트랙킹 할 수 있는 것 Git : 시간대도 가능하지만 언제 한꺼번에 올렸지? 구분이 가능함 분산 ==버전 관리== 시스템 코드의 히스토리(버전)을 관리하는 도구 개발되어온 과정 파악 가능 이전 버전과의 변경 사항 비교 및 분석 백업, 복구, 협업 가능 현재 개발자들의 사용 현황 자료 survey CLI 기초 (Command-Line Interface) 1. GUI (Graphic User Interface) 그래픽을 통해 사용자와 컴퓨터가 상호 작용하는 방식 마우스 우클릭 > 새로 만들기 > 폴더 > new 작성 2. CLI (Command Line Interface) 터미널을 통해 사용자와 컴픁..

데이터 분석 실무 - 인스타그램 웹크롤링 2
2022. 6. 15. 21:55
TIL/02_Pandas 실전
데이터 분석 실무 with 파이썬 05장 인스타그램 웹크롤링 복습 import unicodedata content = soup.select('div._aat6 > ul')[0].text content = unicodedata.normalize('NFC', content) content >> unicodedata.normalize(form, unistr, /) : Return the normal form 'form' for the Unicode string unistr. 한글 자음/모음 분리되는 현상 방지 하기 위해 unicodedata를 이용해 자음/모음을 합쳐서 한글을 처리하는 (NFC 방식) 코드를 추가 import re re.findall(r'#[^\s#,\\]+', content) - r : r ..