본문 바로가기

데이터분석3

dplyr 패키지를 이용한 데이터 전처리 Data Pre-processing by dplyr Data Pre-processing by dplyr MinSoon Lim 1. Intro 1 - 1. 데이터 전처리란? 1 - 2. 왜 dplyr 패키지 인가? 2. dplyr 패키지에 있는 함수들 3 - 1. 패키지 장착 3 - 2. 예제 데이터 확인 4. select() 4 - 1. color 변수만 4 - 2. 변수를 2개 이상 select 할 경우 4 - 3. 변수의 이름은 모르고 위치를 아는 경우 4 - 4. 변수 시작하는 스펠링을 알 때 4 - 5. 변수의 끝나는 스펠링 4 - 6. 변수에 포함된 스펠링을 아는 경우 5. filter() : 조건에 맞는 관측치 추출 5 - 1. price가 950 이하인 다이아만 추출 5 - 2.숫자 조건이 .. 2018. 12. 7.
2013년 ~ 2018년 3월 타슈 데이터 전처리 대전시 공영자전거 타슈 데이터 전처리 (Tashu data Pre-processing) 대전시 공영자전거 타슈 데이터 전처리 (Tashu data Pre-processing) Minsoon Lim 1. Introduction Data 설명 2. Groundwork : 준비작업 2.1 Working directory setting, Data input : 작업폴더 지정, 데이터 불러오기 2.2 Packages : 필요한 패키지 장착 3. Data assesment, Problem setting, Pre-processing 3.1 2013년 상반기 데이터 확인 전처리 전처리 후 데이터 확인 3.2 2013년 하반기 데이터 확인 결측치 확인 전처리 전처리 후 데이터 확인 3.3 2014년 상반기 데이터 확인 .. 2018. 12. 6.
캐글 대출고객 분류분석 (Kaggle - Loan Data Classification) Kaggle Loan data binary classification Kaggle Loan data binary classification Minsoon Lim 1. Introduction & Problem setting 2. 준비 작업 2.1 Packages load, multiplot() function generation 2.2 Working directory setting, Raw data import 2.3 Raw data’s Variable description table 2.4 Simple operation 3. 탐색적 데이터 분석(EDA, Exploratory data analysis) 3.1 summary() 3.2 str() 3.3 Missing values 3.4 Visualizati.. 2018. 2. 6.