본문 바로가기

데이터 분석/Kaggle3

캐글 코리아 주관 - "2019 1st ML month with KaKR" kernel Titanic classifier report Titanic classifier report MinSoon Lim 1. Introduction 2. 준비작업 2.1 Working directory 2.2 Packages multiplot() function generation 2.3 Read raw data : 원본데이터 불러오기 2.4 변수 의미 설명 2.5 Change the variables type : 변수 속성 변환 3. 탐색적 데이터 분석 (EDA : Exploratory data analysis) 3.1 수치값을 활용한 data 확인 3.1.1 head() 3.1.2 str() 3.1.3 summary() 3.2 Missing values 3.2.1 VIM packages 3.2.2 tidy.. 2019. 2. 6.
캐글 대출고객 분류분석 (Kaggle - Loan Data Classification) Kaggle Loan data binary classification Kaggle Loan data binary classification Minsoon Lim 1. Introduction & Problem setting 2. 준비 작업 2.1 Packages load, multiplot() function generation 2.2 Working directory setting, Raw data import 2.3 Raw data’s Variable description table 2.4 Simple operation 3. 탐색적 데이터 분석(EDA, Exploratory data analysis) 3.1 summary() 3.2 str() 3.3 Missing values 3.4 Visualizati.. 2018. 2. 6.
캐글 버섯 데이터 분류분석(Kaggle - Mushrooms Data Classification) Kaggle_Mushrooms_Classification Kaggle_Mushrooms_Classification MinSoon Lim 1. 서론 2. 패키지 장착 3. 데이터 불러오기 4. 데이터 변수 설명 5 - 1. 데이터 확인 5 - 2. 데이터 전처리 (Pre-processing) 6. 탐색적 데이터 분석(EDA) 6 - 1. Bar Plot 6 - 2. Mosaicplot 7. 모델 생성 Data Set Split (데이터 나누기) 7 - 1. RandomForest 7 - 2. LASSO 8. Test Set 을 이용한 분류 분석 9. 마치며 11. 참고 문헌 (Reference) 1. 서론 해당 레포트는 기계학습(Machine Learning) 중 지도학습(Supervised Learnin.. 2018. 1. 23.