본문 바로가기

전체 글10

R ggmap으로 지오코딩, 역지오코딩하기 R ggmap으로 지오코딩, 역지오코딩하기 개요 1. 환경 설정 (Environment setting) 1 - 1. Google Maps API key 발급 1 - 2. 패키지 불러오기, API 키 등록 2. 지오코딩 (Geocoding) 2 - 1. 단일 주소 지오코딩 2 - 2. 데이터 프레임 지오코딩 3. 역지오코딩 (Reverse geocoding) 3 - 1. 단일 좌표 역지오코딩 3 - 2. 데이터 프레임 역지오코딩 4. 확인, 개선해야 될 부분 (Improvements) 5. 참고 문헌 (Reference) 6. 글 개정 내역 (Revision history) 개요 본 글은 R의 ggmap패키지를 활용하여 지오코딩, 역지오코딩 하는 방법을 설명한 내용을 담고있으며, R mark down을 활.. 2020. 12. 28.
취업박람회 발표 후기 지난 주 토요일(11월 21일) 제가 졸업한 충남대학교 수학과 후배들을 대상으로 진행된 취업박람회에서 빅데이터 분야에 대해 발표한 후기입니다. 행사는 ZOOM을 활용하여 비대면으로 진행 되었으며 본 글은 발표 내용 요약본과 느낀점 순서로 구성되어 있습니다. 1. 발표 내용 빅데이터 개념과 주요 업무 데이터 분석 업무 순서도 (Work flow) 보통 빅데이터 분야에서는 데이터 수급 → 전처리 → EDA → Modeling의 과정만 설명하지만 문제 정의(Problem setting) 가 가장 중요하다고 설명 특히 고객이 무엇을 원하는지 핵심 니즈(needs)를 이해하는 것이 중요하다고 강조 저의 취업 준비과정 Matlab 관련 전공 수업 솔루션 제작 (매일 4시간 이상 공부, 코딩) 학과 빅데이터 동아리 .. 2020. 11. 27.
2019년 회고 [2019년 회고] ● 2019년 1월 ~ 2월 Kaggle Korea에서 주관한 타이타닉 생존자 예측 분석 대회에 참가 - 97위로 간신히 턱걸이를 하여 기념티 받음 - 커널 작성해서 대회에 참석하신 분들과 이외에도 R로 입문해보고 싶은 분들에게 공유함 (블로그에도 올려놓음) ● 2019년 3월 펜타시스템 테크놀러지 빅데이터팀에 입사 - 3월 18일 입사와 동시에 대전 국가정보자원관리원에 투입 - 2019년 12월까지 관리원에서 근무하며 공공기관 빅 데이터 분석관련 업무 수행 - 원천 데이터 전처리부터 탐색적 데이터 분석(EDA), 분석 보고서 작성, 메뉴얼 작성까지 해보니 확실히 공부하던 때와 다른 점들이 많았던 것을 느낌 ● 2019년 6월 데분데분 세미나 참석 - 작년만해도 취준생 입장으로 참석했.. 2020. 1. 9.
캐글 코리아 주관 - "2019 1st ML month with KaKR" kernel Titanic classifier report Titanic classifier report MinSoon Lim 1. Introduction 2. 준비작업 2.1 Working directory 2.2 Packages multiplot() function generation 2.3 Read raw data : 원본데이터 불러오기 2.4 변수 의미 설명 2.5 Change the variables type : 변수 속성 변환 3. 탐색적 데이터 분석 (EDA : Exploratory data analysis) 3.1 수치값을 활용한 data 확인 3.1.1 head() 3.1.2 str() 3.1.3 summary() 3.2 Missing values 3.2.1 VIM packages 3.2.2 tidy.. 2019. 2. 6.