Do it! 쉽게 배우는 R 데이터 분석 김영우 pdf 다운로드를 무료로 제공합니다 데이터 분석을 처음 시작한 초보자도 어깨춤을 추며 데이터를 혼자 다룰 수 있게 한다는 강의가 책으로 출간되었다. 통계, 프로그래밍, 데이터 분석을 전혀 몰라도
관련 교재 pdf 모음
책 소개
IT 전공이 아니어도, 데이터 분석에 대해 아는 게 없어도 괜찮다. 이 책은 데이터 분석을 처음 시작하는 사람도 쉽게 시작할 수 있는 쉬운 예제부터 차근차근 실습을 하다 보면 자연스럽게 R 코드에 익숙해지도록 구성했다. 이 책의 실습을 마칠 때쯤이면 어느새 데이터 분석 기술을 습득하게 될 것이다. 그뿐만 아니라 데이터 정제, 가공, 분석부터 그래프 그리기까지 실제 현업에서 데이터 분석 프로젝트를 할 때와 같은 모든 과정을 직접 해볼 수 있다. 끝에 가서는 공공데이터를 이용해 자신만의 훌륭한 데이터 분석 프로젝트를 완수하게 된다. [Do it! 쉽게 배우는 R 데이터 분석]은 통계 분석은 물론이고 소셜 네트워크 서비스의 글을 분석할 수 있는 텍스트 마이닝, 지역별 특성을 표현할 수 있는 지도 시각화, 이용자가 원하는 결괏값을 실시간으로 보여주는 인터랙티브 그래프 등 최근 주목받고 있는 데이터 분석 기법들을 다양하게 배울 수 있다. 이런 기법들을 누구나 할 수 있는 이유는 전 세계의 전문가들이 패키지를 만들어 온라인에 무료로 공개하고 있기 때문이다. 현재 공개되어 있는 패키지만 1만 개가 넘는다. R을 효율적으로 사용하려면 통계적인 지식뿐만 아니라 R의 다양한 패키지를 적재적소에 잘 활용하는 것이 중요하다. 이 책에서는 가장 최신의, 인기 있는 패키지로 실습한다. 또한 수많은 패키지 중 나에게 필요한 패키지를 찾아 활용하는 방법까지 소개한다. SKT, 넥슨, 신한은행 등 국내 기업들은 이미 R을 활용하고 있다! 세계적인 규모의 기업들이 R을 사용하고 있다. 데이터 분석 기술 분야를 선도하고 있는 구글, 페이스북, 마이크로소프트는 물론 국내 기업 중 데이터 관련 업무가 많은 SKT, KT 등과 같은 통신회사나 넥슨, 엔씨소프트 등의 게임 회사들도 이미 R을 활용하고 있다. 데이터 분석 분야에 관심이 있거나 취업을 준비한다면 이 책으로 빠르게 공부하고 데이터 분야에 도전하자!
Do it! 쉽게 배우는 R 데이터 분석
첫째마당 R이랑 친해지기
01 안녕, R?
01-1 R이 뭔가요? – R 이해하기
01-2 R이 강력한 이유
02 R 데이터 분석 환경 만들기
02-1 R과 R 스튜디오 설치하기
02-2 R 스튜디오와 친숙해지기
02-3 프로젝트 만들기
02-4 유용한 환경 설정
03 데이터 분석을 위한 연장 챙기기
03-1 변하는 수, ‘변수’ 이해하기
03-2 마술 상자 같은 ‘함수’ 이해하기
03-3 함수 꾸러미, ‘패키지’ 이해하기
둘째마당 본격 실습! 데이터 갖고 놀기
04 데이터 프레임의 세계로!
04-1 데이터는 어떻게 생겼나? – 데이터 프레임 이해하기
04-2 데이터 프레임 만들기 – 시험 성적 데이터를 만들어 보자!
04-3 외부 데이터 이용하기 – 축적된 시험 성적 데이터를 불러오자!
[정리하기]
05 데이터 분석 기초! – 데이터 파악하기, 다루기 쉽게 수정하기
05-1 데이터 파악하기
05-2 변수명 바꾸기
05-3 파생변수 만들기
[정리하기]
[분석 도전!]
06 자유자재로 데이터 가공하기
06-1 데이터 전처리 – 원하는 형태로 데이터 가공하기
06-2 조건에 맞는 데이터만 추출하기
06-3 필요한 변수만 추출하기
06-4 순서대로 정렬하기
06-5 파생변수 추가하기
06-6 집단별로 요약하기
06-7 데이터 합치기
[정리하기]
[분석 도전!]
07 데이터 정제 – 빠진 데이터, 이상한 데이터 제거하기
07-1 빠진 데이터를 찾아라! – 결측치 정제하기
07-2 이상한 데이터를 찾아라! – 이상치 정제하기
[정리하기]
08 그래프 만들기
08-1 R로 만들 수 있는 그래프 살펴보기
08-2 산점도 – 변수 간 관계 표현하기
08-3 막대 그래프 – 집단 간 차이 표현하기
08-4 선 그래프 – 시간에 따라 달라지는 데이터 표현하기
08-5 상자 그림 – 집단 간 분포 차이 표현하기
[정리하기]
[꿀팁 01] 초보자가 자주 하는 실수
[꿀팁 02] 에러 메시지 이해하기
셋째마당 실전! 데이터 분석 프로젝트
09 데이터 분석 프로젝트 – ‘한국인의 삶을 파악하라!’
09-1 ‘한국복지패널데이터’ 분석 준비하기
09-2 성별에 따른 월급 차이 – “성별에 따라 월급이 다를까?”
09-3 나이와 월급의 관계 – “몇 살 때 월급을 가장 많이 받을까?”
09-4 연령대에 따른 월급 차이 – “어떤 연령대의 월급이 가장 많을까?”
09-5 연령대 및 성별 월급 차이 – “성별 월급 차이는 연령대별로 다를까?”
09-6 직업별 월급 차이 – “어떤 직업이 월급을 가장 많이 받을까?”
09-7 성별 직업 빈도 – “성별로 어떤 직업이 가장 많을까?”
09-8 종교 유무에 따른 이혼율 – “종교가 있는 사람들이 이혼을 덜 할까?”
09-9 지역별 연령대 비율 – “노년층이 많은 지역은 어디일까?”
넷째마당 R로 하는 다양한 데이터 분석의 세계
10 텍스트 마이닝
10-1 힙합 가사 텍스트 마이닝
10-2 국정원 트윗 텍스트 마이닝
11 지도 시각화
11-1 미국 주별 강력 범죄율 단계 구분도 만들기
11-2 대한민국 시도별 인구, 결핵 환자 수 단계 구분도 만들기
12 인터랙티브 그래프
12-1 plotly 패키지로 인터랙티브 그래프 만들기
12-2 dygraphs 패키지로 인터랙티브 시계열 그래프 만들기
13 통계 분석 기법을 이용한 가설 검정
13-1 통계적 가설 검정이란?
13-2 t 검정 – 두 집단의 평균 비교
13-3 상관분석 – 두 변수의 관계성 분석
14 R Markdown으로 데이터 분석 보고서 만들기
14-1 신뢰할 수 있는 데이터 분석 보고서 만들기
14-2 R 마크다운 문서 만들기
15 R 내장 함수, 변수 타입과 데이터 구조
15-1 R 내장 함수로 데이터 추출하기
15-2 변수 타입
15-3 데이터 구조
[정리하기]
16 데이터 분석 기술을 효율적으로 익히는 방법
15-1 집중할 방향 정하기
15-2 데이터 분석 기술을 효율적으로 익히는 방법
15-3 오픈 소스 생태계와 어울리기
정답
찾아보기