자바와 파이썬으로 만드는 빅데이터 시스템 황세규 pdf 다운로드를 무료로 제공합니다 로컬에서 작은 규모나마 직접 빅데이터 서비스를 구현함으로써 독자들이 서비스 아키텍처에 대한 이해와 통찰력을 얻는 데 목표를 두며, 빅데이터 사용과 구현방식의 다양성을 위해 이 책은 자바와 파이썬
관련 교재 pdf 모음
책 소개
이 책은 빅데이터 서비스에 대한 알기 쉬운 설명과 난도가 높지 않은 실습 프로젝트를 활용하여 빅데이터 분야에 입문하려는 개발자, 소프트웨어 전공자, 학생들에게 최고의 입문서가 될 것입니다. 빅데이터 오픈소스의 내부 아키텍처와 각종 기능의 API에 대한 고찰 없이 클라우드에서 제공하는 서비스를 사용만 했다면, 이제 여러분의 로컬 환경에서 이런 서비스를 직접 구현하여 빅데이터 서비스의 구조와 기능에 대한 넓은 경험과 통찰력을 얻을 수 있다. 자바와 파이썬 API를 모두 제공하여 자바의 객체지향적 프로그래밍과 스크립트 언어인 파이썬의 간결하고 파이썬다운(Pythonic) 코딩을 경험할 수 있으며, 윈도우와 리눅스 모두에서 폭넓게 시스템을 구축한다. 각 서비스의 끝단을 연동하여 파이프 라인을 구현함으로써 하둡, 카푸카, 아파치 스파크로 이어지는 데이터 가공과 변환, MySQL, MongoDB 적재에 대한 기술 지식과 구현 노하우를 익힐 수 있다.
자바와 파이썬 빅데이터 시스템 pdf
머리말 viii
베타리더 후기 xii
CHAPTER 1 빅데이터 개론 1
1.1 빅데이터란? 1
1.2 빅데이터 저장과 분석 12
1.3 데이터 전처리와 람다 아키텍처 23
CHAPTER 2 개발 통합 환경 29
2.1 자바 설치 29
2.2 파이썬 설치 34
2.3 이클립스 설치 및 설정 39
2.4 저장소 설치 51
2.5 실습 데이터 63
CHAPTER 3 하둡 파일 시스템 I 89
3.1 하둡 구조 및 기능 89
3.2 하둡 파일 시스템 설치 및 설정 93
3.3 하둡 파일시스템 API 114
CHAPTER 4 하둡 파일 시스템 II 129
4.1 자바 실습 프로젝트 129
4.2 파이썬 실습 프로젝트 172
CHAPTER 5 카프카를 이용한 데이터 송수신 197
5.1 카프카의 개념과 기능 197
5.2 카프카 설치 및 설정 202
5.3 카프카 메시지 서비스의 API 211
5.4 자바 실습 프로젝트 224
5.5 파이썬 실습 프로젝트 231
CHAPTER 6 아파치 스파크 배치 작업 I 237
6.1 아파치 스파크의 개념과 하부 프로젝트 237
6.2 아파치 스파크 설치 및 설정 242
6.3 아파치 스파크 SQL API 252
CHAPTER 7 아파치 스파크 배치 작업 II 295
7.1 자바 실습 프로젝트 295
7.2 파이썬 실습 프로젝트 306
CHAPTER 8 아파치 스파크 스트리밍 작업 317
8.1 아파치 스파크의 구조화 스트리밍 개념 317
8.2 아파치 스파크 구조화 스트리밍 API 322
8.3 자바 실습 프로젝트 329
8.4 파이썬 실습 프로젝트 335
CHAPTER 9 MySQL 데이터 작업 341
9.1 관계형 데이터베이스 정의와 개념 341
9.2 SQL 및 Python API 347
9.3 파이썬 실습 프로젝트 376
CHAPTER 10 몽고디비 데이터 작업 389
10.1 몽고디비 개념과 특징 389
10.2 몽고디비 API 394
10.3 파이썬 실습 프로젝트 406
찾아보기 415