관련서비스

검색

검색

책 메인메뉴

책본문

종류 : 종이책

파이썬으로 배우는 데이터 과학파이썬의 주요 패키지부터 머신 러닝, 시각화에 이르기까지

저자
알베르토 보스체티 , 루카 마싸론 지음
역자
이판호 옮김 역자평점 0.0
출판사
에이콘출판 | 2017.12.08
형태
페이지 수 448 | ISBN
원제 : Python Data Science Essentials - Second Edition: Become an efficient data science practitioner by un
ISBN 10-1161750916
ISBN 13-9791161750910
정가
30,00027,000
가격비교

인터넷서점 (총 8건) 더보기

이 책은 어때요? 1명 참여

평점 : 0 . 0

번역

번역Bad 1 2 3 4 5 6 7 8 9 10 번역Good

필독

비추 1 2 3 4 5 6 7 8 9 10 필독

이 책을 언급한 곳

리뷰 0 | 서평 0 | 블로그 0

책 정보 별 바로가기 : 책정보  리뷰 (0) 가격비교 (8) 추가정보  책꼬리 (0) 한줄댓글 (0) 맨위로

정보 제공 : 교보문고 YES24 인터파크도서

책소개

파이썬의 설치부터 머신 러닝, 시각화에 이르기까지 파이썬을 사용한 데이터 과학의 핵심에 대해 쉽고 친절하게 가르쳐준다. 핵심 도구인 주피터 사용법, 넘파이(numpy), 판다스(pandas) 등 파이썬 주요 패키지를 사용한 데이터 처리, 사이킷런(scikit-learn)에 포함된 주요 머신 러닝 알고리즘의 활용, 데이터 및 분석 결과의 시각화에 대해 배울 수 있다.

저자소개

저자 알베르토 보스체티

저서 (총 1권)
신호 처리 및 통계 분야의 전문성을 가진 데이터 과학자다. 통신 공학 박사학위를 갖고 있으며, 현재 런던에 살고 있다. 업무 프로젝트에서 자연어 처리(NLP), 행동 분석, 머신 러닝, 분산 처리에 이르는 문제를 다루고 있다. 자신의 일에 열정적이며 모임, 컨퍼런스 및 기타 행사에 참여하면서 데이터 과학 기술 분야의 최신 동향을 지속적으로 파악하고 있다.

저자 루카 마싸론

저서 (총 1권)
다변수 통계 분석, 머신 러닝, 고객 분석에 특화된 데이터 과학자이자 마케팅 연구 디렉터다. 또한 지난 10년간 현실 문제를 해결하고 추론, 통계, 데이터 마이닝, 알고리즘을 적용해 업무 관계자에게 가치를 제공하는 일에 몸담았다. 이탈리아에서 웹 사용자 분석의 선구자부터 캐글(Kaggle) 상위 10위에 오르기까지 데이터 및 데이터 분석의 모든 면과 전문가 및 비전문가 모두에게 가능성 있는 데이터 주도 지식 발견을 보여주는 데 열정적이었다.
역서(총 1권)
역자 이판호
대학에서 통계학을 전공했으며 주로 금융권 관련 경력을 쌓고 뒤늦게 프로그래밍 세계에 입문했다. 데이터 분석에 근거한 금융 투자 및 이를 위한 프로그램 개발에 관심이 많다. 현재는 ETF 포트폴리오 분석을 위한 웹 서비스를 개발하며 기술 서적을 번역하고 있다.

목차

1장. 첫 단계

__데이터 과학과 파이썬 소개
__파이썬 설치
____파이썬 2 아니면 파이썬 3?
____차례로 설치하기
____패키지 설치
____패키지 업그레이드
____과학 배포판
________아나콘다
________콘다를 활용해 패키지 설치하기
________엔서트캐노피
________파이썬XY
________윈파이썬
____가상 환경이란?
________콘다로 환경 관리하기
____핵심 패키지 맛보기
________넘파이
________싸이파이
________판다스
________싸이킷런
________주피터
________매트플롯립
________Statsmodels
________Beautiful Soup
________NetworkX
________NLTK
________젠심
________PyPy
________XGBoost
________티아노
________케라스
__주피터 소개
____빠른 설치 및 첫 테스트
____주피터 마법 명령
____주피터는 어떻게 데이터 과학자를 돕는가?
____주피터의 대안
__책에서 쓰는 데이터 세트 및 코드
____싸이킷런 토이데이터 세트
________MLdata.org 공공 저장소
________LIBSVM 데이터 표본
________CVS나 텍스트 파일에서 직접 데이터 불러오기
________싸이킷런 샘플 생성기
__요약

2장. 데이터 개조

__데이터 과학의 과정
__데이터 불러오기와 판다스로 전처리하기
____빠르고 쉬운 데이터 불러오기
____문제가 있는 데이터 다루기
____큰 데이터 다루기
____다른 데이터 형식 접근하기
____데이터 전처리
____데이터 선택
__범주형 및 텍스트 데이터 작업
____특별한 데이터 타입 - 텍스트
____뷰티풀수프로 웹 스크래핑하기
__넘파이 데이터 처리
____넘파이의 n차원 배열
____넘파이 ndarray 객체 기초
__넘파이 배열 만들기
____리스트에서 1차원 배열로
____메모리 크기 제어
____이종적인 리스트
____리스트에서 다차원 배열로
____배열 크기 재설정
____넘파이 함수로부터 만들어진 배열
____파일에서 직접 배열 얻기
____판다스로부터 데이터 추출
__넘파이의 빠른 동작과 연산
____행렬 연산
____넘파이 배열 자르기와 색인하기
____넘파이 배열 채우기
__요약

3장. 데이터 파이프라인

__EDA 소개
__새로운 특성 만들기
__차원 축소
____공분산 행렬
____주성분 분석
____빅데이터를 위한 PCA - 확률적 PCA
____잠재요인분석(LFA)
____선형판별분석(LDA)
____잠재의미분석(LSA)
____독립요소분석(ICA)
____커널PCA
____T-SNE
____제한된 볼츠만 머신(RBM)
__특이값 감지 및 처치
__일변량 특이값 탐색
____EllipticEnvelope
____단일 클래스 SVM
__검증 지표
____멀티 라벨 분류
____이진분류
____회귀
__테스트와 검증
__교차 검증
____교차 검증 반복기 사용
____표본 추출과 부트 스트래핑
__초매개변수 최적화
____사용자정의 채점 함수 구축
____격자 검색 실행시간 단축
__특성 선택
____특성 분산 기반 선택
____일변량 선택
____재귀적 제거
____안정성과 L1 기반 선택
__모든 것을 파이프라인으로 감싸기
____특성을 함께 결합하고 변환을 연결하기
____사용자정의 변환 함수 만들기
__정리

4장. 머신 러닝

__도구와 데이터 세트 준비
__선형 및 로지스틱 회귀
__단순베이즈
__K유사 이웃
__비선형 알고리즘
____분류를 위한 SVM
____회귀를 위한 SVM
____SVM 튜닝
__앙상블 전략
____무작위 표본으로 붙이기
____느슨한 분류기로 담기
____무작위 하위 공간과 무작위 덧대기
____랜덤 포레스트와 엑스트라 트리
____앙상블로부터 확률 추정
____연속적인 모형 - AdaBoost
____기울기 나무 강화
____XGBoost
__빅데이터 다루기
____빅터이터 세트 예제 만들기
____용량 확장성
____속도 올리기
____다양성 다루기
____확률적 기울기 하강에 대한 개요
__딥러닝 만나기
__자연어 처리 엿보기(NLP)
단어 토큰화
스테밍
단어 태깅
개체명 인식
불용어
완전한 데이터 과학 예제 - 텍스트 분류
__비지도학습 개요
__요약

5장. 소셜 네트워크 분석

__그래프 이론 소개
__그래프 알고리즘
__그래프 읽기, 덤프하기, 추출하기
__요약

6장. 시각화, 통찰, 결과

__매트플롯립 기초 소개
____곡선 그리기
____패널 사용
____데이터의 관계를 위한 산포도
____히스토그램
____막대그래프
____이미지 시각화
____판다스로 하는 그래픽적 선택 예제
________박스플롯과 히스토그램
____산포도
____평행 좌표
__매트플롯립 명령 래핑하기
____시본 소개
____EDA 능력 강화
__보케로 양방향적 시각화하기
__더 나은 데이터학습 표현
____학습 곡선
____검증 곡선
____랜덤 포레스트를 위한 특성의 중요성
____GBT 부분 의존성 도표
____ML-ASS를 위한 예측 서버 만들기
__요약

부록. 파이썬 기초 강화하기
__학습 리스트
____리스트
____딕셔너리
____함수 정의
____클래스, 객체, OOP
____예외
____이터레이터와 제너레이터
____조건문
____리스트와 딕셔너리 내포
__보고, 읽고, 해보며 배우기
____무크
____파이콘과 파이데이터
____양방향적 주피터
____부끄러워 마라, 진정으로 도전하라

책 정보 별 바로가기 : 책정보  리뷰 (0) 가격비교 (8) 추가정보  책꼬리 (0) 한줄댓글 (0) 맨위로

리뷰

독자리뷰(총 0건)


책 정보 별 바로가기 : 책정보  리뷰 (0) 가격비교 (8) 추가정보  책꼬리 (0) 한줄댓글 (0) 맨위로

가격비교 - 인터넷서점 27,000

가격비교
서점 판매가 → 할인가(할인율) 판매가 할인가란? 적립금(적립률) 구매정보
YES24 바로가기 30,000원27,000원(-10%) 1,500원(5%) 구매하기 무료배송 대한민국1등 인터넷서점! 총알배송, 2천원추가적립, 리뷰포인트지급, 최저가보상
알라딘 바로가기 30,000원27,000원(-10%) 1,500원(5%) 구매하기 무료배송 10% 할인, 신간 사은품 추첨, 1권도 무료당일배송
교보문고 바로가기 30,000원27,000원(-10%) 1,500원(5%) 구매하기 무료배송 바로드림 최저가 보상, 바로드림/바로배송
영풍문고 바로가기 30,000원27,000원(-10%) 1,500원(5%) 구매하기 무료배송 바로바로 신규회원 1천원지급 / 오늘수령 나우드림
도서11번가 바로가기 30,000원27,000원(-10%) 0원(0%) 구매하기 무료배송 [T멤버십 할인/최대1만원,신간도서] 3만원 이상 구매시 1,000포인트 추가 적립
리브로 바로가기 30,000원27,000원(-10%) 1,500원(5%) 구매하기 무료배송 도서 10%할인, 5%추가적립, 배송 중 파손 시 100% 교환보장, 수험서 분철 990원!
인터파크 바로가기 30,000원27,000원(-10%) 1,500원(5%) 구매하기 무료배송 당일/하루배송, 최저가 200% 보장, 인터파크 통합 마일리지, 스페셜 사은품선택 서비스
반디앤루니스 바로가기 30,000원30,000원(-0%) 900원(3%) 구매하기 무료배송 북셀프 단 한권만 사도 무료배송, 당일배송, 매장에서 바로받는 북셀프 서비스, 최저가 보상, 신규회원 1,000원 적립

책 정보 별 바로가기 : 책정보  리뷰 (0) 가격비교 (8) 추가정보  책꼬리 (0) 한줄댓글 (0) 맨위로

추가 정보

상세이미지

★ 이 책의 대상 독자 ★

데이터 과학자가 되고자 하고, 데이터 분석과 파이썬에 대해 최소한의 실무 지식을 갖고 있다면, 이 책은 여러분이 데이터 과학을 시작하게 해줄 것이다. R이나 매트랩(MATLAB)을 사용한 데이터 분석 경험을 가진 데이터 분석가 또한 데이터 조작과 머신 러닝 기술을 키우기 위한 포괄적인 참고서로 활용할 수 있다

★ 이 책의 구성 ★

1장, ‘첫 단계’에서는 주피터 노트북을 소개하며 튜토리얼에서 동작되는 데이터에 어떻게 접근할 수 있는지를 보여준다.
2장, ‘데이터 개조’에서는 데이터 과학 파이프라인의 개요를 제공하며, 어떠한 러닝 알고리즘을 적용하든 사전에 데이터를 다루고 준비하는 데 필요한 주요 도구들을 살펴 본다. 그리고 가설 실험 스케줄을 설정한다.
3장, ‘데이터 파이프라인’에서는 결과를 잠재적으로 개선할 수 있거나 심지어 강화할 수도 있는 모든 작업을 다룬다.
4장, ‘머신 러닝’에서는 사이킷런 패키지가 제공하는 주요한 머신 러닝 알고리즘 중 선형 모형, 서포트 벡터 머신(support vector machines), 앙상블 트리, 클러스터링을 위한 비지도적인(unsupervised) 기술 등을 샅샅이 살펴본다.
5장, ‘소셜 네트워크 분석’에서는 예측 변수/목표 변수 플랫 행렬(predic-tors/target flat matrices)의 흥미로운 변형인 그래프를 소개한다. 이는 현재 데이터 과학에서 꽤 인기 있는 주제다. 매우 복잡하고 난해한 네트워크를 샅샅이 살펴본다.
6장, ‘시각화, 인사이트 그리고 결과’에서는 맷플롯립(Matplotlib)으로 하는 시각화의 기초, 판다스로 EDA를 조작하 방법, 시본과 보케(Bokeh)로 아름다운 시각화를 이뤄내는 방법 그리고 요구에 따른 정보를 제공하기 위해 어떻게 웹 서버를 설정할 수 있는지에 대해 소개한다.
부록, ‘파이썬 기초 강화하기’에서는 데이터 과학 프로젝트를 작업하는 데 필수적인 파이썬 언어의 주요 측면에 집중한 예제와 튜토리얼을 다룬다.

★ 옮긴이의 말 ★

요즘 인기 있는 데이터 과학을 배워보고 싶으십니까? 그런데 회사에서 항상 써오던 엑셀 대신 프로그래밍 언어로 더 멋지게 해보고 싶으신가요? 그렇다면 먼저 어떤 언어를 배울지 결정해야 되겠네요.
프로그래밍 언어가 처음이라면 파이썬과 R, 둘 중에서 하나를 고르면 됩니다. 두 언어 모 두 우아하고 쉬운 문법을 가지고 있어 초보자도 어렵지 않게 프로그래밍을 접할 수 있게 해줍니다. R의 장점이 특정 분야나 목적을 위한 풍부한 패키지라면, 파이썬의 장점은 범용성이라 할 수 있습니다. 파이썬의 SciPy, 판다스, 사이킷런 등 다양한 패키지는 어떤 데이터든 쉽고 빠르게 처리하고 분석할 수 있도록 도와줄 것입니다. 또한 파이썬을 더욱 능숙하게 사용할 수 있게 된다면, 게임이나 웹 사이트도 만들 수 있습니다.
자, 파이썬을 배우기로 결정하셨군요. 도서관에서 책을 빌려보거나 이 책의 추천을 따라 코드 아카데미의 무료 코스를 수강할 수도 있습니다. 인터넷에도 파이썬을 배울 수 있는 좋은 자료가 많습니다.
파이썬이 무엇인지 조금 이해하셨나요? 이제 데이터 과학을 직접 경험해볼 차례입니다. 그런데 프로그램 설치부터 실전 분석까지 과외 선생님처럼 차근차근 가르쳐주는 책이 있다면 어떨까요? 네, 바로 이 책입니다. 저는 책을 번역하면서 초보자의 입장을 배려한 저자의 노력에 감탄했습니다. 이 책은 프로그램 설치에서 데이터 분석과 시각화에 이르기까지 여러분을 잘 이끌어줄 것입니다.
수학적 내용이 어려울까 걱정스러우신가요? 물론 수학에 익숙하시다면 더욱 좋겠지만, 이 책은 주요 알고리즘의 개념을 최대한 쉽게 설명해주기 위해 노력합니다. 일단 어려운 수학은 접어두고, 데이터를 넣어 직접 분석을 해보면 어떨까요? 그래도 부족한 내용은 인터넷을 검색해보거나 관련 논문을 찾아 학습하면 충분할 것이라고 생각합니다. ‘천리 길도 한 걸음부터’라는 속담이 지금보다 어울릴 만한 때는 없을 것 같네요. 그리고 이 책은 여러분이 천리 길을 더욱 빨리 갈 수 있도록 도와줄 것입니다.

책 정보 별 바로가기 : 책정보  리뷰 (0) 가격비교 (8) 추가정보  책꼬리 (0) 한줄댓글 (0) 맨위로

책꼬리

책꼬리란? 함께 읽으면 좋은 책이거나, 연관된 책끼리 꼬리를 달아주는 것입니다. '파이썬으로 배우는 데이터 과학'와 연관된 책이 있다면 책꼬리를 등록해 보세요

퀵메뉴

TOP

서비스 이용정보