본문
빅데이터&인공지능 with 생물정보학
지은이양우진
쪽수200쪽
초판2019년 6월 30일
ISBN979-11-6426-056-0
판형188mm x 257mm (46배판)
기타애프터스킬 시리즈
- 책소개
- 목차
- 저자 소개
- 상세이미지
빅데이터 분석과 이를 통한 AI 구현 기법 총 정리!
생물정보학을 기초로 수집한 데이터 기반의 머신 러닝과 교차 검증, 딥 러닝까지!
기관에서 개별 기업으로, 이제 개인에 이르기까지 수많은 자료들이 넘칠 만큼 생성되며 그렇게 쌓여 가는 데이터들을 일컫는 ‘빅데이터’라는 용어와 함께 한때 영화 속에서나 등장할 법하던 ‘인공 지능’ 또한 조금 식상하리만치 흔하게 들을 수 있게 된 지금, 그만큼 빅데이터 분석과 관련 기법들을 활용한 머신 러닝, 딥 러닝이라는 분야에 대한 관심은 그야말로 폭발적이라고 할 수 있습니다.
다만, 실무 과정에서의 데이터 과학 활용이 제대로 빛을 발하기 위해서는, 단순히 컴퓨터 과학적 지식만이 아니라 그 빅데이터의 근원이 되는 해당 분야에 대한 지식과 더불어 지속적인 관심 및 다양한 데이터들을 여러 방면에서 다뤄 본 경험이 가장 중요하다고 할 수 있습니다.
이에 본 책은 유전학과 분자 생물학, 통계와 컴퓨터 과학 등 여러 데이터 과학이 결합되어야 하는 생물정보학 전공자인 저자의 경험을 바탕으로, 우분투와 파이썬을 통해 가장 효율적으로 구성할 수 있는 분석 환경의 구현과 함께 빅데이터 분석 기법을 통해 현재 인공 지능이라는 범주 안에서 가장 빈번하게 언급되곤 하는 머신 러닝과 딥 러닝까지의 여러 키워드에 관련된 기법과 팁들을 정리합니다.
이 과정을 통해 자신의 연구 분야 내에서 환경을 갖추고도 정보학 관련 기법들이 부족하여 교착 상태에 빠진 여러분들께 통로와 출구를 제공하는 든든한 나침반이 되어 줄 것입니다.
머리말
도서 가이드
참고 사이트 목록
목차
CHAPTER .1 생물정보학의 데이터
1.1 생물정보학과 빅데이터
01 생물정보학
02 빅데이터
1.2 개발 환경은 어떻게 마련하나?
01 리눅스에서 시작하자
02 사용자 등록과 권한
03 여러 종류의 셸(shell)
04 셸의 명령어
05 파일 편집기
06 Python과 R, 무엇을 쓸 것인가?
07 파이썬으로 개발 환경 만들기
1.3 빅데이터는 어디서 구하나?
01 웹에서 내려받기
02 스크립트로 데이터 긁어 오기
03 HTTP로 요청하기
04 SQL로 다운받기
CHAPTER .2 데이터 다루기
2.1 빅데이터는 어떻게 저장할까?
01 리스트(List), 튜플(Tuple), 딕셔너리(Dictionary)
02 가장 빠른 검색 방법, 딕셔너리
03 너무 큰 데이터를 다루어야 한다면? 분할 정복
04 데이터 전처리
2.2 데이터 처리를 위한 방법
01 여러 데이터 형식
02 셸 스크립트
03 pandas와 NumPy
04 NumPy로 데이터 다루기
2.3 통계적 유의성을 검증하자
01 통계적 유의성
02 확률 변수와 분포
03 빈도가 얼마나 다른가? 카이제곱 검증
04 확률 밀도와 정규 분포
05 분포가 얼마나 다른가? t-검증
CHAPTER .3 인공 지능
3.1 머신 러닝 (Machine Learning)
01 분류와 회귀
02 SVM (Support Vector Machine)
03 결정 트리와 랜덤 포레스트
04 베이즈 분류와 인과 네트워크
3.2 교차 검증 (Cross Validation)
01 데이터셋 나누기
02 분류기의 성능 평가 척도
03 좋은 분류기 선택
04 빠지기 쉬운 함정
05 모델의 성능을 측정하는 다른 것들
3.3 딥 러닝 (Deep Learning)
01 인공 신경망 (Artificial Neural Network)
02 딥 러닝을 위한 프레임워크
03 CNN (Convolution Neural Network)
04 Autoencoder
05 RNN (Recurrent Neural Network)
06 여러 가지 Optimizer의 최적화
▷ 찾아보기
지은이 : 양우진
1996~2003년 서울대학교 전산학과 학사, 컴퓨터 공학과 석사 졸업 (컴퓨터 네트워크 전공)
2003~2007년 한국전자통신연구원(ETRI) 광대역통합망, IPv6 장비 개발
2007~2009년 포스데이타(현 포스코ICT) 4G 이동통신 장비 개발
2009~2011년 세아ICT 4G 이동통신 장비 개발
2011~2012년 LG전자 미래IT융합연구소 IoT 통신 담당
2012~2017년 한국과학기술원(KAIST) 바이오및뇌공학과 박사 졸업, 유전체 데이터를 머신러닝으로 분석한 졸업논문으로 우수논문상 수상
2017~2018년 한국생명공학연구원(KRIBB) 박사후 연구원
2019~현재 사우디아라비아 킹압둘라과학기술대학(KAUST) 박사후 연구원, 싱글셀 데이터 분석 연구 수행중