북로그/독서 기록

데이터를 분석하고 시각화하는 아주 쉬운 방법(feat. 혼자 공부하는 R 데이터분석 리뷰)

동사힐 2022. 2. 16.

안녕하세요~  동사힐입니다. 😊

1. 데이터를 분석하고 시각화하는 아주 쉬운 방법 : 혼자 공부하는 R 데이터분석


오늘은 데이터를 분석하고 시각화하는 아주 쉬운 방법을 익힐 수 있는 책인 혼자 공부하는 R 데이터 분석을 리뷰하도록 하겠습니다. 이 책은 제가 특히 애정을 갖고 있는 책인데요, 베타리딩에 참여했던 책이기 때문입니다. 학부때 경영통계학 수업을 들으면서 데이터 분석을 했던 경험을 떠올리면서 베타리딩을 즐겁게 했습니다.

혼자 공부하는 R 데이터 분석 표지

 

R은 제가 학부때 SPSS와는 차원이 다른 프로그램입니다 SPSS는 사실 세팅이 다 되어 있는 기성 프로그램이라면, R은 프로그래밍 언어에 가깝기 때문에, 설치부터 세팅, 코드 입력까지 해야 할 것이 많습니다. 그러다보니 프로그래밍에 막연한 두려움을 갖고 있는 분이라면 접근하기 어려울 수 있습니다. 프로그래밍을 한번도 해보지 않으면서 동시에 데이터 분석도 해보지 않았다면 더욱 어려울 수도 있습니다.

이 말은 바꿔말하면, 프로그래밍 기초가 어느 정도 있거나 접해본 분이라면 상당히 쉽게 접근할 수 있기도 합니다. 또한 데이터 분석과 관련된 기반 지식을 갖고 있다면 역시 R을 학습하는데 크게 어려움을 느끼지 않을 수 있습니다.

혼자 공부하는 R 데이터 분석과 함께라면 누구나 시작할 수 있다

 

어떤 도구를 사용해도 그저 분석을 위한 도구일뿐입니다. 프로그래밍을 공부한다는 것은 문제를 해결하기 위한 도구 사용법을 익히는 것에 지나지 않습니다. 마치 새로운 스마트폰을 익히는 것과 같습니다. 

 

혼자 공부하는 R 데이터 분석의 저자는 위와 같이 말하였는데요. 저도 상당히 공감합니다. 결국은 도구이고 수단입니다. 무엇을 다루든 목적을 달성하기 위한 도구이고, 가장 효율적이면서 효과적인 도구를 우리는 선택하여 사용합니다. 그러면에서 R은 최고의 도구이고, 혼자 공부하는 R 데이터 분석은 스스로 학습하는데 최적화된 학습서입니다.

 

저는 “혼자 공부하는 R 데이터 분석” 베타리딩 활동을 하면서 성취감을 느꼈습니다. 한빛미디어의 베타리더로서 “혼자 공부하는 R 데이터 분석” 원고 112페이지 분량을 하루만에 읽었습니다. 그 정도로 이 책은 가독성이 좋고, 학습하기 좋습니다. 그런데 베타리딩 버전이 아닌 정식 출간본을 읽어보니, 베타리딩 버전보다 훨씬 더 읽기 편하게 편집이 되어 있었고, 베타리딩 버전에서 있었던 오탈자는 모두 수정되었습니다. 그만큼 한빛미디어의 책은 뛰어난 완성도를 자랑합니다. 베타리딩 활동을 8월에 했는데 책이 무려 5개월 뒤인 1월에 출간되었습니다. 한빛미디어의 장인정신을 엿볼 수 있는 부분이라고 생각합니다.

 

2. 프로그래밍이나 데이터 분석을 한번도 해보지 않은 독자를 위한 물샐틈 없는 꼼꼼한 구성


“혼자 공부하는 R 데이터 분석” 의 가장 큰 장점은 정말 프로그래밍이나 데이터 분석을 한번도 해보지 않은 독자를 위한 맞춤형으로 물샐틈 없이 꼼꼼하게 책의 내용이 구성되어 있다는 점입니다.

프로그래밍 언어를 배우는 초보자들이 의외로 가장 큰 어려움을 느끼고, 시간을 많이 소요하면서도 포기하는 구간이 사실은 개발 환경 설치입니다. 어느 정도 언어를 사용해본 사용자라면 그거 왜 못해?라고 반문할 수도 있지만, 한번도 프로그래밍 언어 설치를 해보지 않고 그저 더블 클릭으로 프로그램을 실행만 해보던 독자들은 가장 어려워하는 부분이기도 합니다. 

그런데 역시 “혼자 공부하는 R 데이터 분석” 은 데이터 분석은 해보았지만 프로그래밍 언어를 한번도 해보지 않았을 독자를 위해 매우 상세하게 개발 환경 설치 챕터를 설명하고 있습니다. 게다가 OS도 나누어서 윈도우즈 버전과 mac까지 꼼꼼하게 설명하고 있습니다. 이는 저자가 얼마나 독자 친화적으로 생각하고 있음을 보여주는 지표라고 생각합니다.

R스튜디오 화면 설명

이 책이 혼자 데이터 분석을 학습하는 독자에게 최고의 가독성으로 편집되어 있음을 알 수 있는 장면입니다. 위 그림을 보시면 빨간 표로 하나하나 체크되어 있고, 실행할 코드를 드래그한다는 상세한 설명까지 기입되어 있음을 알 수 있습니다.

R스튜디오에서 Environment 창에서 화살표 버튼 설명

초보자는 쉽게 찾기 어려운 버튼을 보기 쉽도록 표시하고 설명도 상세하게 넣었습니다.

R스튜디오에서 *의 의미

초보자가 알지 못하는 *의 의미가 놓치지 않고 설명하고 있습니다. 얼마나 꼼꼼한 설명을 하고 있는지 알 수 있습니다.

Hello world 출력 방법

정확하게 실행한 코드와 결과만 표시하여 가독성을 높이고 있습니다.

또한 이미지 출력 화면을 단순 캡쳐한 것이 아니라, 이해할 수 있도록 다양한 기호로 설명을 하고 있습니다. 이 부분 역시 독자의 이해를 돕고, 가독성을 높여주는 표시인데요, 사실 편집하는 입장에서는 하나하나 이미지에 이러한 기호와 표시 등을 삽입하는 것은 매우 번거롭습니다. 그럼에도 불구하고 독자를 위해서 꼼꼼하게 빠짐없이 넣고 있습니다. 프로그래밍 언어 관련 책을 많이 사서 읽어본 독자라면 지금 말씀드리는 내용이 얼마나 대단한지 잘 아시리라 믿습니다. 이런 부분 덕분에 제가 한빛미디어의 책을 믿고 보는 이유이기도 합니다.

여러 줄 중 특정 코드만 실행하는 법

프로그래밍을 처음 다루는 독자들은 코드 실행 방법조차 모르는데, 그점을 놓치지 않고 컨트롤 + 엔터와 Run버튼을 모두 설명하고 있습니다. 또한 특정 코드 실행을 위한 블록 지정후 실행하는 방법도 세심하게 설명하고 있습니다.

 

Plot 탭 노트

 

아주 사소한 부분까지도 상세한 노트는 정말 독자가 혼자서 학습할 때 무엇을 당황스러워하고 답답해 할지를 놓치지 않고 있습니다. 독자들이 많이 놀라는 부분 중 하나가 자신이 실제 실행한 화면의 결과와 책의 내용이 다를 때인데요. 왜 나는 책의 내용처럼 나오지 않을까? 뭐가 잘못된 것은 아닐까? 내가 틀리게 하고 있나? 하는 부분입니다. 그런데 “혼자 공부하는 R 데이터 분석” 은 그런 부분을 충분히 고려해서 노트를 삽입해두었습니다. 이러한 꼼꼼한 노트가 가능한 이유는 바로 한빛미디어가 그동안 혼공 시리즈를 지속적으로 출간했기 때문입니다. 저자와 출판사의 시너지 효과가 이런 디테일한 부분에서 드러난다고 생각합니다.

R스튜디오 테마

제가 프로그래밍을 처음 할 때도 당황했던 부분이기도 한데요. 왜 코드별로 색상이 책하고 다르지? 내가 잘못했나? 라는 생각으로 상당한 시간을 잡아먹었던 적이 있습니다. 어느 누구도 테마 차이라는 것을 말해주지 않았기 때문이죠. 그런 점을 놓치지 않고 “혼자 공부하는 R 데이터 분석”은 설명하고 있습니다.

 

 

3. 단순 암기를 지양하고 학습자가 원리를 이해할 수 있도록 돕는 설명 제시


데이터 분석이나 프로그래밍을 할 때 다양한 함수를 사용합니다. 보통은 책에 나와 았는 저자의 설명 그대로 함수를 사용하는데요. 굳이 왜 이 함수를 사용해야하는지까지 세세하게 설명을 하지 않습니다. 그러다보니 독자도 그저 함수를 외우고 암기만 하지요.

return()함수와 cat()함수의 차이

그런데 저자는 특정 함수를 사용하는 이유에 대해서 구체적으로 설명합니다. 위 이미지에서 보듯이 return()과 cat()의 차이를 설명하고, 어떤 상황에서 return()을 써야 하는지 언급하고 있습니다.

barplot()함수에서 table()함수를 사용하는 이유

 barplot() 함수를 쓸 때 왜 freq()함수를 사용하지 않고 table() 함수를 사용하는지 설명을 하고 있습니다. 이러한 이유를 설명함으로써 독자로 하여금 암기가 아니라 원리 이해를 바탕으로 어느 상황이든 적용할 수 있도록 독자의 실력을 꼼꼼하게 향상시켜줍니다.

 

4. 실무에 바로 활용할 수 있도록 데이터 수집 및 가공 과정을 상세히 설명


데이터 분석을 위한 학습을 하다보면 실습에서 실무로 넘어갈 때 가장 어려움을 느끼는 것이 바로 데이터 분석보다 데이터 분석을 위한 사전 과정인 데이터 수집 및 가공 과정입니다. 왜냐하면 데이터 분석은 배웠던 함수 등을 활용해서 실행만 하면 되지만, 사실 데이터 수집 및 가공은 내가 필요한 데이터를 어디서 어떻게 찾아야 하는지 스스로 고민해야 하는 부분이기 때문이죠. 

막상 실무에서 필요한 데이터를 찾아보려고 하면 난감한 경우가 많습니다. 실습은 주로 패키지에 포함된 예제 Iris 데이터만 해보았던 경우가 많으니까요. 그러나  “혼자 공부하는 R 데이터 분석”은 실제로 어디서 데이터를 어떻게 수집해야 하는지 프로젝트를 통해서 상세하게 설명하고 있습니다.

공공데이터포털에서 데이터 수집하는 방법

공공데이터포털에서 직접 데이터를 수집하는 장면을 상세하게 설명하고 있습니다. https://www.data.go.kr/

 

공공데이터 포털

국가에서 보유하고 있는 다양한 데이터를『공공데이터의 제공 및 이용 활성화에 관한 법률(제11956호)』에 따라 개방하여 국민들이 보다 쉽고 용이하게 공유•활용할 수 있도록 공공데이터(Datase

www.data.go.kr

 

원하는 데이터 다운로드 방법

위의 사진처럼 XLS를 어떻게 다운 받아야 하는지까지 상세하게 설명을 하고 있습니다. 이런 내용은 실무에서 바로 활용할 수 있도록 돕는 정말 필요한 내용이라고 할 수 있습니다.

메타데이터 확인 방법
게다가 메타데이터를 설명함으로써 데이터 개요를 직관적으로 파악할 수 있는 방법 역시 빠트리지 않고 설명하고 있습니다.
엑셀 파일 가져오는 방법

위 부분은 정말 놀랐던 부분인데요. “혼자 공부하는 R 데이터 분석”이 정말 프로그래밍을 한번도 해보지 않은 독자를 위해서 얼마나 세심하게 책을 집필했는지 알 수 있는 내용입니다. 프로그래밍 초보자는 이 단순한 데이터 로드조차 어려워하기 때문이죠. 정말 1:1 과외하듯 혼자 해도 충분히 할 수 있는 프로그래밍 & 데이터 분석 자습서라는 말이 과언이 아닙니다.

5. A부터 Z까지 데이터 프로그래밍의 모든 것을 설명하는 최고의 가이드


R마크다운 문법

마크다운 문법은 프로그래밍을 하는 사람은 당연히 알 것이라고 넘어가거나, 초보자의 경우에는 쓸 일이 없으니까 넘어가는 경우도 많습니다. 하지만 실무에서 마크다운 문법은 상당히 빈번하게 사용됩니다. 웹상에서 문서로 기록하고 공유하는 일이 많기 때문이죠.  “혼자 공부하는 R 데이터 분석” 역시 놓치지 않고 설명을 하고 있습니다. 프로그래밍 기초부터 데이터 분석에 이어 마크다운 문법까지 정말 빼놓는 것이 하나도 없습니다.

BI 개요

또한 BI는 R과는 사실 직접적인 관련은 없습니다. 쉽게 말해서 태블로를 사용하면 R을 사용할 일이 드물기 때문이죠. R과 BI는 상호대체제 성격이 강하죠. 그런데  “혼자 공부하는 R 데이터 분석”은 실무에서 자주 사용하는 BI 3가지를 언급하고 있습니다.

  • 마이크로소프트 파워 BI
  • 태블로
  • 구글 데이터 스튜디오

이는  “혼자 공부하는 R 데이터 분석”의 저자가 모두 실무 경험이 많기 때문에, 독자로 하여금 실무에서 더욱 뛰어난 능률을 올렸으면 하는 마음에 넣은 내용이라고 생각합니다. 그만큼 “혼자 공부하는 R 데이터 분석”의 저자가 얼마나 이 책의 독자들을 생각하는지 엿볼 수 있는 내용이라고 생각합니다.

매개변수와 패키지

끝으로 본문 내용과 연계되어 있는 혼공 용어 노트 역시 매우 유용합니다. 위 이미지에서 알 수 있듯이, 본문 몇페이지에서 확인할 수 있는지 꼼꼼하게 설명하고 있습니다. 학습자가 복습을 하거나 추후 실무에서 손쉽게 활용할 수 있도록 돕고 있습니다.

 

6. 누구보다 독자를 위하는 마음이 느껴져서 좋았던  “혼자 공부하는 R 데이터 분석”


최근 10년 동안 디자인 업계에서 UI/UX는 대세가 되었습니다. UI/UX의 핵심 중 하나는 바로 사용자의 입장에서 상상하고 디자인하는 것인데요. 여러 출판사에서 출간되는 책들을 보면 저자, 편집자 중심의 책인지, 독자, 사용자 중심의 책인지 쉽게 알 수 있습니다. 얼마나 독자 입장을 생각하고, 독자가 궁금해 하는 내용은 무엇이고, 왜 어려워하고, 어떻게 해야 막힌 부분을 뚫어 나가는지를 독자 입장에서 상상하는 책이 정말 좋은 책입니다. 당연히 가독성도 좋구요.

그런데 보통 책은 상당한 수준의 전문가가 쓰기 때문에 초보 독자의 시선에서 상상하기는 쉽지 않습니다. 당연히 알 것이라고 생각하고 넘어가는 내용이 많구요. 그런 점에서 혼공 시리즈는 정말 대단한 책이라고 할 수 있습니다. 특히 이번에 나온  “혼자 공부하는 R 데이터 분석”은 정말 단언컨대 독자를 위하는 마음이 느껴져서 정말 기분 좋았습니다.

너무나 세심하고 물샐 틈 없이 프로그래밍과 데이터 분석을 설명하는 개념서이자 자습서  “혼자 공부하는 R 데이터 분석” 리뷰를 이것으로 마치겠습니다.

 

어떠셨나요? 도움이 되셨나요?

그러면 다음에도 더욱 좋은 글로 돌아오겠습니다.

궁금한 사항 있으시면 댓글로 남겨주세요.

도움이 필요하시다면 사연을 적어서 이메일을 보내주세요.

dongsahill@gmail.com

그리고 도움이 되셨다면 공감과 구독 부탁드려요.

이상으로 동사힐이었습니다!

읽어주셔서 감사합니다. 😊

 

 

반응형

댓글

💲 추천 글