일상에서 빠질 수 없는 데이터 분석

우리는 살아가며 많은 상품들을 사용하고 마주한다. 상품을 고를 때 기준은 사람마다 다르지만 대부분 익숙하고 좋은 제품을 선택한다. 계속 사용하는 제품이 되려면 처음에 제품을 사용하게 하고 만족스러운 제품이어야 한다. 기업에서 제품을 사용하게 만들기 위해서는 홍보를 선택한다. 그리고 제품을 홍보하려고 광고를 이용한다. 그런데 광고를 한다고 해서 좋은 이미지가 만들어지고 매출이 오르는 것은 아니다. 어떨 때는 효과가 없고, 어떨 때는 매출이 오를 때도 있을 거다. 왜냐하면 광고와 매출이 상관관계이지 인과관계가 아니기 때문이다.

출처: 교보문고
출처: 교보문고

무작위 비교 시행(RCT)는 인과관계를 밝히는 가장 좋은 방법이다. A와 B 두 집단을 비교한다는 의미에서 AB 테스트라고도 한다. RCT에서 가장 중요한 것은 두 집단을 나눌 때 랜덤하게 나눠야 한다는 것이다. 랜덤으로 나누지 않으면 개인 집단과 비교집단은 다른 요인에 의해 영향을 받게 되기 때문이다. RCT는 '개인 집단의 평균적 결과와 비교집단의 평균적 결과가 같아진다.'라는 가정하에 진행된다. 자연 실험은 실제 실험과 유사한 상황을 이용하여 인과관계를 분석하는 것이다.  자연 실험의 장점은 가정이 성립하면 경계선 부근에서 RCT와 유사한 상황을 이용할 수 있다. 이 외에도 집군 분석, 패널 데이터 분석 등 다양한 분석 방법이 있다.

출처: flaticon
출처: flaticon

이 책을 읽기 전에는 많은 돈을 사용하여 광고를 찍기에 광고를 하면 대부분 매출이 오를 것이라고 생각했다.  유명인이 광고에 출연하고 모델로 발탁되기에  그만큼의 광고 효과가 있어서 매출이 오를 것이라고 생각하였다. 그런데 모든 기업이 광고를 내보낸다고 매출이 오르는 것이 아니라 여러 가지 상황과 요인에 따라서 매출이 오를 수도 있고 아닐 수도 있다는 것을 알게 되었다. 그리고 데이터 분석 방법이 존재하다는 것을 알게 되었다. 데이터 분석을 할 때 비슷한데 조금씩 다른 분석 방법을 사용할 줄 알았는데 분석 방법이 다양하고 다 다른 방식으로 분석한다는 것이 놀라웠다. 가장 중요한 것은 상관관계가 아닌 인과관계를 살펴야 한다는 것이었다. 

'데이터 분석의 힘'은 데이터 분석의 기초를 바탕으로 설명하고 있어 내용을 이해하기 쉽다. 그렇기에 전문지식이 없는 사람도 쉽게 접할 수 있다. 각 데이터 분석 방법마다 예시를 들어주어 이해가 잘 된다. 각 챕터 마지막 장에 챕터의 내용이 요약이 되어 있어 읽고 다시 떠올려 볼 수 있다. 통계학 이론이나 수학공식을 알고 있지 않아도 데이터 분석의 기초를 쌓을 수 있는 책이었다. 데이터에 관련된 직종에 종사하는 것이 아니면 데이터에 관해 깊은 지식을 쌓을 필요는 없다. 하지만 살아가면서 데이터 분석에 관한 기초지식은 필요하다고 생각한다. 그렇기에 이 책을 한 번쯤 읽어보는 것을 추천한다.

 

 

저작권자 © MC (엠씨플러스) 무단전재 및 재배포 금지