Bamboo is coming

빅데이터가 만드는 제4차 산업혁명(김진호, 북카라반, 2016) 읽은 후기 본문

빅데이터가 만드는 제4차 산업혁명(김진호, 북카라반, 2016) 읽은 후기

twenty 2022. 1. 6. 15:38

저자는 서울대 경영학을 전공한 교수로 2016년 알파고와 이세돌의 경기에서 알파고의 완승을 예측한 빅데이터 연구 센터장이다. 저자는 정보화시대라고 불리는 지금을 결국 숫자로 정보가 요약될 수 있으므로 숫자정보사회라고 표현한다. 따라서 부제 "개인과 기업은 어떻게 대응할 것인가"에 대하여 개인과 기업으로 분류하여 데이터를 설명한다. 챕터는 총 14개로 이중 10개의 챕터에서 통계지식을 설명하고 있다.

 

평소에 언론에서 왜곡된 데이터를 제시하고 있다는 직간접적으로 접하고 있었는데 이 책을 읽으니까 그 데이터들이 왜 잘못 됐는지 알 수 있었다. 그리고 숫자로 제공되는 정보는 듣는 사람이 쉽게 검증할 수 없기 때문에 비교적 신뢰성을 얻기 쉽다. 그렇기 때문에 왜곡하기 쉽고 왜곡된 정보도 왜곡되었다고 인식할 수 없는 것이다. 


가장 충격적이었던 부분은 매카시즘에 대한 내용이었다. 매카시즘은 1950~1954년 사이에 일어나, 공산주의 혐의자들에게 반대하는 떠들썩한 반대 캠페인이다. 1950년 초에 매카시 상원의원은 경력 위조, 상대방에 대한 명예훼손, 로비스트에게서 금품 수수, 음주 추태 등으로 정치적으로 사면초가에 몰린 상태였으며, 그의 정치 생명은 끝난 것으로 여겨졌다. 충격적인 이슈 없이는 회복할 수 없는 상황에서 매카시는 구체적인 어림수를 활용함으로써 반전을 유도했다. 즉, 그는 그해의 공화당 당원대회에서 "미국에선 공산주의자들이 활동하고 있으며, 나는 297명의 공산주의자 명단을 갖고 있다"고 주장해 미국 사회에 엄청난 충격과 관심을 이끌어 냈다.

 

(여기서 가장 충격적인 부분은) 이전에도 그는 공산주의자가 많다고 떠들고 다녔지만, 별 반응이 없었다. 그런데 이번에는 구체적인 숫자 297을 제시하면서 그 명단을 갖고 있다고 하자 예상보다 폭발적인 반응을 불러일으킨 것이었다. 신문들은 매카시의 폭로를 사실 여부에 관계없이 헤드라인으로 삼았으며, 공산주의자를 추측하는 제목의 엄청난 기사들이 쏟아졌다. 이덕에 매카시는 대중적인 인지도와 지지를 확고하게 늘려나갔으며, 그때부터 매카시즘 시대라고 불리는 4년동안 그는 미국 정가에서 가장 유력한 인사였다.

 

이 과정에서 공산주의와 무관한 일부 사람들이 조사를 받기도 했다. 가장 먼저 의심받은 사람들은 공무원, 연예 사업의 인물, 교육자, 노동조합 활동가였다. 무고한 경우도 있었고, 그러한 혐의는 종종 확정되지 않거나 의심스러운 증거로도 확실하다고 여겨졌다. 많은 사람들이 직장을 잃고 경력을 망쳤으며 투옥되기도 했다. 처벌자 대부분의 평결은 나중에 번복되었으며 그에 의해서 기소된 인사들 중 아무도 유죄 판결을 받은 사람이 없었다.

1954년 4월 상원은 매카시에 대한 청문회를 열었으나 매카시는 명확한 근거를 제시하지 못했고 그 후에 그는 알코올중독으로 사망했다. 

 

이외에도 상관관계와 인과관계를 혼용하거나 다양한 가능성을 고려하지 못한 데이터 분석의 오류도 다양한 예시를 들어 설명되어 있어서 거의 하루만에 다 읽었다. 매 챕터마다 책에서 다양한 사람의 말을 인용해서 환기를 시킨다. 노력에 관한 명언이 가장 인상 깊었다.

 

나는 빅데이터에 관심이 있지만 빅데이터 분야에서 무슨 일을 하는지 잘 몰랐는데 결국 빅데이터도 데이터고 분석이 중요한 것 같다. 그 분석에 수반되는 문제인식 및 조사 그리고 결과 도출 중에 한 분야를 하는 듯 하다. 다음엔 데이터마이닝 관련 책을 읽고 코딩 연습 많이 하고 시야를 넓혀서 내가 후회하지 않은 선택을 했으면 좋겠다.

천재는 99%의 노력과 1%의 영감으로 만들어진다.
(토마스 에디슨)
Comments