빅데이터 인문학: 진격의 서막 (에레즈 에이든, 장바티스트 미셸) ㄴ추천도서

빅데이터 인문학 : 진격의 서막

[한줄평] ★★★★☆
빅데이터의 유용함보다는 저자들의 끈질긴 연구노력이 더욱 돋보이는 책

구글의 앤그램(Ngram)에 대한 기사는 예전에 내가 블로그에 올렸는데([NEWS] Google Books Ngram Viewer (구글이 애플보다 무서운 이유). )
이 책은 바로 그 앤그램을 개발하고 연구한 두 사람의 결과를 정리한 책이다.

구글의 앤그램이 뭔지 모르는 사람들을 위해서 간단히 설명하면
구글이 원대한 목표를 갖고 모든 책을 디지털화하는 작업을 시작한지는 10년이 넘었는데
이렇게 책들을 디지털화하다보니
책에 적힌 단어나 문구를 찾을 수 있게 되고
연도별로 책들에서 나타나는 단어의 빈도를 찾을 수 있는 뭐 그런 것이다.
자세한 것은 다음 사이트(https://books.google.com/ngrams)나 위 기사를 참조하시길...

그럼 왜 이 책을 내가 추천했느냐고 생각해볼 수 있는데
솔직히 추세를 알아보기 위해 데이터를 분석한 것은
빅데이터 분석에서 매우 단순한 형태라고 할 수 있다.
그러기에 별로 특이한 것도 없을 것이다.

그러나 저자들은 이 앤그램을 가지고 단순히 몇개의 단어의 추세를 찾아본 것이 아니라
영어에서 동사의 불규칙 변형이 어떻게 바뀌어 왔는지
미국 사람들은 언제부터 미국을 하나의 나라로 인식하게 되었는지
사전에 등재된 단어들이 제대로 사람들이 많이 사용하는 단어를 넣은 것인지 아니면 편집자가 엉뚱하게 넣은 것인지
사람의 명성은 어떤 추세로 등락을 보이며 시대별 각 분야별로 명성의 추이는 어떤지 등
단순한 사고를 넘어서 깊은 고민을 바탕으로 위에서 갖은 의문에 대한 답을 앤그램으로 찾아서 제시한다.
도대체 위의 의문들을 앤그램으로 어떻게 답했을지 궁금하지 않는가?

물론 책은 우리 사회의 모습을 보여주는 여러가지 통로 중 하나에 불과하지만
저자들은 이 부분에 대한 한계와 단점에도 불구하고 설득력 높은 설명을 책에서 서술하고 있다.

빅데이터의 유용성을 확인한다기 보다는
이 책을 통해서 나는 저자들은 연구에 대한 집념과 탁월한 식견에 감탄했다.

덧글

댓글 입력 영역