"오바마 4년 더" "박근혜 당선"…빅데이터는 알고 있었다

입력
2012-12-21 17:12:12
수정
2012-12-23 12:58:11

트위터로 보내기 페이스북으로 보내기 미투데이로 보내기 요즘으로 보내기 C로그로 보내기

확산되는 빅데이터 활용

구글 朴-文 검색비율, 득표율과 비슷…오바마, 2년 전부터 빅데이터팀 가동
보험·유통·의학 등 활용분야 무궁무진…개인 프라이버시 침해는 여전히 논란

< 빅데이터 : 방대한 데이터 분석해 정보 추출 >

2017년 한국의 제19대 대통령 선거. OO당의 A후보는 부산 자갈치시장 유세에 앞서 보고서를 받아든다. 보고서의 핵심은 유세장에 50대 여성이 가장 많을 것이란 예측이다. 페이스북을 비롯한 소셜네트워크서비스(SNS), 포털 검색어, 개별 기지국의 연령대별 휴대폰 가입자 현황 등을 바탕으로 한 분석이다. A후보는 현장에서 50대 여성을 겨냥한 공약을 집중적으로 발표한다. 50대 여성들에게 가장 인기가 많은 중견 탤런트를 찬조 연설자로 대동해 큰 호응을 얻는다.

소설 같아 보이지만 최근 ‘빅데이터 기술’이 발전하면서 충분히 실현 가능한 상황이다. 빅데이터는 테라바이트(TB) 이상의 방대한 데이터를 분석해 유의미한 정보를 추출하는 것을 말한다. SNS, 모바일, 클라우드컴퓨팅 등과 함께 미래를 이끌어나갈 차세대 유망 정보기술(IT)로 꼽힌다. 2008년 미국 대선 때 버락 오바마 당시 후보는 빅데이터를 활용한 유권자 맞춤형 선거 전략을 세워 당선됐다. 2010년부터 미국을 중심으로 정치, 금융, 사회 등 각 분야로 빅데이터 활용이 확산되는 추세다.


○선거, 사업환경 등에 큰 영향

올해 미국과 한국 대선에서도 빅데이터가 위력을 발휘했다. 지난달 재선에 성공한 오바마 미국 대통령은 선거 2년 전부터 빅데이터팀을 가동했다. 이들은 6만6000번의 모의선거를 통해 데이터를 수집했다. 이 데이터는 정치헌금 모금을 위한 디너파티의 초청 대상 결정부터 TV·온라인 광고 제작에까지 활용됐다. 선거를 7개월 앞두고서야 빅데이터의 중요성을 깨달은 미트 롬니 공화당 후보보다 앞선 전략이었다.

한국도 대선 하루 전인 지난 18일 특정 검색어의 기간별 검색량을 분석해주는 서비스 ‘구글트렌드’에서 박근혜 대통령 당선인과 문재인 민주통합당 대선 후보를 검색한 비율은 각각 52.5%, 47.5%였다. 실제 득표율 51.6%와 48.0%에 근접한 수치다. 정치권에선 빅데이터가 선거 결과에 영향을 줬다는 평가가 나왔다.

기업들도 빅데이터를 적극 활용하고 있다. 미국 자동차 보험회사 프로그레시브인슈어런스는 고객의 자동차에 부착된 기기가 전송하는 데이터를 바탕으로 운전 습관을 파악한다. 100만명에 이르는 고객의 운전 패턴을 일일이 분석해 앞으로의 사고 가능성을 예측한 뒤 보험료를 정한다.

미국 쇼핑정보업체 디사이드닷컴은 빅데이터를 통해 각종 전자제품의 할인시점을 ‘예언’해준다. 가령 크리스마스 세일 기간을 앞두고 어떤 쇼핑몰에서, 언제 가장 낮은 가격에 아이폰5를 팔지 알려준다. 과거 판매 패턴 분석과 개별 전자제품 회사의 가격 결정 흐름, 신제품 출시 간격 등을 빅데이터로 분석한 결과라는 게 회사 측의 설명이다.

미국 재향군인관리국은 재향군인 2000만명의 진료와 치료 기록을 빅데이터로 분석해 각자에게 알맞은 치료 방법을 제공한다. 지금까지 문서 20억장과 엑스레이 사진 1620만장을 축적했다. 약품 처방전도 15억장에 달한다. 이를 통해 병원은 환자의 약품에 대한 부작용과 체질에 따른 거부반응 등을 사전에 알 수 있다. 재향군인관리국은 이들에게 들어가는 의료비 부담을 줄이고 있다.

○발전 여지 무궁무진, ‘빅브러더’ 우려도

아직 걸음마 단계인 빅데이터의 수집·발굴·관리·분석기술이 고도로 발전하면 미래 사회는 어떻게 바뀔까. 우선 주식이나 원자재 트레이더들이 사라질 수 있다. 시장 예측 기술이 발달하면서 인간의 직관을 바탕으로 한 매매는 효율이 떨어지기 때문이다. 톰 미첼 카네기멜론대 기계학습과 교수는 “금융시장에도 분명히 규칙이 있다”며 “충분한 데이터 분석을 통해 시장의 방향을 미리 예측할 수 있다”고 말했다. 원자재시장의 가격 흐름을 예상할 수 있는 소프트웨어는 이미 개발 중이다.

병원 치료 과정의 부작용도 크게 줄어들 공산이 크다. 빅데이터가 다양한 변수들을 분석해 약품이나 치료 기법별로 개인의 신체 반응을 예측할 수 있어서다.

캐럴린 맥그레고어 온타리오대 건강정보학과 교수는 “빅데이터 기술로 입원한 환자의 맥박 등을 계속 추적·조사하면 위험 패턴이 언제 나타나는지 미리 알 수 있다”며 “간호사가 한두 시간에 한 번 맥박을 체크하는 것보다 훨씬 효과적”이라고 말했다.

빅데이터가 개인의 프라이버시 침해로 이어질 것이란 우려도 제기된다. 분석 대상으로 삼는 대상이 인터넷상에 남겨진 개인의 흔적이기 때문이다.

가령 페이스북에 무심코 쓴 건강을 걱정하는 글이 보험회사의 개인보험료 산정에 반영되고, 잦은 휴대폰 번호 변경을 불평하는 친구의 블로그 댓글이 신용대출을 가로막을 수 있다.

구글과 페이스북은 이미 분석의 바탕이 되는 데이터를 빅데이터 업체에 제공하는 것은 물론, 자체 빅데이터 분석을 새로운 수익모델로 삼고 있다. 팩튜얼 등 전문 데이터 수집업체들은 주요 포털과 SNS에 남지 않는 흔적까지 긁어서 데이터 분석을 위해 제공한다. 일단 데이터가 국가나 기업에 넘어가면 이를 어떻게 활용하는지는 법적 테두리 바깥에 있다. 빅데이터가 개인의 일상을 감시하는 ‘빅브러더’가 될 수 있다는 것을 시사한다.
 

분석을 통해 유의미한 결과를 도출하는 과정에도 넘어야 할 산이 많다. 때로는 비싼 수수료를 내고도 아무 의미 없는 분석 자료를 받아드는 경우도 많다. 미국의 빅데이터 업계 관계자는 “한 신발 제조사가 고객의 성향을 파악하기 위해 빅데이터 작업을 의뢰했는데 결론은 ‘고객들이 겨울에는 부츠를, 여름에는 샌들을 찾았다’는 것이었다”고 말했다.

노경목 기자
autonomy@hankyung.com

 

 

http://cheoneui23.tistory.com/10288

 


+ Recent posts