- 많은 네트워크 내부 항공망 닮아
- ‘허브’ 연구 땐 다양한 정보 얻어
- 데이터 조작 대비 내용검토 필수
- 딥러닝, 의학 분야 등에서 일조
- AI, 인간의 경쟁자 아닌 보완재
4차산업혁명 시대의 ‘쌀’은 데이터. 데이터가 개별적으로 흩어져 존재하면 어떤 의미도 얻을 수 없다. 각각의 데이터를 인과관계에 맞게 연결해 숨은 의미를 찾아내는 복잡계 네트워크 과학이 각광받는 이유다.
|  |
| ‘뭐라노’ 콘서트에 초대된 정하웅 카이스트 석좌교수가 네트워크 과학에 대해 강연하고 있다. 전민철 기자 |
정하웅 카이스트 석좌교수는 22일 국제신문이 주최한 뉴스레터 ‘뭐라노’ 독자 초청 콘서트에서 ‘구글신은 모든 것을 알고 있다 : 복잡계 네트워크와 데이터 과학’을 주제로 강연했다. 그는 “뉴런이 서로 연결돼 뇌를 이루는 것처럼 개별 데이터를 네트워크화 하면 의미 있는 가치를 발견을 할 수 있다”면서 네트워크의 종류를 크게 2가지로 분류했다. 첫째는 어느 도시든 비슷한 규모로 깔리는 고속도로망과 닮은 네트워크. 둘째는 유동인구가 많거나 입지여건이 뛰어난 도시(허브)를 집중적으로 취항하는 항공망과 닮은 네트워크.
정 교수는 “많은 네트워크의 내부를 들여다봤더니 대부분 항공망 형태를 띄었다. 연결이 집중된 ‘허브’를 연구하면 다양한 정보를 얻을 수 있다”고 말했다. “한 연구자가 2001년 스웨덴 성인 3000명을 대상으로 설문조사 해 ‘성관계 네트워크’를 만들었습니다. 에이즈 차단을 위해서였습니다. 가장 성관계를 많이 한 ‘허브’를 먼저 치료하면 에이즈 확산을 쉽게 막을 수 있다는 결론이 도출됐습니다. 우리나라도 코로나19 차단을 위해 허브(최초 감염자)와 접촉한 사람을 역추적해 K-방역에 성공했습니다.”
세계에서 데이터가 가장 많이 모이는 플랫폼은 구글. 검색량을 보여주는 구글 트렌드만 이용해도 알 수 있는 것이 많다. 정 교수는 “2012년 미국 대통령선거를 앞두고 버락 오바마(민주당)와 밋 롬니(공화당) 후보를 다룬 구글 웹페이지를 검색했더니 각각 1350만 건(51%)과 1290만 건(48%)이 나왔다. 이는 두 후보의 최종 득표수와 정확하게 맞아떨어졌다”고 소개했다.
비슷한 원리로 구글은 2003~2008년 미국 질병관리청 대신 독감 발병지를 예측하기도 했다. 독감 증세를 보이는 사람들이 독감 정보를 검색할 가능성이 높다는 점을 이용한 것이다. 정 교수는 “사람들이 검색할 때는 거짓말을 하지 않기 때문에 검색 데이터는 어떤 설문조사보다 정확하다”면서도 “요즘은 광고나 댓글 조작으로 데이터가 오염되는 경우도 많기 때문에 데이터의 내용을 잘 검토해야 한다”고 덧붙였다.
정 교수는 데이터나 인공지능이 인간의 대체재가 아니라 보완재라고 했다. “딥러닝을 한 인공지능이 암 조직 판별 검사를 했더니 92%의 정확성을 자랑했습니다. 인간 의사의 판단과 딥러닝 결과를 합친 결과 정확도가 99.5%로 상승했습니다. 과학은 인간의 대체재나 경쟁자가 아니라 보완재라고 보는 게 맞습니다.” 정 교수는 카이스트 우수강의상·우수강의 대상을 받은 명강사. 공동저서 ‘구글 신은 모든 것을 알고 있다’를 통해 네트워크 과학 대중화에 앞장서고 있다.
김민정 기자 min55@kookje.co.kr