Skip to content

가독성을 높이는 데이터 시각화 1: 네트워크와 베이글

데이터를 2차원 형태로 배열해서 시각화할 때, 가독성과 전달력을 높이는 간단한 방법은 데이터의 위치를 변경해 보는 것입니다. 데이터 본래의 속성을 훼손하지 않는 선에서 데이터 배열이나 기하학적 형태 변화를 줄 때, 데이터가 담은 내용을 좀 더 쉽고 명확하게 전달할 수 있습니다. 백만표 씨의 사례를 시작으로 이 방법에 대해 총 3회에 걸쳐 연재합니다.

내년 국회의원 선거 출마를 마음에 두고 있는 백만표 씨는 자신의 트위터 팔로어와 페이스북 친구들의 연결 관계가 궁금해졌습니다. 그는 트위터와 페이스북에서 공통으로 자신과 연결 맺고 있는 핵심 인물 24명을 선택해 이들이 트위터와 페이스북에서 각각 서로 어떤 연결을 맺고 있는지 조사했습니다.

백만표 씨는 다음과 같이 24명을 3행 8열(3×8) 형태로 배치했습니다.

(3X8) matrix

그런 뒤, 트위터에서 이들의 연결 관계를 표시하니 다음과 같았습니다.

(3X8) matrix - twitter

무언가 패턴이 보이는 것을 확인한 백만표 씨는 내심 흡족해하며 이들의 페이스북 연결 관계를 표시해 봤습니다.

(3X8) matrix - facebook - 1

트위터 경우와 달리, 복잡하게 얽혀 있는 선들을 보자 백만표 씨는 마치 상대 후보에게 표가 백만표나 뒤진 것처럼 머리가 아파졌습니다. 머리를 싸매고 있던 그는, 각 사람의 순서 자체는 중요하지 않다는 것을 깨닫곤, 숫자들의 배치를 바꿔 다음과 같이 표현해 봤습니다.

(3X8) matrix - facebook - 2

이렇게 해 놓으니 다시 백만 표의 표차를 만회한 것 같은 기쁨이 몰려오며, 페이스북 친구들의 연결 관계를 이전보다 좀 더 깔끔하게 볼 수 있었습니다.

(3X8) matrix - twitter and facebook

만들어 놓은 트위터와 페이스북의 연결 관계를 나란히 놓고 보며 백만표 씨는 좀 더 욕심이 생기기 시작했습니다. 같은 사람들로 구성된 두 그룹을 하나의 그림으로 표현해 보고 싶은 욕심이었습니다. 이것만 잘하면 상대후보와 표차를 이백만 표나 앞지를 수 있을 것 같다는 기분이 들어 백만표 씨는 또 골몰히 생각에 잠겼습니다.

뭔가 번뜩이는 아이디어가 떠오른 듯, 백만표 씨는 재빨리 종이를 새로 꺼내 뭔가를 그리기 시작했습니다. 그리고 다음과 같은 그림을 완성했습니다.

twitter and facebook graph

3×8 형태로 배열했던 숫자를 일렬로 늘어놓아 직선의 형태로 바꿨고, 이 위에 트위터와 페이스북에서의 상호 연결 관계를 한 번에 표시했습니다. 그 결과 앞서 3×8 배열로 표시했던 경우보다 한결 더 편리하게 두 개의 데이터를 동시에 볼 수 있는 그림이 완성되었습니다.

이것을 보며 연신 싱글벙글하던 백만표 씨는, 자신의 내부에서 또 하나의 욕망이 꿈틀거리는 것을 느꼈습니다. 이렇게 해 놓으니 트위터와 페이스북에서 24명의 사람이 관계 맺고 있는 패턴이 뭔가 보이는 듯한데, 그 패턴이 보일 듯 말 듯하단 것을 깨달은 것입니다. 그는 이 패턴을 좀 더 명확하게 볼 방법이 없을까 욕심을 내기 시작했습니다. 백만표 씨는 국회의원 선거가 아닌, 대선에 도전하는 심정으로 더 깊이 생각에 잠겼습니다.

기분 전환을 위해 오후 간식으로 베이글을 먹으려던 찰나, 백만표 씨의 머리에 번개같이 스치는 아이디어가 떠올랐습니다. ‘직선 형태로 배열한 24명의 사람을, 원형으로 배열하면 어떨까?’라는 생각이었습니다. 이것은 마치 케쿨레(Kekulé)가 꿈속에서 꼬리를 물고 있는 뱀의 모습을 보고, 벤젠의 분자구조를 생각한 것과 비견할 만한 순간이었습니다.
 

akaiving's bagel picture
 

베이글을 손에 들고 있던 그는, 잠시 베이글에 감사하는 마음을 가진 뒤, 얼른 새 종이를 꺼내 자신의 아이디어를 그리기 시작했습니다. 그리고 드디어 대선 도전의 심정으로 풀기 시작한 문제를 다음과 같이 멋지게 해결했습니다.

twitter and facebook network diagram - 1

백만표 씨는 베이글과 이 그림을 번갈아 보며, 오후 간식을 먹는 자신의 습관이 내심 자랑스러웠습니다. 오후 간식 시간이 없었다면 베이글을 먹지 않았을 것이고, 베이글을 먹지 않았다면, 이 멋진 그림을 그릴 수 없었을지도 모르기 때문입니다. 여기까지 해낸 백만표 씨는 좀 더 탄력을 받아 다음과 같이 그림을 정돈해서 좀 더 명확하게 연결 구조가 드러나게 했습니다.

이렇게 해 놓자, 백만표 씨는 소셜 네트워크상에서 자신과 관계된 24명의 사람이 트위터와 페이스북에서 서로 어떤 연결 구조를 이루고 있는지 시각적으로 명쾌하게 알 수 있었습니다. 그뿐만 아니라, 이들이 이루고 있는 네트워크 구성이 6개 그룹으로 나뉠 수 있다는 것(A~F)도 알 수 있었고, 이 그룹을 두 가지 형태―{A, C, D, F}와 {B, E}―로 분류할 수 있다는 것까지 알아냈습니다. 처음 3×8 배열 에서 보지 못했던 연결 구조 속성을 이렇게 데이터의 위치를 바꿔 기하학적 형태를 달리하니, 선명히 보였던 것입니다.

아르키메데스가 목욕탕에서 뛰쳐나오며 ‘유레카!’를 외쳤던 것처럼, 백만표 씨는 ‘베이글!’을 외치며 사무실에서 뛰어나와 자신의 보좌관에게 달려갔습니다. 그리고 이 그림을 보여주며 당장 자신의 트위터 팔로워와 페이스북 친구 전부를 대상으로 분석하자고 호들갑을 떨며 말했습니다. ▩

 

 


* 관련 전공을 하신 분은 금방 알아차리셨겠지만, 백만표 씨가 한 작업은 그래프 이론을 적용한 것입니다. 연재할 글에서 백만표 씨의 사례를 분석하며, 그래프 이론이 데이터 시각화 작업에 조형적 요소로 어떻게 응용될 수 있는지 살펴보겠습니다.

* 본분의 다이어그램은 다음 책에서 아이디어를 얻어 그렸습니다.

Carlos Setubal and João Meidanis, Introduction to Computational Molecularbiology, PWS Publishing Company, 1997.

Post a Comment

Your email is never published nor shared. Required fields are marked *
*
*