데이터 시각화의 핵심: 지도와 히트맵 색상 스케일 올바르게 고르는 기준
서론 데이터를 지도나 히트맵으로 시각화할 때 가장 먼저 마주하는 고민은 어떤 색상을 사용할지 결정하는 일입니다. 단순히 보기 좋은 색을 고르는 과정으로 치부하기 쉽지만, 색상 스케일은 데이터의 의미를 전달하는 핵심 언어입니다. 잘못된 색상 배열은 독자에게 완전히 왜곡된 정보를 심어줄 수 있으며, 반대로 적절한 색상 스케일은 복잡한 수치를 직관적인 통찰로 바꿔줍니다. 데이터의 성격에 따른 색상 스케일의 세 가지 분류 색상 스케일을 고르기 전 가장 먼저 확인해야 할 것은 표현하려는 데이터의 근본적인 성격입니다. 데이터 시각화 분야에서는 일반적으로 색상 스케일을 순차형(Sequential), 발산형(Diverging), 범주형(Categorical) 세 가지로 뚜렷하게 구분합니다. 순차형은 낮은 값에서 높은 값으로 한 방향으로 커지는 데이터에 적합하며, 보통 밝은 색에서 어두운 색으로 명도가 점진적으로 변합니다. 발산형은 0이나 평균 같은 명확한 기준점이 존재하고, 그 기준점으로부터 양극단으로 퍼지는 데이터를 표현할 때 사용합니다. 범주형은 수치의 크고 작음이 아니라 지역, 소속, 카테고리 등 종류가 다름을 보여줄 때 명도가 아닌 서로 다른 색상을 나열하는 방식입니다. 데이터가 이 셋 중 어디에 속하는지 파악하는 것이 색상 선택의 출발점입니다. 의미 있는 중간값의 유무로 결정하는 순차형과 발산형 연속적인 수치를 보여주는 지도나 히트맵에서는 대부분 순차형과 발산형 중 하나를 선택하게 됩니다. 이때 가장 중요한 판단 기준은 '데이터에 의미 있는 중간값 또는 기준점이 존재하는가'입니다. 이를 무시하면 독자는 데이터의 흐름을 반대로 오해할 수 있습니다. 예를 들어 인구 밀도, 강수량, 총매출액처럼 0에서 시작해 지속적으로 커지는 데이터는 기준점이 없으므로 단일 색상의 명도를 조절하는 순차형 스케일을 적용해야 합니다. 밝은 색은 값이 낮음을, 어두운 색은 값이 높음을 자연스럽게 암시하기 때문입니다. 반면, 경제 성장률(플러스와 마이너스), 기...