평균 삼남매

모두가 조금씩 다른 수의 양말을 가진 집들이 한 줄로 늘어서 있다고 상상해 보세요. 어떤 사람은 세 켤레, 어떤 사람은 아홉 켤레, 아주 별난 한 사람은 마흔 켤레를 가지고 있어요. 이제 누군가가 묻습니다. "그래서... 이 동네의 보통 사람은 양말을 몇 켤레나 가지고 있을까?" 여러분이 찾고 있는 그 깔끔한 숫자 하나에는 이름이 있어요. 바로 평균입니다. 평균은 많은 숫자들을 꾹 눌러서, 그 무리를 대표하는 숫자 하나로 만드는 방법이에요.

하지만 여기 모두를 헷갈리게 하는 반전이 있어요. 평균에는 한 가지만 있는 게 아니랍니다. 그 "보통" 숫자를 찾는 방법은 세 가지가 있고, 같은 질문에 아주 다르게 대답하는 세 남매 같아요. 그 이름은 산술평균, 중앙값, 최빈값입니다. 하나씩 만나 볼까요?

먼저 산술평균입니다. 사람들이 "평균"이라는 말을 들으면 가장 많이 떠올리는 것이 바로 이것이에요. 산술평균을 구하려면, 모든 것을 큰 더미 하나로 모은 다음 똑같이 나누어 주면 됩니다. 아이 다섯 명이 쿠키를 2개, 4개, 4개, 6개, 9개씩 가져왔다고 해 봐요. 모두 더하면 쿠키는 25개예요. 이제 25개를 아이 5명에게 똑같이 나누어 줍니다. 모두 5개씩 받지요. 산술평균은 5입니다.

산술평균은 공평하고 다정하지만, 약점이 하나 있어요. 아주 큰 값이나 아주 작은 값의 말을 잘 듣는다는 거예요. 평범한 사람들이 모인 방에 억만장자 한 명이 들어온다고 생각해 보세요. 갑자기 그 방의 "평균 재산"은 하늘 높이 치솟아요. 실제로는 그곳에 있는 거의 아무도 부자가 아닌데도 말이에요. 산술평균은 거대한 이상값 하나에게 속아 넘어간 거예요.

차분한 가운데 아이, 중앙값을 만나 보세요. 중앙값은 아무것도 더하지 않아요. 숫자들을 가장 작은 것부터 가장 큰 것까지 줄 세운 다음, 정가운데 서 있는 숫자를 가리킬 뿐이지요. 2, 4, 4, 6, 9에서는 가운데 숫자가 4입니다. 중앙값은 4예요. 그리고 중앙값의 놀라운 힘은 이거예요. 아까 그 억만장자요? 중앙값은 거의 꿈쩍도 하지 않아요. 줄의 한가운데에 누가 있는지만 신경 쓰지, 거인이 얼마나 큰지는 신경 쓰지 않거든요.

그런데 줄에 선 숫자의 개수가 짝수라서 딱 하나의 가운데가 없다면 어떻게 할까요? 예를 들어 3, 5, 8, 10이라고 해 봐요. 가운데 자리를 두 숫자, 5와 8이 함께 차지합니다. 괜찮아요. 그 두 숫자의 산술평균을 구하면 됩니다. 5와 8의 딱 중간은 6.5예요. 그래서 중앙값은 6.5입니다. 가운데 아이는 언제나 정확히 한가운데 설 방법을 찾아낸답니다.

마지막은 가장 인기 많은 형제, 최빈값입니다. 최빈값은 가운데도, 나누어 갖는 것도 신경 쓰지 않아요. 딱 한 가지만 묻습니다. "어떤 숫자가 가장 많이 나왔지?" 2, 4, 4, 6, 9에서는 숫자 4가 두 번 나오고, 나머지는 모두 한 번씩 나와요. 그래서 4가 이깁니다. 최빈값은 4예요. 최빈값은 가게에서 가장 흔한 신발 치수나 모두가 가장 좋아하는 아이스크림 맛처럼, 진짜로 평균을 내기 어려운 것들을 알아볼 때 아주 훌륭합니다.

그럼 어떤 형제가 맞을까요? 모두 맞아요. 다만 서로 다른 질문에 대답할 뿐이지요. 산술평균은 "모두 똑같이 나누면 각자 얼마씩 가질까?"라고 묻습니다. 중앙값은 "딱 한가운데에는 무엇이 있을까?"라고 묻고요. 최빈값은 "가장 자주 일어나는 것은 무엇일까?"라고 묻습니다. 잘못된 것을 고르면 숫자가 조용히 여러분을 헷갈리게 만들 수 있어요. 그래서 이 세 형제를 모두 아는 사람은 훨씬 속이기 어렵답니다.

제각각 다른 양말이 있는 우리 거리로 돌아오면, 드디어 그 질문에는 답이 생겼어요. 그것도 세 가지나 있지요. 산술평균은 모든 양말을 똑같이 나눕니다. 중앙값은 이웃들을 줄 세우고 가운데 사람을 가리킵니다. 최빈값은 가장 많은 사람들이 우연히 가지고 있는 양말 수를 큰 소리로 말합니다. 같은 거리, 같은 양말, 세 가지 솔직한 "평균"이에요. 이제 여러분은 어느 평균이 진실을 말해 주는지 정확히 알 수 있습니다.
