평균들의 비율과 비율들의 평균에 대하여

배경

예를 들어 두 종류의 양의 수열의 평균적인 비율을 알고 싶을 때, 종종 전체적인 평균의 비율 대신 비율들의 평균을 사용하려는 유혹이 생기기 쉽다. 각 쌍들의 비율도 관심의 대상이니 기왕 이것들을 구했다면 계산된 비율들의 평균을 사용하는 것이 더 간단하기 때문이다. 하지만 후자의 경우 각각의 비율 계산 시 데이터의 규모가 고려되지 못하는 문제가 있다.

위에서 기술한 내용을 식으로 표현하면, 두 개의 수열 \(l_1, l_2, \ldots , l_n\) 와 \(m_1, m_2, \ldots , m_n\) 가 주어졌을 때 둘 사이의 평균적인 비율은, 예외가 있을 수 있지만, 대부분의 경우 $$ (m_1+ m_2+ \ldots + m_n)/n \over (l_1+ l_2+ \ldots + l_n)/n $$와 같은 형태가 바람직하다. $$ \big({m_1 \over l_1} + {m_2 \over l_2} + \ldots + {m_n \over l_n}\big) \over n $$에서는 \(m_k\)와 \(l_k\)가 상대적으로 작으면서 \(m_k \over l_k\)이 평균에 큰 영향을 주는 상황이 있을 수 있고 이 결과는 두 수열의 전체적인 평균이라는 목적에 적당치 않다.

숫자를 대입해 본다면 \(m_1 = 999, m_2 = 5 \)이고 \(l_1 = 1000, l_2 = 1 \)인 경우 전체 평균들의 비율인 \( (999 + 5)/2 \over (1000 + 1)/2 \)는 약 \(1.003 \)정도이다. 그에 반해 비율들의 평균은 \( ({999 \over 1000} + {5 \over 1})/2 \)인 약  \(3 \) 정도가 된다. 두 번째 수들(5와 1)의 비율이 1000 정도인 첫 번째 수들의 비율에 비해 적지 않은 영향을 주기 때문이다.

질문

일반적으로 평균들의 비율과 비율들의 평균이 같지 않다는 것은 위의 예시로 알 수 있다. 그러면 둘 사이의 부등식을 도출할 수 있는 조건은 어떤 것인가? 즉, 어떤 조건을 만족할 때 둘 사이의 부등식을 결정할 수 있는가?

체비쇼프 합 부등식 (Chebyshev’s sum inequality)

위의 질문에 답하기 위해 체비쇼프 합 부등식을 사용할 것이다. 부등식에 대한 정의는 다음 페이지에서 찾을 수 있다; https://en.wikipedia.org/wiki/Chebyshev%27s_sum_inequality

결론만 요약하면, 두 수열이 둘 다 단조 증가하거나 둘 다 단조 감소하면,
$${1 \over n} \sum_{k=1}^n a_k b_k \ge \bigg({1 \over n} \sum_{k=1}^n a_k \bigg) \bigg({1 \over n} \sum_{k=1}^n b_k \bigg) $$
이고, 두 수열 중 하나가 단조 증가하고 다른 하나가 단조 감소하면,
$${1 \over n} \sum_{k=1}^n a_k b_k \le \bigg({1 \over n} \sum_{k=1}^n a_k \bigg) \bigg({1 \over n} \sum_{k=1}^n b_k \bigg) $$
이다.

이 사실을 사용하면,
\(m_1, m_2, \ldots , m_n\)과 \({m_1 \over l_1}, {m_2 \over l_2}, \ldots, {m_n \over l_n} \)이 둘 다 단조 증가하거나 단조 감소하면
$$\frac{m_1+m_2+\ldots+m_n}{n} \ge \bigg(\frac{{m_1 \over l_1} + {m_2 \over l_2} +\ldots + {m_n \over l_n}}{n} \bigg) \bigg(\frac{l_1+l_2+\ldots+l_n}{n} \bigg)$$ 이고, \(m_1, m_2, \ldots , m_n\)과 \({m_1 \over l_1}, {m_2 \over l_2}, \ldots, {m_n \over l_n} \)중 하나가 단조 증가하고 다른 하나가 단조 감소하면
$$\frac{m_1+m_2+\ldots+m_n}{n} \le \bigg(\frac{{m_1 \over l_1} + {m_2 \over l_2} +\ldots + {m_n \over l_n}}{n} \bigg) \bigg(\frac{l_1+l_2+\ldots+l_n}{n} \bigg)$$ 임을 알 수 있다.

따라서 모든 항들이 양수라고 가정하면 각각의 경우 부등식은
$$\frac{\cfrac{m_1+m_2+\ldots+m_n}{n}}{\cfrac{l_1+l_2+\ldots+l_n}{n}} \ge \frac{{m_1 \over l_1} + {m_2 \over l_2} +\ldots + {m_n \over l_n}}{n} $$ 와
$$\frac{\cfrac{m_1+m_2+\ldots+m_n}{n}}{\cfrac{l_1+l_2+\ldots+l_n}{n}} \le \frac{{m_1 \over l_1} + {m_2 \over l_2} +\ldots + {m_n \over l_n}}{n} $$ 로 쓸 수 있어 평균들의 비율과 비율들의 평균 사이의 부등식을 얻게된다.

하지만 수열들이 보통 위와 같은 형태의 단조 증가나 단조 감소 조건을 만족하지는 않으므로 이 부등식을 적용할 수 있는 경우는 많지 않다.

Leave a comment