Introduction to Causality
기초경제학자들은 종종 다음과 같은 질문에 답하고자 합니다: "사건 A가 사건 B를 일으키는가?"
몇 가지 예시:
-
• 흡연(Event A)이 폐암 발생 확률(Event B)을 높이는가?
의학적 인과관계의 대표적 예시 -
• 민주주의(Event A)가 경제성장(Event B)을 일으키는가?
정치경제학의 핵심 논쟁
Correlation이 Causation이 아닌 두 가지 주요 이유
Omitted Variable (누락된 변수)
관찰되지 않은 제3의 변수가 두 변수 모두에 영향을 미치는 경우
Reverse Causality (역인과관계)
원인과 결과가 반대로 작용하는 경우
Correlation ≠ Causation: 실제 예시들
중급한 연구팀이 강한 상관관계를 발견했습니다:
- 라이터 보유 개수 ↑
- 미래 폐암 발생 확률 ↑
잘못된 결론: 정부는 라이터 소유를 금지해야 한다!
문제점: 제3의 변수 = 흡연
- 흡연자 → 라이터를 많이 소유
- 흡연자 → 폐암 발생 확률 높음
한 연구가 주요 도시의 데이터를 분석했습니다:
- 인구 천명당 폭력 범죄 수
- 인구 천명당 경찰관 수
관찰: 양의 상관관계 (upward sloping curve)
잘못된 해석: 경찰이 범죄를 증가시키므로 경찰을 없애야 한다!
실제 인과관계:
- 위험한 도시 → 더 많은 경찰 배치
- 범죄가 경찰을 "일으킨다" (Crime causes police)
이는 진화적으로 유리했습니다 - "사자 소리가 들린 후 동료가 사라졌다"는 관찰은 빠른 대응을 요구했죠. 하지만 현대의 복잡한 데이터 분석에서는 이런 직관이 오히려 함정이 됩니다.
특히 경제학에서는 수많은 변수가 동시에 작용하므로, 단순한 상관관계 관찰만으로는 정책 결정을 내릴 수 없습니다.
완전히 관련 없는 두 변수도 우연히 높은 상관관계를 보일 수 있습니다.
실제 예시: 영국의 이혼율과 디즈니 영화 개봉 수
- 2000-2012년 동안 놀라울 정도로 비슷한 패턴
- 하지만 인과관계는 전혀 없음!
Growth Rates (성장률)
중급변수 Y가 일정한 성장률 g로 성장할 때, 시점 $t_0$에서 $t_1$까지의 변화:
이 공식은 compound interest (복리)의 원리와 동일합니다!
문제: 미국 GDP가 연 2%로 성장한다면, GDP가 두 배가 되는데 얼마나 걸릴까?
풀이:
$2 \cdot Y_0 = Y_0 \cdot (1.02)^t$
$2 = (1.02)^t$
양변에 natural log를 취하면:
$\ln(2) = t \cdot \ln(1.02)$
$t = \frac{\ln(2)}{\ln(1.02)} \approx \frac{0.693}{0.0198} \approx 35$ 년
조건:
- 미국 GDP 성장률: 2%
- 중국 GDP 성장률: 5%
- 현재 중국 GDP = 미국 GDP의 12.6%
풀이:
중국이 미국을 추월하는 시점을 t라고 하면:
$0.126 \cdot (1.05)^t = 1 \cdot (1.02)^t$
$0.126 = \left(\frac{1.02}{1.05}\right)^t$
$\ln(0.126) = t \cdot \ln\left(\frac{1.02}{1.05}\right)$
$t = \frac{\ln(0.126)}{\ln(0.971)} \approx \frac{-2.07}{-0.0294} \approx 70.4$ 년
예를 들어, 연 2%와 3% 성장의 차이는 작아 보이지만:
• 2% 성장: 35년 후 2배
• 3% 성장: 23년 후 2배
이는 한 세대의 삶의 질을 완전히 바꿀 수 있는 차이입니다. 그래서 경제학자들은 성장률의 작은 변화에도 민감하게 반응하는 것입니다.
A Beautiful Approximation
고급작은 g 값에 대해 다음의 아름다운 근사를 사용할 수 있습니다:
이를 이용하면 성장 계산이 매우 간단해집니다!
이 근사를 이용하면 유명한 "Rule of 70"을 유도할 수 있습니다:
두 배가 되는 시간 $\approx \frac{70}{\text{성장률(\%)}}$
예시:
- 2% 성장: 70/2 = 35년
- 5% 성장: 70/5 = 14년
- 7% 성장: 70/7 = 10년
GDP가 현재의 x배가 되는 시간:
| 목표 | ln(x) | 2% 성장시 소요 시간 | 5% 성장시 소요 시간 |
|---|---|---|---|
| 2배 (x=2) | 0.693 | 35년 | 14년 |
| 3배 (x=3) | 1.099 | 55년 | 22년 |
| 10배 (x=10) | 2.303 | 115년 | 46년 |
Slopes and Growth Rates
고급직선의 기울기(slope)는 "Rise over Run"으로 정의됩니다:
중요: Δ (Delta) 기호는 "변화량"을 의미합니다!
변수 Y가 연 10% 성장하고, $Y_0 = 100$일 때:
$Y_t = 100 \cdot 1.1^t$
양변에 ln을 취하면:
$\ln(Y_t) = \ln(100) + t \cdot \ln(1.1)$
근사를 사용하면 ($\ln(1.1) \approx 0.1$):
$\ln(Y_t) = \ln(100) + 0.1 \cdot t$
일반 scale에서:
• 100에서 110으로 증가 = +10
• 1000에서 1100으로 증가 = +100
둘 다 10% 성장이지만 절대적 증가량이 다릅니다.
Log scale에서는:
• 두 경우 모두 동일한 수직 거리로 표현됩니다!
이는 특히 장기 시계열 데이터를 볼 때 유용합니다. GDP가 1950년에 1조원, 2020년에 100조원이라면, linear scale에서는 초기 변화가 거의 보이지 않지만, log scale에서는 모든 시기의 성장률을 명확히 볼 수 있습니다.
여러 기간의 성장률이 다를 때, geometric average (기하평균)를 사용합니다:
예시: 첫해 성장률 $g_1$, 둘째해 성장률 $g_2$일 때
일반화: N년간의 평균 성장률
또는 더 간단하게:
핵심 요약 및 다음 강의 예고
오늘 배운 핵심 개념
Causality vs Correlation
• Correlation ≠ Causation
• Omitted variables와 reverse causality 주의
• 경제 분석에서 인과관계 파악의 중요성
Growth Rates
• Compound growth formula: $Y_t = Y_0(1+g)^t$
• Rule of 70: 두 배가 되는 시간 ≈ 70/성장률(%)
• 작은 성장률 차이의 장기적 영향
Mathematical Tools
• Natural log approximation: ln(1+g) ≈ g
• Log scale에서 기울기 = 성장률
• Geometric average for multiple periods
• GDP의 정의와 측정
• Real vs Nominal GDP
• GDP Deflator와 CPI
• GDP와 복지(welfare)의 관계