Introduction to Causality

기초
1 Causality의 핵심 질문

경제학자들은 종종 다음과 같은 질문에 답하고자 합니다: "사건 A가 사건 B를 일으키는가?"

몇 가지 예시:

  • • 흡연(Event A)이 폐암 발생 확률(Event B)을 높이는가?
    의학적 인과관계의 대표적 예시
  • • 민주주의(Event A)가 경제성장(Event B)을 일으키는가?
    정치경제학의 핵심 논쟁
중요한 사실: 대부분의 경우, 이러한 질문에 답하기는 매우 어렵습니다. 두 사건이 함께 일어나는 것(correlation)을 관찰하는 것만으로는 충분하지 않습니다!

Correlation이 Causation이 아닌 두 가지 주요 이유

1

Omitted Variable (누락된 변수)

관찰되지 않은 제3의 변수가 두 변수 모두에 영향을 미치는 경우

2

Reverse Causality (역인과관계)

원인과 결과가 반대로 작용하는 경우

Correlation ≠ Causation: 실제 예시들

중급
EXAMPLE 1: Omitted Variable - 라이터와 폐암

한 연구팀이 강한 상관관계를 발견했습니다:

  • 라이터 보유 개수 ↑
  • 미래 폐암 발생 확률 ↑

잘못된 결론: 정부는 라이터 소유를 금지해야 한다!

문제점: 제3의 변수 = 흡연

  • 흡연자 → 라이터를 많이 소유
  • 흡연자 → 폐암 발생 확률 높음
EXAMPLE 2: Reverse Causality - 경찰과 범죄

한 연구가 주요 도시의 데이터를 분석했습니다:

  • 인구 천명당 폭력 범죄 수
  • 인구 천명당 경찰관 수

관찰: 양의 상관관계 (upward sloping curve)

잘못된 해석: 경찰이 범죄를 증가시키므로 경찰을 없애야 한다!

실제 인과관계:

  • 위험한 도시 → 더 많은 경찰 배치
  • 범죄가 경찰을 "일으킨다" (Crime causes police)
Q: 왜 우리는 correlation과 causation을 혼동하기 쉬울까요?
A: 인간의 뇌는 패턴을 찾도록 진화했습니다. 두 사건이 함께 일어나면, 우리는 본능적으로 인과관계를 가정합니다.

이는 진화적으로 유리했습니다 - "사자 소리가 들린 후 동료가 사라졌다"는 관찰은 빠른 대응을 요구했죠. 하지만 현대의 복잡한 데이터 분석에서는 이런 직관이 오히려 함정이 됩니다.

특히 경제학에서는 수많은 변수가 동시에 작용하므로, 단순한 상관관계 관찰만으로는 정책 결정을 내릴 수 없습니다.
Spurious Correlations (가짜 상관관계)

완전히 관련 없는 두 변수도 우연히 높은 상관관계를 보일 수 있습니다.

실제 예시: 영국의 이혼율과 디즈니 영화 개봉 수

  • 2000-2012년 동안 놀라울 정도로 비슷한 패턴
  • 하지만 인과관계는 전혀 없음!

Growth Rates (성장률)

중급
Constant Growth Rate Formula

변수 Y가 일정한 성장률 g로 성장할 때, 시점 $t_0$에서 $t_1$까지의 변화:

$$Y_{t_1} = Y_{t_0} \cdot (1 + g)^{t_1 - t_0}$$

이 공식은 compound interest (복리)의 원리와 동일합니다!

EXAMPLE 1: GDP가 두 배가 되는 시간

문제: 미국 GDP가 연 2%로 성장한다면, GDP가 두 배가 되는데 얼마나 걸릴까?

풀이:

$2 \cdot Y_0 = Y_0 \cdot (1.02)^t$

$2 = (1.02)^t$

양변에 natural log를 취하면:

$\ln(2) = t \cdot \ln(1.02)$

$t = \frac{\ln(2)}{\ln(1.02)} \approx \frac{0.693}{0.0198} \approx 35$ 년

EXAMPLE 2: 중국이 미국을 추월하는 시점

조건:

  • 미국 GDP 성장률: 2%
  • 중국 GDP 성장률: 5%
  • 현재 중국 GDP = 미국 GDP의 12.6%

풀이:

중국이 미국을 추월하는 시점을 t라고 하면:

$0.126 \cdot (1.05)^t = 1 \cdot (1.02)^t$

$0.126 = \left(\frac{1.02}{1.05}\right)^t$

$\ln(0.126) = t \cdot \ln\left(\frac{1.02}{1.05}\right)$

$t = \frac{\ln(0.126)}{\ln(0.971)} \approx \frac{-2.07}{-0.0294} \approx 70.4$ 년

Q: 왜 경제학에서 성장률이 이렇게 중요할까요?
A: 작은 성장률의 차이도 장기적으로는 엄청난 차이를 만들어냅니다.

예를 들어, 연 2%와 3% 성장의 차이는 작아 보이지만:
• 2% 성장: 35년 후 2배
• 3% 성장: 23년 후 2배

이는 한 세대의 삶의 질을 완전히 바꿀 수 있는 차이입니다. 그래서 경제학자들은 성장률의 작은 변화에도 민감하게 반응하는 것입니다.

A Beautiful Approximation

고급
Natural Logarithm Approximation

작은 g 값에 대해 다음의 아름다운 근사를 사용할 수 있습니다:

$$\ln(1 + g) \approx g \quad \text{(when g is small)}$$

이를 이용하면 성장 계산이 매우 간단해집니다!

Rule of 70 (70의 법칙)

이 근사를 이용하면 유명한 "Rule of 70"을 유도할 수 있습니다:

두 배가 되는 시간 $\approx \frac{70}{\text{성장률(\%)}}$

예시:

  • 2% 성장: 70/2 = 35년
  • 5% 성장: 70/5 = 14년
  • 7% 성장: 70/7 = 10년
주의사항: 이 근사를 사용할 때는 반드시 natural logarithm (ln)을 사용해야 합니다! 상용로그(log₁₀)를 사용하면 완전히 잘못된 결과가 나옵니다.
일반화된 성장 공식

GDP가 현재의 x배가 되는 시간:

$$t = \frac{\ln(x)}{\ln(1 + g)} \approx \frac{\ln(x)}{g}$$
목표 ln(x) 2% 성장시 소요 시간 5% 성장시 소요 시간
2배 (x=2) 0.693 35년 14년
3배 (x=3) 1.099 55년 22년
10배 (x=10) 2.303 115년 46년

Slopes and Growth Rates

고급
Slope의 정의

직선의 기울기(slope)는 "Rise over Run"으로 정의됩니다:

$$\text{slope} = \frac{\text{Rise}}{\text{Run}} = \frac{\Delta Y}{\Delta X} = \frac{Y_2 - Y_1}{X_2 - X_1}$$

중요: Δ (Delta) 기호는 "변화량"을 의미합니다!

Log Scale과 성장률의 관계

변수 Y가 연 10% 성장하고, $Y_0 = 100$일 때:

$Y_t = 100 \cdot 1.1^t$

양변에 ln을 취하면:

$\ln(Y_t) = \ln(100) + t \cdot \ln(1.1)$

근사를 사용하면 ($\ln(1.1) \approx 0.1$):

$\ln(Y_t) = \ln(100) + 0.1 \cdot t$

핵심 통찰: Log scale 그래프에서 직선의 기울기는 성장률과 (거의) 같습니다!
Linear Scale vs Log Scale
Q: 왜 경제학자들은 log scale을 자주 사용할까요?
A: Log scale의 마법은 multiplicative 관계를 additive 관계로 변환한다는 점입니다.

일반 scale에서:
• 100에서 110으로 증가 = +10
• 1000에서 1100으로 증가 = +100
둘 다 10% 성장이지만 절대적 증가량이 다릅니다.

Log scale에서는:
• 두 경우 모두 동일한 수직 거리로 표현됩니다!

이는 특히 장기 시계열 데이터를 볼 때 유용합니다. GDP가 1950년에 1조원, 2020년에 100조원이라면, linear scale에서는 초기 변화가 거의 보이지 않지만, log scale에서는 모든 시기의 성장률을 명확히 볼 수 있습니다.
Average Growth Rates (평균 성장률)

여러 기간의 성장률이 다를 때, geometric average (기하평균)를 사용합니다:

예시: 첫해 성장률 $g_1$, 둘째해 성장률 $g_2$일 때

$$\bar{g} = \sqrt{(1 + g_1)(1 + g_2)} - 1$$

일반화: N년간의 평균 성장률

$$\bar{g} = \left[\prod_{i=1}^{N-1}(1 + g_i)\right]^{\frac{1}{N-1}} - 1$$

또는 더 간단하게:

$$\bar{g} = \left(\frac{x_N}{x_1}\right)^{\frac{1}{N-1}} - 1$$

핵심 요약 및 다음 강의 예고

오늘 배운 핵심 개념

1

Causality vs Correlation

• Correlation ≠ Causation

• Omitted variables와 reverse causality 주의

• 경제 분석에서 인과관계 파악의 중요성

2

Growth Rates

• Compound growth formula: $Y_t = Y_0(1+g)^t$

• Rule of 70: 두 배가 되는 시간 ≈ 70/성장률(%)

• 작은 성장률 차이의 장기적 영향

3

Mathematical Tools

• Natural log approximation: ln(1+g) ≈ g

• Log scale에서 기울기 = 성장률

• Geometric average for multiple periods

다음 강의 예고:
• GDP의 정의와 측정
• Real vs Nominal GDP
• GDP Deflator와 CPI
• GDP와 복지(welfare)의 관계