(<-) |
. |
(->) |
Part I. Design of Experiments
Preface
- 이 책에서는 수식을 나열하기 보단, 수식들의 image나 idea를 설명하려할 것이다.
- Statistics? The art of making numerical conjectures about questions
- Outline
- Designing experiment:
- Part1: Controlled experiment, Observational study
- Descriptive statistics
- Part2: Histogram, Average, Standard deviation, Normal curve
- Part3: Correlation, Regression
- Theoretical statistics
- Part4: Theory of probability
- Part5: Chance model
- Inference
- Part6: Estimation
- Part7: Measurment of error
- Part8: Test of significance
- Designing experiment:
Ch1. Controlled experiment
- Comparison
Basic statistical method. 어떤 treatment의 효과를 알기 위해 subject를 treatment group과 control group으로 나누어 두 group의 response를 비교한다.
- 그냥 좋다라고 말하는 것보다 비교를 통해 무엇보다 좋다라고 말하는 것이 더 과학적이다.
- Controlled experiment
- Comparison을 하기 위한 실험.
- Subject를 treatment group 또는 control group으로 assigning 하는 것을 조사자가 control한다는 의미에서 contolled experiment라고 한다.
- Good design of controlled experiment
- 두 group 즉, treatment group과 control group사이의 data 차이가 treatment의 적용유무에 의한 것이라고 말하기 위해서는 두 group이 treatment의 적용유무를 제외하고 완전히 동일한 group임이 보장되어야 한다. 따라서 controlled experiment의 좋은 design이란 두 group이 최대한 비슷하게 되도록 설정한 것이라고 할 수 있다.
두 group 사이에 차이가 나는 factor가 존재하고, 그 factor가 두 group의 response에 영향을 줄 때, 이 factor의 effect가 treatment의 effect에 confounding되었다고 한다. Controlled experiment에서 confounding은 bias의 major source가 된다.
- Methods for good design of controlled experiment
- Randomized controlled
- Double blinded
Ch2. Observational study
- It is the subjects who assign themselves to the different groups - the investigators just watch what happens.
- Observational Study가 필요한 예 - 담배의 영향을 연구할 때, 암을 연구할 때
- 특히 질병의 원인을 사람에 대해서 연구할 때 Controlled Experiment를 할 수 없기때문에 Observational Study가 중요하다.
Association & Causation
Causation: 무엇인가에 직접적인 원인이 되는 것. 예) A를 하면 B가 발생한다. 여기서 A는 B의 Causation이다.
Association: 정황을 봤을때 어떤 현상의 Causation이 되는것. 명확한(결정적) 증거가 없다. 예) 담배를 피는 사람은 암 발생 확률이 높다
- Confounding Factor
- Association을 일으키는 숨겨져 있는 Factor.
- Confounding: Control과 Treatment Group 간에 treatment외 연구 결과에 영향을 미치는 차이.
- Observational Study의 약점은 confounding factor를 모른다는 것이다. 그러므로 실험을 디자인 할 때 confounding factor를 control하는 것이 아주 중요하다.