본문 바로가기
Statistics/DesignOExperiments

DOE - 3/4/5 . Single/Multiple Factor design

by bents 2020. 11. 22.

Contents

1. One shot summary for DOE

2. Analytical Thinking with Stats.

3. Single factor design 
- ANOVA / T-TEST

- Multiple Comparison

Correlation/Regression design

4. Two-factor design

5. Multiple-factor design

6. Factorial design


인자요인에 따른 모형종류

- 실험하는 요인수준에 따라 모수모형/변량모형으로 나뉜다.

- 반복수가 일정하지 않을 때 변량모형을 사용함.
* 실험수(요인수준의 조합 개수) 아니라 반복수 !

 

[전제]

데이터가 정확해야 한다. 통제조건에 맞게 실험데이터수가 균형잡혀야 함.

--> 실험계획이 정확해야, 랜덤화/반복화/블록화 필수임.

Q.그러나 현실은 그렇지 못하다. 조합별 데이터의 차이가 심할 때는 어떻게 해야 하는가?

 

Single factor design 일원배치법

1. 정의 : 한 요인의 "수준별 반응값 차이"를 검증하는 실험법.

2. 모형 : Y = Mi + ei = M + Ai + ei ( ei ~ N(0,sigma) , Ai = Mi - M ; i수준의 주요인 효과 )

3. 분산분석 ANOVA/T-TEST

  • 가정
    • 요인수준별 모집단이 하나의 동일한 평균/분산을 가진다는 귀무가설.
    • 요인수준간 독립성
    • 요인수준내 정규성 
    • 기타 등등
  • 의사결정기준
    • 요인그룹의 표본평균간의 차이가 크면, 요인그룹간 차이가 있음.
      --> 요인 그룹간 변동이 요인그룹 내 변동보다 커야 함 (F = MSB / MSE > 1 ) 
      --> 통계량(F 또는 t ) 이 기각역에 포함되면 차이가 크다.
    • 사후에 수준별 평균차이를 알고싶다면, 사전에 사용한 요인수준을 사용하기

4. 사후분석 Multiple Comparison

  • 정의 : 여러 집단 간 대소비교를 통해 차이의 방향을 알고자 사용하는 방법. 
  • 언제 : 요인의 수준이 여러 개 일 때 

- 요인수준이 n개이면 귀무가설이 고려해야 할 짝pair이 n(n-1)/2이므로 매우 많아짐.

수 많은 비교검정 중 하나라도 차이가 발생하면 귀무가설 기각하므로 유의수준을 조절할 필요 있음.

  • 대안1 
    - 비교별 오류율 : 관심잇는 요인수준끼리만 비교함 ( 하나의 결론이 다른 결론에 영향을 미치지 않는 경우 )
    - 실험별 오류율 : 발생가능한 모든 요인수준을 비교함 ( 하나라도 잘못 비교하면 안될 경우 ) 
  • 대안2
    - Turkey의 HSD : 강력한 유의수준 
    - Duncan의 MRT : 유연한 유의수준 ( 수준값 크기에 따라 유의수준 달라서 신뢰수준 구하기 힘듦 )

 

Multiple factor design 이원/다원 배치법

1. 정의 : 두 개 이상의 요인의 수준별 차이(주효과), 요인간 상호작용효과를 검정하기 위해 실험법

 

2. 모형 :  Y = M + Ai + Bj + ABij + eijk ( k : 반복수, eijk ~ N(0,sigma)

  • 반복수k=1이면 상호작용효과는 오류항에 포함됨.
    k > 1 이면 이원배치법 사용가능 ( 없어도 사용가능한 예외 : 라틴방격실험법 )
  • 오류항 eijk 은 제1요인(i) 과 제2요인(j)에 의한 실험오차와 반복실험에 의한 관찰오차만 담고 있다. 
    그러므로 처리오차(주요인, 상호작용요인)와 섞이면 안됨. 예를 들어, 요인수준 하나가 빠져서 이를 오차항에 넣어버리면, 실제 유의미한 요인의 효과는 낮게 나오는 현상 발생할 수 있음
    3. 분산분석
  • 요인B의 주효과
    • 계산법 1 : 요인 A에 따른 B1의 평균반응치 - 요인 A에 따른 B2의 평균반응치
    • 계산법 2 : Ai에서의 B의 반응차이의 평균 ( i는 요인수준 )
      --> A의 주효과 : (50+40)/2 = 45
      --> B의 주효과 : (100 + 90) /2 = 95
 B1B2 
 A1100200150
A2150240195
 125220172.5
  • 요인A,B의 상호작용효과
    • 계산법1 : 주효과별 차이 / 요인 수준수 
      --> { (150-100)-(240-200) } /2 = 5 
    • 계산법2 : (반응치 - 각 조합별 기대반응치)^2의 합.
    • 상호작용효과의 반응
      - 시너지효과
      - 반감효과
      - 기타 ( 수준이 여러 개 일 수 있으니)
 B1B2
A1100
- {172.5
+(150 - 172.5)
+(125 - 172.5)}
200
- {172.5
+(150 - 172.5)
+(220 - 172.5)}
A2150
- {172.5
+(195 - 172.5)
+(125 - 172.5)}
240
- {172.5
+(195 - 172.5)
+(220 - 172.5)}

 

4. 사후분석 Multiple Comparison

 

랜덤블록화 설계

1. 정의 : 잠재변수/이질적인 실험상황이 존재할 때, 해당 요소를 기준으로 샘플링을 다르게 함.

2. 모형 : 이원배치법과 동일한 모형 -  단, 교호작용없음, 귀무가설은 일원배치법과 같음.