광고홍보조사방법론 variability(표준편차) 9/20

2023. 9. 21. 14:05학교 수업/광고홍보조사방법론

range의 개념

가장높은 값 - 가장 낮은 값 +1

range comparison

ex)

range1:1,8,9,9,10,10 -> 하나의 아웃라이어가 존재 = negative skewd 된 그래프모양

range2:1,2,4,6,8,10 -> 고른 분포모양

 

quartile

q1= 25%

q2=50% (median)

q3=75%

 

interquartile range

양쪽 끝단 25%를 쳐낸 범위

ex)

N(population)=16

2,3,4,4,5,5,6,6,6,7,7,8,8,9,10,11

q3(8) -q1(4.5)=3.5

interquartile range는 다소 대강(crude)의 변수측정임

 

표준편차 구하기

1.편차점수(deviation score)x-u(뮤)(not u-x) 

편차:평균으로부터 어느만큼 거리가 떨어져있는지

 

2.편차점수(diviation score)의 평균을 구하기(diviation score를 구하고 모집단 개수만큼 나눈다)

편처점수의 합은 항상 0이된다.

ex)0,1,3,8 평균은 12/4=3 

(0-3)+(1-3)+(3-3)+(8-3)=0

 

3.각각의 편차점수를 제곱한다. ->variance

2번 단계의 결과는 항상 0이된다.

이는 우리가 원하는 결과가 아니며, 우리가 원하는 값을 알기 위해 제곱을 하는 것이다.

 

4.variance에 제곱근을 씌운다.

 

=> s.d 표준편차

 

sum of squared deviation(ss)

각 점수들과의 차이를 구하고 제곱을하여 더한 값

definitional formula :ss= 시그마(x-u)제곱 ->3번의 과정과 동일

computational formula : ss=시그마 x제곱 - (시그마x)제곱/N

 

population s.d & variance

fomulas

variance=ss/N

standard deviation 루트ss/N

 

greek letters(lowercase sigma) σ

population standard deviation=σ=루트ss/N

population variance=σ제곱==ss/N

 

#주의 : N은 population / n은 sample

 

summary of conputation for variance & s.d

1.평균으로 부터 거리를 구한다

2.거리에 제곱을 씌운다

3.제곱의 합을 구한다 (ss)

4.제곱된 것의 평균을 찾는다 (variance)

5.variance에 루트를 씌운다->(standard deviation)

 

s.d=평균으로부터 떨어진 거리를 측정한 것.

 

샘플에서 variability의 문제사항

-샘플의 변화 < 모집단의 변화

-샘플variability는 모집단 variability의 편향된 측정을 전달한다.

-보통 샘플은 모집단의 값을 괴소평가한다(underestimate)

 

df & adjustment

degrees of freedom(df)

ex) 5개의 숫자가 존재하고 평균이 10일 때 5개의 숫자를 임의로 나열해보라

2,4,4,5 35  앞의 4자리는 자유도를 가진다.

하지만 마지막 35는 자유도를 가지지 못한다.

 

자유도 값 구하기 : n-1

 

correct bias in sample variability(샘플 variability에서 정확한 bias)

조정 : n-1을 사용 / n을 사용하지 않는다.

 

n-1을 적용한 공식

sample variance= ss/n-1=s제곱

sample standard deviation = s=루트ss/n-1

 

#σ제곱 = variance = 표준점수의 제곱을 구한 값에서 평균을 구한 것 -> 루트를 씌우면 표준편차

 

추가 설명

- 각 값에 상수를 더해도 표준편차는 변하지 않는다.

- 각 값에 상수를 곱하면 표준편차가 그 값만큼 곱해진다.

 

mean : 가장 중심적인 경향을 띄는 수치

standard deviation : 가장 흔한 variability의 수치

 

 

표준편차에 대한 개념적 추가 설명

 

많은 자료를 대표하는 하나의 양이 평균이라면, 이 자료들이 얼마나 평균 주변에 모여 있는지를 알아야 할 때가 있다. 

자료 하나하나가 평균에서 어느 정도 떨어져 있는지를 알기 위함.

어느 정도 떨어져 있는지를 알려면 그 자료와차를 구해보면 되고, 이것을 편차라고 함.

 

다만 자료가 많아질수록 편차 하나하나를 살펴보기 어려움이 있기 때문에, 여러 편차들을 대표할 수 있는 하나의 양이 필요하다.

 

이것을 ‘흩어져 있는 정도’라는 뜻에서 ‘산포도’라고 한다.

 

산포도 가운데 가장 흔히 쓰이는 것은 표준편차 이다.

출처 : https://terms.naver.com/entry.naver?docId=3567643&cid=58944&categoryId=58970 

 

표준편차

평균에 대한 글을 보니 그 다음으로 생각나는 것은 표준편차이다. 왜 표준편차를 구할 때는 편차의 제곱을 이용하는 걸까? 그냥 절댓값 같은 걸 쓰는 게 더 간단할 텐데, 왜 복잡한 방법으로 구

terms.naver.com

 

'학교 수업 > 광고홍보조사방법론' 카테고리의 다른 글

ch.10 The t-Test for Two Independent Samples  (0) 2023.11.21
9장 t-test 티검정  (2) 2023.11.21
t-test / f / anova  (0) 2023.11.21
Ch. 6 Probability  (0) 2023.10.02
z_scores 광고홍보조사방법론 9/20  (0) 2023.09.21