총 제곱 편차. 표준 편차

제곱 평균 제곱근 편차(동의어: 제곱 평균 제곱근 편차, 평균 제곱근 편차, 제곱 편차; 관련 용어: 표준 편차, 표준 스프레드) - 확률 이론 및 통계에서 수학적 기대치에 대한 확률 변수 값의 분산에 대한 가장 일반적인 지표입니다. 값 샘플의 제한된 배열에서는 수학적 기대값 대신 샘플 모집단의 산술 평균이 사용됩니다.

대학 유튜브

  • 1 / 5

    표준 편차는 단위로 측정됩니다. 랜덤 변수산술평균의 표준오차를 계산할 때, 신뢰구간을 구성할 때, 가설을 통계적으로 검증할 때, 확률변수 간의 선형관계를 측정할 때 사용합니다. 확률 변수 분산의 제곱근으로 정의됩니다.

    표준 편차:

    s = n n - 1 σ 2 = 1 n - 1 ∑ i = 1 n (x i - x ¯) 2; (\ displaystyle s = (\ sqrt ((\ frac (n) (n-1)) \ sigma ^ (2))) = (\ sqrt ((\ frac (1) (n-1)) \ sum _ ( 나는 = 1) ^ (n) \ 왼쪽 (x_ (i) - (\ 바 (x)) \ 오른쪽) ^ (2)));)
    • 참고: 매우 자주 RMSD(표준 편차) 및 SRT(표준 편차)의 이름과 공식이 일치하지 않습니다. 예를 들어, Python의 numPy 모듈에서 std() 함수는 "표준 편차"로 설명되는 반면 공식은 표준 편차(샘플의 루트로 나누기)를 반영합니다. Excel에서 STDEV() 함수는 다릅니다(n-1의 루트로 나누기).

    표준 편차(확률변수의 표준편차 추정치 NS분산의 편향되지 않은 추정치를 기반으로 한 수학적 기대치에 대한 상대적) s (\ displaystyle s):

    σ = 1 n ∑ i = 1 n (x i - x ¯) 2. (\ displaystyle \ 시그마 = (\ sqrt ((\ frac (1) (n))) \ sum _ (i = 1) ^ (n) \ 왼쪽 (x_ (i) - (\ bar (x)) \ 오른쪽) ^ (2))).)

    어디 σ 2 (\ 디스플레이 스타일 \ 시그마 ^ (2))- 편차; x i (\ 표시 스타일 x_ (i)) - NS샘플의 th 요소; n (\ 표시 스타일 n)- 표본의 크기; - 샘플의 산술 평균:

    x ¯ = 1 n ∑ i = 1 n x i = 1 n (x 1 +… + x n). (\ displaystyle (\ bar (x)) = (\ frac (1) (n)) \ sum _ (i = 1) ^ (n) x_ (i) = (\ frac (1) (n)) (x_ (1) + \ ldots + x_ (n)).)

    두 추정 모두 편향되어 있다는 점에 유의해야 합니다. 일반적으로 편향되지 않은 추정치를 구성하는 것은 불가능합니다. 그러나 편향되지 않은 분산의 추정치를 기반으로 한 추정치는 일관성이 있습니다.

    GOST R 8.736-2011에 따라 표준 편차는 이 섹션의 두 번째 공식에 따라 계산됩니다. 결과를 확인하시기 바랍니다.

    3시그마 법칙

    3시그마 법칙 (3 σ (\ 디스플레이 스타일 3 \ 시그마)) - 정규 분포 확률 변수의 거의 모든 값이 구간에 있습니다. (x ¯ - 3 σ; x ¯ + 3 σ) (\ displaystyle \ left ((\ bar (x)) - 3 \ sigma; (\ bar (x)) + 3 \ sigma \ right))... 더 엄격하게는 - 대략 0.9973의 확률로 정규 분포 확률 변수의 값은 지정된 간격에 있습니다(값이 x ¯ (\ 표시 스타일(\ 막대(x)))사실, 샘플링되지 않음).

    진정한 가치라면 x ¯ (\ 표시 스타일(\ 막대(x)))알 수 없는 경우 사용해서는 안 됩니다. σ (\ 디스플레이 스타일 \ 시그마), NS NS... 따라서 3 시그마의 규칙은 3의 규칙으로 변환됩니다. NS .

    표준 편차 값 해석

    표준 편차의 값이 클수록 제시된 세트에서 값의 더 큰 확산을 보여줍니다. 평균세트; 낮은 값은 각각 집합의 값이 평균을 중심으로 그룹화되었음을 나타냅니다.

    예를 들어, (0, 0, 14, 14), (0, 6, 8, 14) 및 (6, 6, 8, 8)의 세 가지 숫자 집합이 있습니다. 세 세트 모두에 대해 평균 값은 7이고 표준 편차는 각각 7, 5 및 1입니다. 마지막 세트는 표준 편차가 작습니다. 세트의 값이 평균 주위에 그룹화되어 있기 때문입니다. 첫 번째 세트가 가장 많이 큰 중요성표준 편차 - 세트 내의 값은 평균과 크게 다릅니다.

    일반적으로 표준편차는 불확실성의 척도로 간주될 수 있습니다. 예를 들어, 물리학에서 표준 편차는 일련의 연속적인 수량 측정의 오류를 결정하는 데 사용됩니다. 이 값은 이론에 의한 예측 값과 비교하여 연구 중인 현상의 가능성을 결정하는 데 매우 중요합니다. 측정의 평균 값이 이론에 의한 예측 값과 크게 다른 경우(표준 편차의 큰 값), 그런 다음 얻은 값 또는 이를 얻는 방법을 다시 확인해야 합니다. 포트폴리오 위험으로 식별됩니다.

    기후

    평균 최고 주간 온도가 동일한 두 도시가 있지만 하나는 해안에 있고 다른 하나는 평야에 있다고 가정합니다. 해안 도시는 내륙 도시보다 낮 최고 기온이 다양한 것으로 알려져 있습니다. 따라서 해안 도시 주변의 낮 최고 기온의 표준 편차는 이 값의 평균값이 동일함에도 불구하고 두 번째 도시의 표준 편차보다 작을 것이며, 이는 실제로 최대 기온이 연중 각 특정 요일은 대륙 내부에 위치한 도시의 경우 평균보다 더 강할 것입니다.

    스포츠

    예를 들어 득점 및 실점한 골 수, 득점 기회 등 특정 매개변수 집합에 따라 평가되는 축구 팀이 여러 개 있다고 가정합니다. 이 그룹에서 가장 우수한 팀은 최고의 가치~에 매개변수. 팀이 제시된 각 매개변수에 대한 표준 편차가 적을수록 팀의 결과를 더 예측할 수 있으므로 이러한 팀은 균형을 이룹니다. 반면에 표준 편차가 큰 팀의 경우 결과를 예측하기 어렵고 결과적으로 불균형으로 설명됩니다. 예를 들면 다음과 같습니다. 강력한 보호그러나 약한 공격으로.

    팀 매개 변수의 표준 편차를 사용하면 어느 정도 두 팀의 경기 결과를 예측하고 강점을 평가하고 약한 측면팀, 따라서 선택된 투쟁 방법.

    표본 조사에 따르면 예금자들은 도시의 Sberbank 예금 규모에 따라 그룹화되었습니다.

    정의하다:

    1) 변동 범위;

    2) 예금의 평균 크기;

    3) 평균 선형 편차;

    4) 편차;

    5) 표준편차;

    6) 기여의 변동 계수.

    해결책:

    이 분포 계열에는 열린 구간이 있습니다. 이러한 시리즈에서 첫 번째 그룹의 간격 값은 일반적으로 다음 그룹의 간격 값과 동일한 것으로 가정하고 마지막 그룹의 간격 값은 이전 것.

    두 번째 그룹의 간격 값은 200과 같으므로 첫 번째 그룹의 값도 200과 같습니다. 끝에서 두 번째 그룹의 간격 값은 200과 같습니다. 즉, 마지막 간격은 값 200.

    1) 변이 범위를 특성의 가장 큰 값과 가장 작은 값의 차이로 정의해 보겠습니다.

    예금 크기의 변동 범위는 1000 루블입니다.

    2) 기여의 평균 크기는 산술 가중 평균의 공식에 의해 결정됩니다.

    각 구간에서 특징의 불연속 값을 미리 정의해 봅시다. 이를 위해 산술 소수에 대한 공식을 사용하여 구간의 중간점을 찾습니다.

    첫 번째 간격의 평균 값은 다음과 같습니다.

    두 번째 - 500 등

    계산 결과를 테이블에 입력해 보겠습니다.

    입금액, 문지름.예금자 수, f간격의 중간, x엑스에프
    200-400 32 300 9600
    400-600 56 500 28000
    600-800 120 700 84000
    800-1000 104 900 93600
    1000-1200 88 1100 96800
    400 - 312000

    도시의 Sberbank에있는 예금의 평균 크기는 780 루블과 같습니다.

    3) 평균 선형 편차는 총 평균에서 속성의 개별 값의 절대 편차의 산술 평균입니다.

    구간 분포 계열에서 평균 선형 편차를 계산하는 절차는 다음과 같습니다.

    1. 항목 2)와 같이 가중 산술 평균을 계산합니다.

    2. 평균에서 변형의 절대 편차가 결정됩니다.

    3. 결과 편차에 주파수가 곱해집니다.

    4. 부호를 고려하지 않고 가중 편차의 합을 찾습니다.

    5. 가중 편차의 합을 빈도의 합으로 나눕니다.

    계산된 데이터 테이블을 사용하는 것이 편리합니다.

    입금액, 문지름.예금자 수, f간격의 중간, x
    200-400 32 300 -480 480 15360
    400-600 56 500 -280 280 15680
    600-800 120 700 -80 80 9600
    800-1000 104 900 120 120 12480
    1000-1200 88 1100 320 320 28160
    400 - - - 81280

    Sberbank 고객 예금 크기의 평균 선형 편차는 203.2 루블입니다.

    4) 산포는 산술 평균에서 각 특성 값의 편차의 제곱의 산술 평균입니다.

    간격 분포 계열의 분산 계산은 다음 공식에 따라 수행됩니다.

    이 경우 분산을 계산하는 절차는 다음과 같습니다.

    1. 2)절에 나타난 대로 가중 산술 평균을 결정합니다.

    2. 평균에서 변형의 편차를 찾습니다.

    3. 평균에서 각 옵션의 편차를 제곱합니다.

    4. 편차의 제곱에 가중치(빈도)를 곱합니다.

    5. 접수된 작업을 요약합니다.

    6. 결과 합계를 가중치(주파수)의 합계로 나눕니다.

    표의 계산을 작성해 보겠습니다.

    입금액, 문지름.예금자 수, f간격의 중간, x
    200-400 32 300 -480 230400 7372800
    400-600 56 500 -280 78400 4390400
    600-800 120 700 -80 6400 768000
    800-1000 104 900 120 14400 1497600
    1000-1200 88 1100 320 102400 9011200
    400 - - - 23040000

    이 기사에서 나는 방법에 대해 이야기 할 것입니다 표준 편차를 찾는 방법... 이 자료는 수학을 완전히 이해하는 데 매우 중요하므로 수학 교사는 별도의 수업 또는 여러 수업을 공부에 할애해야 합니다. 이 기사에서는 표준 편차가 무엇이며 찾는 방법을 설명하는 상세하고 이해하기 쉬운 비디오 자습서에 대한 링크를 찾을 수 있습니다.

    표준 편차매개 변수를 측정 한 결과 얻은 값의 확산을 추정 할 수 있습니다. 기호( 그리스 문자"시그마").

    계산식은 꽤 간단합니다. 표준편차를 구하려면 분산의 제곱근을 취해야 합니다. 이제 "변동이란 무엇입니까?"라고 물어야 합니다.

    분산이란 무엇입니까

    분산의 정의는 다음과 같습니다. 분산은 평균에서 값의 제곱 편차의 산술 평균입니다.

    분산을 찾으려면 다음 계산을 순차적으로 수행합니다.

    • 평균(단순 평균 산술 시리즈값).
    • 그런 다음 각 값에서 평균을 빼고 결과 차이를 제곱합니다. 차의 제곱).
    • 다음 단계는 차이의 결과 제곱의 산술 평균을 계산하는 것입니다(정확히 제곱이 아래에 있는 이유를 찾을 수 있음).

    예를 들어 보겠습니다. 당신과 당신의 친구들이 당신의 개의 키(밀리미터)를 측정하기로 결정했다고 가정해 봅시다. 측정 결과, 600mm, 470mm, 170mm, 430mm 및 300mm의 높이 측정값을 얻었습니다.

    평균, 분산 및 표준 편차를 계산해 보겠습니다.

    먼저 평균을 구합니다.... 이미 알고 있듯이 이를 위해서는 모든 측정 값을 더하고 측정 횟수로 나누어야 합니다. 계산 진행 상황:

    평균 mm.

    따라서 평균(산술 평균)은 394mm입니다.

    이제 정의해야 합니다. 평균에서 각 개 성장의 편차:

    마침내, 분산을 계산하기 위해, 얻은 각 차이를 제곱한 다음 얻은 결과의 산술 평균을 찾습니다.

    분산 mm 2.

    따라서 분산은 21704mm2입니다.

    표준 편차를 찾는 방법

    이제 분산을 알고 표준 편차를 계산하는 방법은 무엇입니까? 우리가 기억하는 것처럼, 그것의 제곱근을 취하십시오. 즉, 표준 편차는 다음과 같습니다.

    Mm(mm 단위의 가장 가까운 정수로 반올림됨).

    이 방법을 사용하여 일부 개(예: 로트와일러)가 매우 큰 개... 그러나 아주 작은 개도 있습니다(예: 닥스훈트, 다만 이것을 말하지 마십시오).

    가장 흥미로운 점은 표준 편차가 유용한 정보... 이제 얻은 높이 측정 중 어느 것이 평균(양쪽에서)의 표준 편차를 연기하면 얻은 간격 내에 있는지 보여줄 수 있습니다.

    즉, 표준 편차를 사용하여 값 중 어느 것이 정상(평균)이고 어떤 값이 비정상적으로 크거나 반대로 작은지 알 수 있는 "표준" 방법을 얻습니다.

    표준편차란 무엇인가

    그러나 ... 우리가 분석하면 모든 것이 약간 다를 것입니다. 견본 추출데이터. 우리의 예에서 우리는 다음을 고려했습니다. 일반 인구.즉, 우리의 5마리는 세상에서 우리에게 관심을 가진 유일한 개였습니다.

    그러나 데이터가 표본(대규모에서 선택한 값)인 경우 일반 인구), 계산을 다르게 수행해야 합니다.

    값이 있는 경우:

    다른 모든 계산은 평균 결정을 포함하여 동일한 방식으로 이루어집니다.

    예를 들어, 다섯 마리의 개가 일반 개(지구상의 모든 개)의 표본일 경우 ​​다음으로 나누어야 합니다. 5가 아니라 4,즉:

    표본 분산 = mm2.

    이 경우 표본의 표준편차는 mm(가장 가까운 정수로 반올림).

    우리의 값이 작은 샘플에 불과한 경우에 약간의 "수정"을 수행했다고 말할 수 있습니다.

    메모. 왜 제곱 차이인가?

    그러나 왜 분산을 계산할 때 차이의 제곱을 정확히 취합니까? 일부 매개변수를 측정할 때 다음 값 세트를 받았다고 가정합니다. 4; 4; -4; -4. 서로의 평균(차이)에서 절대 편차를 추가하면 ... 음수 값은 양수 값으로 취소됩니다.

    .

    이 옵션은 쓸모가 없습니다. 그렇다면 편차의 절대값(즉, 이러한 값의 모듈)을 시도해 볼 가치가 있습니까?

    언뜻보기에는 잘 나타납니다 (그런데 결과 값을 평균 절대 편차라고 함). 그러나 모든 경우에 그런 것은 아닙니다. 다른 예를 들어 보겠습니다. 측정 결과를 다음 값 집합으로 설정합니다. 7; 1; -6; -2. 평균 절대 편차는 다음과 같습니다.

    블라미! 차이가 훨씬 더 흩어져 있지만 결과는 4입니다.

    이제 차이를 제곱하면 어떤 일이 발생하는지 봅시다(그리고 그 합계의 제곱근을 취하면).

    첫 번째 예의 경우 다음을 얻습니다.

    .

    두 번째 예의 경우 다음을 얻습니다.

    이제 완전히 다른 문제입니다! 표준 편차가 클수록 차이의 퍼짐이 커집니다 ... 이것이 우리가 추구했던 것입니다.

    사실 이 방법은 점 사이의 거리를 계산할 때와 같은 개념을 사용하고 다른 방식으로만 적용됩니다.

    수학적으로 제곱과 제곱근을 사용하면 더 많은 사용표준 편차가 다른 수학 문제에 적용될 수 있도록 편차의 절대값을 기반으로 얻을 수 있는 것보다

    Sergey Valerievich는 표준 편차를 찾는 방법을 알려 주었습니다.

    기하 평균을 단순하게 계산하기 위해 다음 공식이 사용됩니다.

    기하학적 가중치

    기하학적 가중 평균을 결정하기 위해 다음 공식이 적용됩니다.

    바퀴, 파이프의 평균 직경, 정사각형의 평균 변은 평균 제곱을 사용하여 결정됩니다.

    RMS 값은 생산 리듬을 특징 짓는 변동 계수와 같은 일부 지표를 계산하는 데 사용됩니다. 여기에서 일정 기간 동안 계획된 산출량의 표준편차는 다음 공식을 사용하여 결정됩니다.

    이 값은 평균 값으로 취한 기본 값과 비교하여 경제 지표의 변화를 정확하게 특성화합니다.

    이차 단순

    제곱 평균 제곱근 단순은 다음 공식으로 계산됩니다.

    가중치 제곱

    가중 평균 제곱은 다음과 같습니다.

    22. 변동의 절대 지표는 다음과 같습니다.

    변동 범위

    평균 선형 편차

    변화

    표준 편차

    스윙 변형(r)

    스와이프 변형특성의 최대값과 최소값의 차이입니다.

    연구 대상 집단에서 형질의 가치가 변하는 한계를 보여줍니다.

    이전 직장에서 5명의 지원자의 경력은 2,3,4,7 및 9년입니다. 솔루션: 변동 범위 = 9 - 2 = 7년.

    속성 값의 차이에 대한 일반화 된 특성의 경우 평균 변동 지표는 산술 평균과의 편차를 고려하여 계산됩니다. 차이는 평균과의 편차로 간주됩니다.

    동시에 평균에서 특징 옵션의 편차 합계를 피하려면 (평균의 속성이 0) 편차의 표시를 고려하지 않아야합니다. 합계 모듈로 또는 편차를 0으로 제곱합니다.

    평균 선형 및 표준 편차

    평균 선형 편차- 이것은 평균에서 속성의 개별 값의 절대 편차의 산술 평균입니다.

    평균 선형 편차는 간단합니다.

    이전 직장에서 5명의 지원자의 경력은 2,3,4,7 및 9년입니다.

    우리의 예에서: 년;

    답: 2.4년.

    가중 평균 선형 편차그룹화된 데이터에 적용:

    평균 선형 편차는 관습으로 인해 실제로 비교적 드물게 사용됩니다(특히, 납품의 균일성에 대한 계약 의무 이행을 특성화하기 위해, 생산의 기술적 특징을 고려하여 제품 품질을 분석할 때).

    표준 편차

    변이의 가장 완벽한 특성은 표준편차(또는 표준편차)라고 하는 표준편차입니다. 표준 편차() 같음 제곱근산술 평균에서 속성의 개별 값 편차의 평균 제곱에서 :

    표준 편차는 간단합니다.

    가중 표준 편차는 그룹화된 데이터에 사용됩니다.

    정규 분포 조건에서 평균 제곱과 표준 선형 편차 사이에 다음 관계가 발생합니다. ~ 1.25.

    변동의 주요 절대 척도 인 표준 편차는 표본 관찰 구성 및 표본 특성의 정확도 설정과 관련된 계산 및 평가할 때 정규 분포 곡선의 세로 좌표 값을 결정하는 데 사용됩니다. 동질적인 모집단에서 특징의 변이의 경계.

    가설을 통계적으로 검정할 때, 확률변수 간의 선형 관계를 측정할 때.

    표준 편차:

    표준 편차(랜덤 변수 바닥, 우리 주변의 벽 및 천장의 표준 편차 추정치, NS분산의 편향되지 않은 추정치를 기반으로 한 수학적 기대치에 대한 상대적):

    분산은 어디에 있습니까? - 바닥, 우리 주변의 벽 및 천장, NS샘플의 th 요소; - 표본의 크기; - 샘플의 산술 평균:

    두 추정 모두 편향되어 있다는 점에 유의해야 합니다. 일반적으로 편향되지 않은 추정치를 구성하는 것은 불가능합니다. 그러나 편향되지 않은 분산의 추정치를 기반으로 한 추정치는 일관성이 있습니다.

    3시그마 법칙

    3시그마 법칙() - 정규 분포 확률 변수의 거의 모든 값이 간격에 있습니다. 보다 엄격하게 - 최소 99.7% 신뢰로 정규 분포 확률 변수의 값은 지정된 간격에 있습니다(값이 참이고 표본 처리 결과로 얻은 것이 아닌 경우).

    실제 값을 알 수 없으면 사용하지 말고 바닥, 우리 주변의 벽 및 천장, NS... 따라서 3시그마의 법칙은 3층, 우리 주변의 벽, 천장의 법칙으로 변형되고, NS .

    표준 편차 값 해석

    표준 편차의 큰 값은 세트의 평균 값과 함께 제시된 세트에서 값의 큰 산포를 보여줍니다. 따라서 작은 값은 집합의 값이 평균을 중심으로 그룹화되었음을 나타냅니다.

    예를 들어, (0, 0, 14, 14), (0, 6, 8, 14) 및 (6, 6, 8, 8)의 세 가지 숫자 집합이 있습니다. 세 세트 모두에 대해 평균 값은 7이고 표준 편차는 각각 7, 5 및 1입니다. 마지막 세트는 표준 편차가 작습니다. 세트의 값이 평균 주위에 그룹화되어 있기 때문입니다. 첫 번째 세트는 표준 편차가 가장 큽니다. 세트 내의 값은 평균과 크게 다릅니다.

    일반적으로 표준편차는 불확실성의 척도로 간주될 수 있습니다. 예를 들어, 물리학에서 표준 편차는 일련의 연속적인 수량 측정의 오류를 결정하는 데 사용됩니다. 이 값은 이론에 의한 예측 값과 비교하여 연구 중인 현상의 가능성을 결정하는 데 매우 중요합니다. 측정의 평균 값이 이론에 의한 예측 값과 크게 다른 경우(표준 편차의 큰 값), 그런 다음 얻은 값 또는 이를 얻는 방법을 다시 확인해야 합니다.

    실용

    실제로 표준 편차를 사용하면 집합의 값이 평균과 얼마나 다를 수 있는지 결정할 수 있습니다.

    기후

    평균 일일 최고 온도가 동일한 두 도시가 있지만 하나는 해안에 있고 다른 하나는 내륙에 있다고 가정합니다. 해안 도시는 내륙 도시보다 낮 최고 기온이 다양한 것으로 알려져 있습니다. 따라서 해안 도시 주변의 낮 최고 기온의 표준 편차는 이 값의 평균값이 동일함에도 불구하고 두 번째 도시의 표준 편차보다 작을 것이며, 이는 실제로 최대 기온이 연중 각 특정 요일은 대륙 내부에 위치한 도시의 경우 평균보다 더 강할 것입니다.

    스포츠

    예를 들어 득점 및 실점한 골 수, 득점 기회 등 특정 매개변수 집합에 따라 평가되는 축구 팀이 여러 개 있다고 가정합니다. 이 그룹에서 가장 좋은 팀이 가장 좋은 값을 가질 가능성이 큽니다. 더 많은 매개변수에서 팀이 제시된 각 매개변수에 대한 표준 편차가 적을수록 팀의 결과를 더 예측할 수 있으므로 이러한 팀은 균형을 이룹니다. 반면에, 표준편차가 큰 팀의 경우 결과를 예측하기 어렵습니다. 이는 차례로 수비가 강하지만 공격이 약한 등의 불균형으로 인한 것입니다.

    팀 매개변수의 표준 편차를 사용하면 어느 정도 두 팀 간의 경기 결과를 예측하고 팀의 강점과 약점, 따라서 선택한 투쟁 방법을 평가할 수 있습니다.

    기술적 분석

    또한보십시오

    문학

    * 보로비코프, V.통계. 컴퓨터에서의 데이터 분석 기술: 전문가용 / V. Borovikov. - SPb. : Peter, 2003 .-- 688 p. - ISBN 5-272-00078-1.

이 공유