신뢰 구간은 무엇입니까? 표본과 신뢰 구간

통계 문제를 해결하는 방법 중 하나는 신뢰 구간을 계산하는 것입니다. 작은 샘플 크기에 대한 포인트 추정에 대한 선호되는 대안으로 사용됩니다. 신뢰 구간 자체를 계산하는 과정은 다소 복잡하다는 점에 유의해야합니다. 그러나 Excel 도구를 사용하면 다소 단순화 할 수 있습니다. 이것이 실제로 어떻게 이루어지는 지 알아 봅시다.

이 방법은 다양한 통계량의 간격 추정에 사용됩니다. 이 계산의 주요 임무는 포인트 추정의 불확실성을 제거하는 것입니다.

Excel에는이 방법을 사용하여 계산하는 두 가지 주요 옵션이 있습니다. 분산이 알려진 경우와 알 수없는 경우입니다. 첫 번째 경우에는 함수가 계산에 사용됩니다. TRUST.NORM, 그리고 두 번째- 자신감 학생.

방법 1 : CONFIDENCE NORMAL 기능

운영자 TRUST.NORM통계 함수 그룹에 속하는은 Excel 2010에서 처음 등장했습니다.이 프로그램의 이전 버전은 해당 기능을 사용합니다. 믿음... 이 연산자의 임무는 평균에 대한 정규 분포를 사용하여 신뢰 구간을 계산하는 것입니다. 일반 인구.

구문은 다음과 같습니다.

TRUST.NORM (알파, 표준 _ 개발, 크기)

"알파" -신뢰 수준을 계산하는 데 사용되는 유의 수준을 나타내는 인수입니다. 신뢰 수준은 다음 식과 같습니다.

(1- "알파") * 100

"표준 편차" 이름에서 본질이 분명한 주장입니다. 제안 된 표본의 표준 편차입니다.

"크기" -표본 크기를 정의하는 인수.

이 연산자에 대한 모든 인수가 필요합니다.

함수 믿음 이전 것과 똑같은 주장과 가능성이 있습니다. 구문은 다음과 같습니다.

TRUST (알파, 표준 _ 개발, 크기)

보시다시피 차이점은 운영자의 이름에만 있습니다. 지정된 함수는 호환성을 위해 Excel 2010 이상에서 특수 범주로 유지됩니다. "적합성"... Excel 2007 및 이전 버전에서는 주요 통계 연산자 그룹에 있습니다.

신뢰 구간의 경계는 다음 공식을 사용하여 결정됩니다.

X + (-) TRUST. NORMAL

어디 엑스선택한 범위의 중간에있는 샘플링 된 값의 평균입니다.

이제 신뢰 구간을 계산하는 방법을 살펴 보겠습니다. 구체적인 예... 12 개의 테스트가 수행되었으며 그 결과 다양한 결과가 표에 나와 있습니다. 이것이 우리의 총체입니다. 표준 편차는 8입니다. 97 % 신뢰 수준에서 신뢰 구간을 계산해야합니다.

  1. 데이터 처리 결과를 표시 할 셀을 선택합니다. 버튼을 클릭하십시오 "삽입 기능".
  2. 나타남 기능 마법사... 카테고리로 이동 "통계" 이름을 강조 "TRUST.NORM"... 그 후 버튼을 클릭하십시오 "확인".
  3. 인수 창이 열립니다. 해당 필드는 당연히 인수 이름과 일치합니다.
    커서를 첫 번째 필드로 설정했습니다. "알파"... 여기서 우리는 유의 수준을 표시해야합니다. 우리가 기억하는 것처럼 우리의 신뢰 수준은 97 %입니다. 동시에 우리는 다음과 같이 계산한다고 말했습니다.

    (1 단계 신뢰) / 100

    즉, 값을 대체하면 다음을 얻습니다.

    간단한 계산을 통해 우리는 주장이 "알파" ~는 같다 0,03 ... 설명하다 주어진 가치 필드에서.

    아시다시피 조건에 따라 표준 편차는 8 ... 따라서 현장에서 "표준 편차" 이 번호를 쓰세요.

    필드에서 "크기" 수행 된 테스트의 요소 수를 입력해야합니다. 우리가 기억하는 것처럼 12 ... 그러나 수식을 자동화하고 새 테스트를 수행 할 때마다 편집하지 않으려면이 값을 일반 숫자가 아닌 연산자를 사용하여 설정합시다. 점수... 따라서 필드에 커서를 놓습니다. "크기"을 클릭 한 다음 수식 입력 줄 왼쪽에있는 삼각형을 클릭합니다.

    최근에 사용한 기능 목록이 나타납니다. 운영자가 점수 최근에 사용되었으므로이 목록에 있어야합니다. 이 경우 이름을 클릭하기 만하면됩니다. 반대의 경우 찾을 수 없으면 항목으로 이동하십시오. "기타 기능 ...".

  4. 우리에게 이미 익숙한 것이 나타납니다 기능 마법사... 다시 그룹으로 이동 "통계"... 거기에 이름을 강조 "점수"... 버튼을 클릭하십시오 "확인".
  5. 위의 연산자에 대한 인수 창이 나타납니다. 이 함수는 숫자 값을 포함하는 지정된 범위의 셀 수를 계산하도록 설계되었습니다. 구문은 다음과 같습니다.

    COUNT (값 1; 값 2; ...)

    인수 그룹 "값" 숫자 데이터로 채워진 셀 수를 계산하려는 범위에 대한 참조입니다. 이러한 인수는 총 255 개까지있을 수 있지만 우리의 경우에는 하나만 필요합니다.

    필드에 커서를 놓습니다. "값 1" 마우스 왼쪽 버튼을 누른 상태에서 컬렉션이 포함 된 범위를 시트에서 선택합니다. 그러면 해당 주소가 필드에 표시됩니다. 버튼을 클릭하십시오 "확인".

  6. 그 후 응용 프로그램은 계산을 수행하고 결과를 해당 셀에 출력합니다. 특별한 경우 공식은 다음과 같습니다.

    CONFIDENT.NORM (0,03; 8; 개수 (B2 : B13))

    총 계산 결과는 5,011609 .

  7. 하지만 그게 다가 아닙니다. 기억하고 있듯이, 신뢰 구간의 경계는 계산 결과의 샘플링 된 값의 평균에서 더하고 빼서 계산됩니다. TRUST.NORM... 이러한 방식으로 신뢰 구간의 오른쪽 및 왼쪽 경계가 각각 계산됩니다. 표본 평균 자체는 연산자를 사용하여 계산할 수 있습니다. 평균.

    이 연산자는 선택한 숫자 범위의 산술 평균을 계산하도록 설계되었습니다. 다음과 같은 다소 간단한 구문이 있습니다.

    AVERAGE (숫자 1; 숫자 2; ...)

    논의 "번호" 단일 숫자 값이거나 셀에 대한 참조이거나 셀을 포함하는 전체 범위 일 수 있습니다.

    따라서 평균값 계산이 표시 될 셀을 선택하고 버튼을 클릭합니다. "삽입 기능".

  8. 오픈 기능 마법사... 다시 카테고리로 이동 "통계" 목록에서 이름을 선택하십시오 "평균"... 항상 그렇듯이 버튼을 클릭하십시오. "확인".
  9. 인수 창이 시작됩니다. 필드에 커서를 놓습니다. "숫자 1" 마우스 왼쪽 버튼을 누른 상태로 전체 값 범위를 선택합니다. 필드에 좌표가 표시된 후 버튼을 클릭하십시오. "확인".
  10. 그 후 평균 계산 결과를 시트 요소로 출력합니다.
  11. 신뢰 구간의 오른쪽 경계를 계산합니다. 이렇게하려면 별도의 셀을 선택하고 기호를 넣으십시오. «=» 함수 계산 결과가있는 시트 요소의 내용을 추가합니다. 평균TRUST.NORM... 계산을 수행하려면 버튼을 누르십시오. 시작하다... 우리의 경우 다음 공식을 얻었습니다.

    계산 결과 : 6,953276

  12. 같은 방식으로 신뢰 구간의 왼쪽 경계를 계산합니다. 이번에 만 계산 결과에서 평균 연산자 계산 결과를 뺍니다. TRUST.NORM... 이 예의 공식은 다음 유형입니다.

    계산 결과 : -3,06994

  13. 신뢰 구간을 계산하는 모든 단계를 자세히 설명하려고했기 때문에 각 공식을 자세히 설명했습니다. 그러나 모든 작업을 하나의 수식으로 결합 할 수 있습니다. 신뢰 구간의 오른쪽 경계 계산은 다음과 같이 작성할 수 있습니다.

    평균 (B2 : B13) + 기밀 일반 (0.03; 8; 개수 (B2 : B13))

  14. 왼쪽 테두리의 유사한 계산은 다음과 같습니다.

    평균 (B2 : B13) -TRUST.NORM (0.03; 8; 개수 (B2 : B13))

방법 2 : CONFIDENCE STUDENT 기능

또한 Excel에는 신뢰 구간 계산과 관련된 또 다른 기능이 있습니다. 자신감 학생... Excel 2010 이후에만 나타났습니다.이 연산자는 Student 's t 분포를 사용하여 모집단의 신뢰 구간을 계산합니다. 분산과 그에 따른 표준 편차를 알 수없는 경우 사용하는 것이 매우 편리합니다. 연산자의 구문은 다음과 같습니다.

TRUST.STUDENT (알파, 표준 _ 개발, 크기)

보시다시피이 경우 연산자의 이름은 변경되지 않았습니다.

이전 방법에서 고려한 동일한 모집단의 예를 사용하여 알 수없는 표준 편차로 신뢰 구간의 경계를 계산하는 방법을 살펴 보겠습니다. 지난번과 마찬가지로 신뢰 수준은 97 %입니다.

  1. 계산할 셀을 선택합니다. 버튼을 클릭하십시오 "삽입 기능".
  2. 열린 기능 마법사 카테고리로 이동 "통계"... 이름 선택 "자신감 학생"... 버튼을 클릭하십시오 "확인".
  3. 지정된 연산자에 대한 인수 창이 시작됩니다.

    필드에서 "알파", 신뢰 수준이 97 % 인 경우 숫자를 기록합니다. 0,03 ... 우리는 두 번째로이 매개 변수를 계산하는 원리에 대해서는 다루지 않을 것입니다.

    그 후 필드에 커서를 놓습니다. "표준 편차"... 이번에는이 지표는 우리에게 알려지지 않았으므로 계산해야합니다. 이것은 특수 기능을 사용하여 수행됩니다- STDEV.B.... 이 연산자의 창을 열려면 수식 입력 줄 왼쪽에있는 삼각형을 클릭하십시오. 열리는 목록에서 원하는 이름을 찾지 못하면 항목으로 이동하십시오. "기타 기능 ...".

  4. 시작 기능 마법사... 카테고리로 이동 "통계" 그 안에 이름을 표시 "STDEV.V"... 그런 다음 버튼을 클릭하십시오 "확인".
  5. 인수 창이 열립니다. 운영자의 임무 STDEV.B. 표본의 표준 편차에 대한 정의입니다. 구문은 다음과 같습니다.

    STDEV.B (숫자 1; 숫자 2; ...)

    논쟁이 "번호" 샘플 항목의 주소입니다. 선택 항목이 단일 배열에 배치 된 경우 하나의 인수 만 사용하면이 범위에 대한 참조를 제공 할 수 있습니다.

    필드에 커서를 놓습니다. "숫자 1" 항상 그렇듯이 마우스 왼쪽 버튼을 누른 채 인구를 선택합니다. 좌표가 필드에 입력 된 후 서두르지 말고 버튼을 누르십시오. "확인", 결과가 올바르지 않기 때문입니다. 먼저 연산자 인수 창으로 돌아 가야합니다. 자신감 학생마지막 논쟁을하기 위해. 이렇게하려면 수식 입력 줄에서 적절한 이름을 클릭합니다.

  6. 익숙한 함수에 대한 인수 창이 다시 열립니다. 필드에 커서를 놓습니다. "크기"... 다시, 이미 익숙한 삼각형을 클릭하여 연산자 선택으로 이동하십시오. 이해했듯이 이름이 필요합니다 "점수"... 이전 방법의 계산에서이 함수를 사용 했으므로이 목록에 있으므로 클릭하기 만하면됩니다. 찾을 수없는 경우 첫 번째 방법에 설명 된 알고리즘을 따릅니다.
  7. 인수 창에서 한 번 점수, 필드에 커서를 놓습니다. "숫자 1" 마우스 버튼을 누른 상태에서 인구를 선택합니다. 그런 다음 버튼을 클릭하십시오 "확인".
  8. 그 후 프로그램은 신뢰 구간의 값을 계산하고 표시합니다.
  9. 경계를 정의하려면 표본 평균을 다시 계산해야합니다. 그러나 공식을 사용하는 계산 알고리즘이 평균 이전 방법과 동일하며 결과가 변경되지 않았더라도 두 번째로 자세히 설명하지 않습니다.
  10. 계산 결과를 추가하여 평균자신감 학생, 우리는 신뢰 구간의 오른쪽 경계를 얻습니다.
  11. 계산 결과에서 연산자 빼기 평균 계산 결과 자신감 학생, 신뢰 구간의 왼쪽 경계가 있습니다.
  12. 계산이 하나의 공식으로 작성되면 우리의 경우 오른쪽 테두리 계산은 다음과 같습니다.

    평균 (B2 : B13) + 신뢰할 수있는 학생 (0.03, STDEV.B (B2 : B13), 수 (B2 : B13))

  13. 따라서 왼쪽 테두리를 계산하는 공식은 다음과 같습니다.

    평균 (B2 : B13)-신뢰할 수있는 학생 (0.03, STDEV.B (B2 : B13), 수 (B2 : B13))

보시다시피 Excel 도구를 사용하면 신뢰 구간과 그 경계를 훨씬 쉽게 계산할 수 있습니다. 이러한 목적을 위해 분산이 알려져 있고 알려지지 않은 샘플에 대해 별도의 연산자가 사용됩니다.

그리고 다른 것들 모두는 그들의 이론적 유사체의 추정치이며, 샘플이 아니더라도 얻을 수 있지만 일반 인구는 사용할 수 있습니다. 그러나 아아, 일반 인구는 매우 비싸고 종종 감당할 수 없습니다.

간격 채점 이해

모든 샘플 추정에는 약간의 분산이 있습니다. 특정 샘플의 값에 따른 랜덤 변수입니다. 따라서보다 신뢰할 수있는 통계적 결론을 얻으려면 점 추정치뿐만 아니라 높은 확률로 구간도 알아야합니다. γ (감마)는 예상 지표를 포함합니다. θ (세타).

공식적으로 이들은 두 가지 값입니다 (통계) T 1 (X)T 2 (X), 뭐 T 1< T 2 주어진 확률 수준에서 γ 조건이 충족됩니다.

요컨대, 확률로 γ 이상, 실제 수치는 점 사이에 있습니다. T 1 (X)T 2 (X), 하한 및 상한이라고합니다. 신뢰 구간.

신뢰 구간을 구성하기위한 조건 중 하나는 최대 좁음, 즉 가능한 한 짧아야합니다. 욕망은 자연 스럽습니다. 연구원은 원하는 매개 변수의 발견을보다 정확하게 지역화하려고합니다.

따라서 신뢰 구간은 최대 분포 확률을 포함해야합니다. 평가 자체가 중심에 있습니다.

즉, (추정치에서 실제 지표의) 상향 편차 확률은 하향 편차 확률과 같습니다. 비대칭 분포의 경우 오른쪽 간격이 왼쪽 간격과 같지 않습니다.

위의 그림은 신뢰 수준이 높을수록 간격이 더 넓다는 것을 명확하게 보여줍니다 (직접 관계).

이것은 알려지지 않은 매개 변수의 간격 추정 이론에 대한 작은 소개였습니다. 수학적 기대치에 대한 신뢰 한계를 찾는 것으로 넘어 갑시다.

기대 값에 대한 신뢰 구간

원래 데이터가 분포되어 있으면 평균이 정상 값이됩니다. 이것은 정규 값의 선형 조합에도 정규 분포가 있다는 규칙에 따른 것입니다. 따라서 확률을 계산하기 위해 정규 분포 법칙의 수학적 장치를 사용할 수 있습니다.

그러나이를 위해서는 일반적으로 알려지지 않은 기대와 분산이라는 두 가지 매개 변수를 알아야합니다. 물론 모수 (산술 평균 및) 대신 추정치를 사용할 수 있지만 평균 분포는 완전히 정규화되지 않고 약간 아래로 평평 해집니다. 이 사실은 아일랜드의 시민 인 William Gosset이 Biometrica 잡지의 1908 년 3 월호에 그의 발견을 발표했을 때 똑똑히 지적했습니다. 음모 목적으로 Gosset은 학생으로 서명했습니다. 이것이 Student의 t- 분포가 나타난 방식입니다.

그러나 천문 관측 오류 분석에서 K. Gauss가 사용하는 데이터의 정규 분포는 지구 생활에서 극히 드물며이를 확립하기가 다소 어렵습니다. 높은 정밀도 약 2 천 개의 관찰이 필요합니다). 따라서 정규성 가정을 버리고 원본 데이터의 분포와 관계없이 방법을 사용하는 것이 가장 좋습니다.

질문이 생깁니다. 미지 분포의 데이터에서 계산되는 경우 산술 평균의 분포는 무엇입니까? 대답은 확률 이론에서 잘 알려진 중앙 한계 정리 (TSPT). 수학에는 여러 가지 변형이 있습니다. 오랜 세월 공식이 지정 되었음), 그러나 대략적으로 말하면 이들 모두는 많은 수의 독립 랜덤 변수의 합이 정규 분포 법칙을 따른다는 진술로 요약됩니다.

산술 평균을 계산할 때 확률 변수의 합이 사용됩니다. 따라서 산술 평균에는 평균이 초기 데이터의 평균이고 분산이있는 정규 분포가 있습니다.

똑똑한 사람 CLT를 증명하는 방법을 알고 있지만 Excel에서 수행 된 실험을 통해이를 확신 할 수 있습니다. 균일하게 분포 된 50 개의 랜덤 변수 샘플 (Excel 함수 RANDBETWEEN 사용)을 시뮬레이션 해 보겠습니다. 그런 다음 1000 개의 샘플을 만들고 각각에 대한 산술 평균을 계산합니다. 그들의 분포를 살펴 보겠습니다.

평균의 분포가 정규 법칙에 가깝다는 것을 알 수 있습니다. 표본 크기와 수를 더 크게 만들면 유사성이 더욱 좋아집니다.

이제 우리는 CLT의 유효성을 개인적으로 확신 했으므로 주어진 확률로 실제 평균 또는 수학적 기대치를 포함하는 산술 평균에 대한 신뢰 구간을 사용하여 계산할 수 있습니다.

상한과 하한을 설정하려면 정규 분포의 모수를 알아야합니다. 일반적으로 그들은 거기에 없으므로 추정치가 사용됩니다. 산술 평균표본 분산... 다시 말하지만,이 방법은 큰 샘플에 대해서만 좋은 근사치를 제공합니다. 표본이 작 으면 스튜던트 t 분포를 사용하는 것이 좋습니다. 그것을 믿지 마십시오! 평균에 대한 스튜던트 분포는 초기 데이터에 정규 분포가있는 경우에만, 즉 거의 전혀 발생하지 않습니다. 따라서 필요한 데이터 양에 대한 최소 막대를 즉시 설정하고 점근 적으로 올바른 방법을 사용하는 것이 좋습니다. 그들은 30 개의 관찰로 충분하다고 말합니다. 50을 가져 가십시오-당신은 잘못 갈 수 없습니다.

T 1.2 -신뢰 구간의 하한 및 상한

-샘플 산술 평균

초 0 -표본 표준 편차 (편향되지 않음)

- 표본의 크기

γ -신뢰 수준 (보통 0.9, 0.95 또는 0.99)

c γ \u003d Φ -1 ((1 + γ) / 2) 표준 정규 분포 함수의 역입니다. 간단히 말해서 이것은 산술 평균에서 하한 또는 상한까지의 표준 오류 수입니다 (표시된 세 가지 확률은 값 1.64, 1.96 및 2.58에 해당합니다).

공식의 본질은 산술 평균을 취한 다음 특정 금액을 입금한다는 것입니다 ( γ와 함께) 표준 오류 ( 초 0 / √n). 모든 것이 알려져 있고, 취하고 계산합니다.

개인용 컴퓨터를 대량으로 사용하여 정규 분포 함수와 그 역의 값을 얻기 전에 사용했습니다. 지금도 여전히 사용되지만 기성품 Excel 수식으로 전환하는 것이 더 효율적입니다. 위 공식 (, and)의 모든 요소는 Excel에서 쉽게 계산할 수 있습니다. 그러나 신뢰 구간을 계산하기위한 기성 공식도 있습니다. TRUST.NORM... 구문은 다음과 같습니다.

TRUST.NORM (알파, 표준 _ 개발, 크기)

알파 -위의 표기법에서 1-γ와 같은 유의 수준 또는 신뢰 수준, 즉. 수학적기대 값은 신뢰 구간을 벗어납니다. 0.95의 신뢰 수준에서 알파는 0.05입니다.

standard_dev 표본 데이터의 표준 편차입니다. 표준 오류를 계산할 필요가 없습니다. Excel은이를 n 자체의 근으로 나눕니다.

크기 -샘플 크기 (n).

CONFIDENCE.NORM 함수의 결과는 신뢰 구간 계산 공식의 두 번째 항입니다. 반 간격. 따라서 하한 점과 상한 점은 평균 ± 얻은 값입니다.

따라서 초기 데이터의 분포에 의존하지 않는 산술 평균에 대한 신뢰 구간을 계산하기위한 범용 알고리즘을 구축 할 수 있습니다. 보편성에 대한 대가는 점 근성입니다. 상대적으로 큰 샘플을 사용해야합니다. 그러나 세기에 현대 기술 수집하다 적정량 데이터는 일반적으로 어렵지 않습니다.

신뢰 구간을 사용하여 통계 가설 검정

(모듈 111)

통계에서 해결되는 주요 과제 중 하나는 다음과 같습니다. 그 본질은 간단히 다음과 같습니다. 예를 들어, 일반 인구의 기대 가치는 어느 정도의 가치와 같다고 제안됩니다. 그런 다음 주어진 기대치로 관찰 할 수있는 표본 평균 분포가 표시됩니다. 다음으로, 그들은이 조건부 분포에서 실제 평균이 어디에 있는지 살펴 봅니다. 허용 한도를 초과하면 그러한 평균의 출현 가능성이 거의 없으며 실험을 한 번 반복하면 거의 불가능하며 성공적으로 거부 된 가설과 모순됩니다. 평균이 임계 수준을 넘지 않으면 가설이 거부되지 않습니다 (그러나 증명되지도 않습니다!).

따라서 우리의 경우 기대치에 대한 신뢰 구간을 사용하여 몇 가지 가설을 테스트 할 수도 있습니다. 매우 쉽습니다. 특정 표본에 대한 산술 평균이 100이라고 가정합니다. 가설은 기대 값이 90이라고 테스트합니다. 즉, 질문을 우선적으로 입력하면 다음과 같이 들립니다. 평균의 실제 값이 90이면 관측 값이 평균이 100 이었어요?

이 질문에 답하려면 평균에 대한 정보가 추가로 필요합니다. 제곱 편차 및 샘플 크기. 표준 편차가 30이고 관측치 수가 64 (근을 쉽게 추출하기 위해)라고 가정 해 봅시다. 그러면 평균의 표준 오차는 30/8 또는 3.75입니다. 95 % 신뢰 구간을 계산하려면 평균의 양쪽에서 두 개의 표준 오차 (보다 정확하게는 각각 1.96)를 연기해야합니다. 신뢰 구간 당신은 약 100 ± 7.5 또는 92.5에서 107.5를 얻습니다.

또한 그 이유는 다음과 같다. 검정 된 값이 신뢰 구간 내에 있으면 가설과 모순되지 않습니다. 무작위 변동의 한계에 맞습니다 (95 % 확률로). 확인되는 점이 신뢰 구간을 벗어난 경우 이러한 이벤트의 확률은 최소한 아래로 매우 작습니다. 허용 수준... 따라서 가설은 관찰 된 데이터와 모순되는 것으로 기각됩니다. 우리의 경우 기대에 대한 가설은 신뢰 구간을 벗어 났으므로 (검증 된 값 90은 구간 100 ± 7.5에 포함되지 않음) 기각되어야합니다. 위의 기본 질문에 답하면 다음과 같이 말해야합니다. 아니요, 어떤 경우에도 이런 일이 극히 드물게 발생합니다. 동시에, 그들은 종종 신뢰 구간이 구축 된 특정 수준이 아니라 가설 (p- 수준)의 잘못된 기각 확률을 나타냅니다.

보시다시피 평균 (또는 수학적 기대치)에 대한 신뢰 구간을 구성하는 것은 어렵지 않습니다. 가장 중요한 것은 본질을 파악하는 것입니다. 실제로 대부분의 경우 95 % 신뢰 구간이 사용되며, 이는 평균의 양쪽에서 약 2 개의 표준 오차 폭입니다.

지금은 여기까지입니다. 모두 제일 좋다!

명령

점에 유의하시기 바랍니다 간격 (l1 또는 l2), 추정치가 될의 중심 영역 l * 및 매개 변수의 실제 값이 확률로 포함되는 경우에도 신뢰도가 될 것입니다 간격옴 또는 해당 신뢰 수준 알파. 이 경우 l * 자체는 포인트 추정치를 참조합니다. 예를 들어, 임의의 값 X (x1, x2, ..., xn)의 샘플 값 결과에 따라 분포가 의존하는 인덱스 l의 알 수없는 매개 변수를 계산해야합니다. 이 경우 주어진 매개 변수 l *의 추정치를 얻는 것은 각 샘플에 대해 대응하는 매개 변수의 특정 값, 즉 지표 Q의 관찰 결과 함수를 생성해야한다는 사실로 구성되며, 그 값은 공식의 형태로 매개 변수 l *의 추정 값과 동일하게 취해질 것입니다 : l * \u003d Q * (x1, x2, ..., xn).

관찰을 기반으로하는 모든 함수를 통계라고합니다. 또한 고려 된 매개 변수 (현상)를 완전히 설명하면 충분한 통계라고합니다. 그리고 관찰 결과가 랜덤이기 때문에 l *도 랜덤 변수가됩니다. 통계 계산 작업은 품질 기준을 고려하여 수행되어야합니다. 여기서 추정의 분포 법칙, 확률 밀도 분포 W (x, l)가 매우 명확하다는 것을 고려할 필요가 있습니다.

기밀을 계산할 수 있습니까? 간격 유통 법을 안다면 충분히 간단합니다. 예를 들어, 기밀 간격 수학적 기대치 ( 평균 크기 임의의 값) mx * \u003d (1 / n) * (x1 + x2 +… + xn). 이 추정치는 편향되지 않습니다. 즉, 수학적 기대치 또는 지표의 평균값이 매개 변수의 실제 값 (M (mx *) \u003d mx)과 동일합니다.

수학적 기대치 (bx * ^ 2 \u003d Dx / n)로 추정의 분산을 설정할 수 있습니다. 중심 극한 정리를 기반으로이 추정값의 분포 법칙이 가우스 (정규)라는 결론을 내릴 수 있습니다. 따라서 계산을 위해 확률의 적분 인 인덱스 Ф (z)를 사용할 수 있습니다. 이 경우 신뢰 기간을 선택하십시오. 간격그리고 2ld, 그래서 당신은 다음을 얻습니다 : alpha \u003d P (mx-ld (공식에 따라 확률 적분의 속성 사용 : Ф (-z) \u003d 1- Ф (z))).

신뢰 구축 간격 예상 추정치 :-공식의 값을 찾습니다 (알파 + 1) / 2;-확률 적분 표에서 ld / sqrt (Dx / n)와 같은 값을 선택합니다.-실제 분산 추정치를 취합니다. Dx * \u003d (1 / n) * ( (x1-mx *) ^ 2+ (x2-mx *) ^ 2 + ... + (xn-mx *) ^ 2);-ld 결정;-신뢰도 찾기 간격 공식에 따라 : (mx * -ld, mx * + ld).

종종 감정인은 감정 대상이 위치한 부문의 부동산 시장을 분석해야합니다. 시장이 개발되면 제시된 개체의 전체 집합을 분석하기 어려울 수 있으므로 개체 샘플을 분석에 사용합니다. 이 샘플은 항상 균질 한 것으로 판명되지는 않으며, 때로는 너무 높거나 낮은 시장 제안과 같은 극단을 제거해야합니다. 이 목적을 위해 적용됩니다 신뢰 구간... 이 연구의 목적은 신뢰 구간을 계산하는 두 가지 방법의 비교 분석을 수행하고 최선의 선택 estimatica.pro 시스템에서 다른 샘플로 작업 할 때 계산.

신뢰 구간은 알려진 확률로 일반 모집단의 추정 매개 변수를 포함하는 표본을 기준으로 계산 된 특성 값의 구간입니다.

신뢰 구간 계산의 의미는 추정 된 모수의 값이이 구간에있을 확률이 주어질 수 있도록 샘플 데이터를 기반으로 이러한 구간을 구성하는 것입니다. 즉, 특정 확률의 신뢰 구간에는 추정값의 알 수없는 값이 포함됩니다. 간격이 넓을수록 부정확성이 높아집니다.

신뢰 구간을 결정하는 방법에는 여러 가지가 있습니다. 이 기사에서는 두 가지 방법을 고려할 것입니다.

  • 중앙값과 표준 편차를 통해;
  • t- 통계 (학생의 계수)의 임계 값을 통해.

단계 비교 분석 다른 방법들 CI 계산 :

1. 데이터 샘플을 구성합니다.

2. 통계적 방법으로 처리합니다 : 평균, 중앙값, 분산 등을 계산합니다.

3. 우리는 두 가지 방법으로 신뢰 구간을 계산합니다.

4. 세척 된 샘플과 획득 한 신뢰 구간을 분석합니다.

1 단계. 데이터 샘플링

샘플은 estimatica.pro 시스템을 사용하여 형성되었습니다. 샘플은 판매를위한 91 제안을 포함 1 방 아파트 레이아웃 유형이 "Khrushchev"인 세 번째 가격 영역에서.

표 1. 초기 샘플

1 평방 미터의 가격, d.e.

그림 1. 초기 샘플



2 단계. 원본 샘플 처리

통계적 방법으로 샘플을 처리하려면 다음 값을 계산해야합니다.

1. 산술 평균

2. 중앙값-표본을 특징 짓는 숫자 : 표본의 정확히 절반은 중앙값보다 크고 나머지 절반은 중앙값보다 작습니다.

(홀수 값이있는 샘플의 경우)

3. 범위-샘플의 최대 값과 최소값의 차이

4. 분산-데이터 변동의보다 정확한 추정을 위해 사용됩니다.

5. 표본 표준 편차 (이하 RMS)는 산술 평균 주변의 조정 값 분산을 나타내는 가장 일반적인 지표입니다.

6. 변동 계수-조정 값의 분산 정도를 반영합니다.

7. 진동 계수-평균 주변 샘플 가격의 극단 값의 상대적 변동을 반영합니다.

표 2. 원본 샘플의 통계 지표

데이터의 균일 성을 특징으로하는 변동 계수는 12.29 %이지만 진동 계수가 너무 큽니다. 따라서 원래 표본이 동 질적이지 않다고 주장 할 수 있으므로 신뢰 구간 계산으로 넘어갑니다.

3 단계. 신뢰 구간 계산

방법 1. 중앙값과 표준 편차를 통한 계산.

신뢰 구간은 다음과 같이 결정됩니다. 최소값-표준 편차가 중앙값에서 뺍니다. 최대 값-표준 편차가 중앙값에 추가됩니다.

따라서 신뢰 구간 (CU 47179, CU 60689)

그림: 2. 신뢰 구간 1에 해당하는 값.



방법 2. t- 통계의 임계 값 (학생 계수)을 통한 신뢰 구간 구축

S.V. Gribovsky는 그의 저서 "물성의 가치 평가를위한 수학적 방법"에서 학생 계수를 통해 신뢰 구간을 계산하는 방법을 설명합니다. 이 방법으로 계산할 때 평가자 자신이 신뢰 구간을 구성 할 확률을 결정하는 유의 수준 ∝을 설정해야합니다. 0.1의 유의 수준이 일반적으로 사용됩니다. 0.05 및 0.01. 0.9의 신뢰 확률이 이에 해당합니다. 0.95 및 0.99. 이 방법을 사용하면 수학적 기대 및 분산의 실제 값이 실제로 알려지지 않은 것으로 가정됩니다 (실제 추정 문제를 해결할 때 거의 항상 사실임).

신뢰 구간 공식 :

n은 표본 크기입니다.

특수 통계표 또는 MS Excel을 사용하여 결정되는 유의 수준 ∝, 자유도 n-1을 갖는 t- 통계의 임계 값 (학생 분포) (→ "통계"→ STYUDRASPOBR);

∝-유의 수준, 우리는 ∝ \u003d 0.01을 취합니다.

그림: 2. 신뢰 구간 내 값 2.

4 단계. 다양한 신뢰 구간 계산 방법 분석

신뢰 구간을 계산하는 두 가지 방법-중앙값과 학생 계수를 통해- 다른 의미 간격. 따라서 우리는 두 가지 다른 청소 샘플을 얻었습니다.

표 3. 세 가지 샘플에 대한 통계 지표.

인덱스

초기 샘플

옵션 1

옵션 2

평균값

분산

Coef. 변형

Coef. 진동

폐기 된 개체 수, 개

수행 된 계산을 기반으로 얻은 다른 방법 신뢰 구간이 겹치므로 평가자의 재량에 따라 계산 방법을 사용할 수 있습니다.

그러나 estimatica.pro 시스템에서 작업 할 때 시장 개발 정도에 따라 신뢰 구간을 계산하는 방법을 선택하는 것이 좋습니다.

  • 시장이 미개발 상태 인 경우,이 경우 은퇴 대상의 수가 적기 때문에 중앙값과 표준 편차를 통한 계산 방법을 적용하십시오.
  • 시장이 개발되면 큰 초기 표본을 형성 할 수 있으므로 t- 통계 (학생 계수)의 임계 값을 통해 계산을 적용합니다.

기사를 준비 할 때 다음이 사용되었습니다.

1. Gribovsky S.V., Sivets S.A., Levykina I.A. 재산의 가치를 평가하기위한 수학적 방법. 모스크바, 2014

2. Estimatica.pro 시스템 데이터

신뢰 구간 추정

학습 목표

통계는 다음을 고려합니다. 두 가지 주요 작업:

    샘플 데이터를 기반으로 한 추정치가 있으며 추정 된 모수의 실제 값이 어디에 있는지에 대한 확률 적 설명을 작성하려고합니다.

    샘플 데이터를 기반으로 테스트해야하는 특정 가설이 있습니다.

이 주제에서는 첫 번째 작업을 고려합니다. 신뢰 구간의 정의도 소개합니다.

신뢰 구간은 추정 된 모수 값을 중심으로 구축 된 구간이며, 추정 된 모수의 실제 값이 사전에 지정된 확률로 어디에 있는지 보여줍니다.

이 주제에 대한 자료를 공부 한 후 다음을 수행합니다.

    추정치의 신뢰 구간이 무엇인지 알아 내십시오.

    통계 작업을 분류하는 법을 배웁니다.

    통계 공식과 소프트웨어 도구를 사용하여 신뢰 구간을 구성하는 기술을 습득합니다.

    정의하는 법을 배우다 필요한 치수 달성 할 샘플 특정 매개 변수 통계적 추정의 정확성.

표본 특성 분포

T 분포

위에서 설명한대로 배포 랜덤 변수 모수 0과 1로 표준화 된 정규 분포에 가깝습니다. σ의 값을 모르기 때문에이를 추정치 s로 대체합니다. 수량이 이미 다른 분포, 즉 또는 스튜던트 t 분포, 매개 변수 n -1 (자유도 수)에 의해 결정됩니다. 이 분포는 정규 분포에 가깝습니다 (n이 클수록 분포가 더 가깝습니다).

그림에서. 95
자유도가 30 인 학생 분포가 표시됩니다. 보시다시피 정규 분포에 매우 가깝습니다.

정규 분포 NORMDIST 및 NORMINV 작업을위한 함수와 유사하게 t- 분포 작업을위한 함수-TDIST 및 TINV... 이러한 기능을 사용하는 예는 TDIST.XLS 파일 (템플릿 및 솔루션) 및 그림에서 볼 수 있습니다. 96
.

다른 특성의 분포

이미 알고 있듯이 수학적 기대치 추정의 정확성을 결정하려면 t- 분포가 필요합니다. 분산과 같은 다른 모수를 추정하려면 다른 분포가 필요합니다. 그 중 두 가지는 F- 분포이고 x 2-배포.

평균에 대한 신뢰 구간

신뢰 구간 추정 된 매개 변수 값을 중심으로 구축 된 간격으로, 추정 된 매개 변수의 실제 값이 사전에 주어진 확률로 어디에 위치하는지 보여줍니다.

평균에 대한 신뢰 구간 구성이 발생합니다. 다음과 같이:

패스트 푸드 점은 새로운 형태의 샌드위치로 구색을 확대 할 계획이다. 이에 대한 수요를 추정하기 위해 관리자는 이미 시도한 방문자 중 40 명의 방문자를 무작위로 선택하여 신제품에 대한 태도를 1 ~ 10 점으로 평가하도록 초대 할 계획입니다. 관리자는받을 예상 포인트 수를 추정하려고합니다. 새로운 제품 이 추정치에 대한 95 % 신뢰 구간을 구축합니다. 어떻게 할 수 있습니까? (SANDWICH1.XLS 파일 참조 (템플릿 및 솔루션).

결정

이 문제를 해결하기 위해 사용할 수 있습니다. 결과는 Fig. 97
.

누적 값에 대한 신뢰 구간

때로는 샘플 데이터를 기반으로 수학적 기대치가 아니라 값의 총합을 추정해야합니다. 예를 들어, 감사인이있는 상황에서 계정의 평균 가치를 추정하는 것이 관심이 없을 수 있지만 모든 계정의 합계입니다.

N-요소의 총 수, n-표본 크기, T 3-표본 값의 합, T "-전체 \u200b\u200b모집단에 대한 합계 추정치 이고 신뢰 구간은 공식에 의해 계산됩니다. 여기서 s는 표본에 대한 표준 편차의 추정치이고, s는 표본에 대한 평균의 추정치입니다.

일부 세무서에서 납세자 10,000 명의 총 세금 환급액을 추정하려고한다고 가정 해 보겠습니다. 납세자는 환급을 받거나 추가 세금을 지불합니다. 표본 크기가 500 명이라고 가정하고 환불 금액에 대한 95 % 신뢰 구간을 찾습니다 (RETURNS SUM.XLS (템플릿 및 솔루션) 참조).

결정

이 경우 StatPro에는 특별한 절차가 없지만, 위의 공식을 기반으로 한 평균의 경계에서 경계를 얻을 수 있음을 알 수 있습니다 (그림 98).
).

비율에 대한 신뢰 구간

p를 고객 점유율의 수학적 기대 값으로, 크기 n의 표본에서 얻은이 점유율 추정치의 p라고합시다. 충분히 큰 경우 추정값의 분포는 평균 p와 표준 편차가있는 정규 분포에 가깝습니다. ... 추정치의 표준 오차 이 경우 다음과 같이 표현 , 신뢰 구간은 .

패스트 푸드 점은 새로운 형태의 샌드위치로 구색을 확대 할 계획이다. 이에 대한 수요를 추정하기 위해 관리자는 이미 시도한 방문자 중 40 명의 방문자를 무작위로 선택하여 신제품에 대한 태도를 1 ~ 10 점으로 평가하도록 초대했습니다. 6 점 이상입니다 (그는 이러한 고객이 신제품의 소비자 일 것으로 예상합니다).

결정

처음에는 클라이언트의 점수가 6 점 이상이면 1을, 그렇지 않으면 0을 기반으로 새 열을 만듭니다 (SANDWICH2.XLS 파일 (템플릿 및 솔루션) 참조).

방법 1

숫자 1을 세고 점유율을 추정 한 다음 공식을 사용합니다.

z cr 값은 정규 분포의 특수 테이블에서 가져옵니다 (예 : 95 % 신뢰 구간의 경우 1.96).

이 접근법과 특정 데이터를 사용하여 95 % 간격을 구성하면 다음과 같은 결과를 얻을 수 있습니다 (그림 99
). 매개 변수 z cr의 임계 값은 1.96입니다. 추정치의 표준 오차는 0.077입니다. 신뢰 구간의 하한은 0.475입니다. 신뢰 구간의 상한은 0.775입니다. 따라서 관리자는 신제품을 6 점 이상으로 평가 한 고객의 비율이 47.5에서 77.5 사이가 될 것이라고 95 % 확신 할 권리가 있습니다.

방법 2

이 작업은 표준 StatPro 도구를 사용하여 해결할 수 있습니다. 이렇게하려면이 경우 점유율이 유형 열의 평균 값과 일치한다는 점에 유의하면됩니다. 그런 다음 신청합니다 StatPro / 통계적 추론 / 단일 샘플 분석 유형 열에 대한 평균의 신뢰 구간 (예상 값 추정)을 작성합니다. 이 경우 얻은 결과는 첫 번째 방법의 결과에 매우 가깝습니다 (그림 99).

표준 편차에 대한 신뢰 구간

표준 편차의 추정치로 s가 사용됩니다 (공식은 섹션 1에 제공됨). 추정값 s의 밀도 함수는 t- 분포와 마찬가지로 n-1 자유도를 갖는 카이 제곱 함수입니다. 이 CHIDIST 및 CHIINV 배포 작업을위한 특수 기능이 있습니다.

이 경우 신뢰 구간은 더 이상 대칭이 아닙니다. 조건부 체계 경계는 Fig. 백.

기계는 직경 10cm의 부품을 생산해야하지만 다양한 상황으로 인해 오류가 발생합니다. 품질 관리자는 두 가지 사항을 고려합니다. 첫째, 평균은 10cm 여야합니다. 둘째,이 경우에도 편차가 크면 많은 부품이 거부됩니다. 그는 매일 50 개 부품의 샘플을 만듭니다 (QUALITY CONTROL.XLS 파일 참조 (템플릿 및 솔루션). 이러한 샘플은 어떤 결론을 내릴 수 있습니까?

결정

다음을 사용하여 평균 및 표준 편차에 대한 95 % 신뢰 구간을 플로팅합니다. StatPro / 통계적 추론 / 단일 샘플 분석 (그림 101
).

또한 직경의 정규 분포를 가정하여 불량 제품의 비율을 계산하여 최대 편차를 0.065로 설정합니다. 대체 테이블 (두 매개 변수의 경우)의 기능을 사용하여 평균 및 표준 편차에 대한 결혼률의 의존성을 구성합니다 (그림 102
).

두 평균의 차이에 대한 신뢰 구간

이것은 통계적 방법의 가장 중요한 응용 프로그램 중 하나입니다. 상황의 예.

    의류 매장 관리자는 평균적인 여성 쇼핑객이 남성보다 매장에서 지출하는 금액을 알고 싶어합니다.

    두 항공사는 비슷한 노선을 운항합니다. 소비자 조직은 두 항공사의 평균 예상 비행 지연 간의 차이를 비교하려고합니다.

    회사는 한 도시에서 특정 유형의 상품에 대한 쿠폰을 발송하고 다른 도시에서는 발송하지 않습니다. 관리자는 향후 2 개월 동안 이러한 항목의 평균 구매량을 비교하려고합니다.

    자동차 딜러는 종종 프레젠테이션에서 결혼 한 부부를 다룹니다. 커플은 종종 프레젠테이션에 대한 개인적인 반응을 이해하기 위해 개별적으로 인터뷰합니다. 관리자는 남성과 여성이보고 한 등급의 차이를 평가하려고합니다.

독립 샘플 사례

평균값의 차이는 n 1 + n 2-2 자유도의 t- 분포를 갖습니다. μ 1-μ 2에 대한 신뢰 구간은 다음 비율로 표현됩니다.

이 작업은 위의 공식뿐만 아니라 표준 StatPro 도구로도 해결할 수 있습니다. 이를 위해 적용하기에 충분합니다.

비율 차이에 대한 신뢰 구간

주식의 수학적 기대치가 되십시오. 각각 크기가 n 1 및 n 2 인 샘플로 구성된 샘플 추정치로합시다. 그런 다음 차이에 대한 추정치입니다. 따라서이 차이에 대한 신뢰 구간은 다음과 같이 표현됩니다.

여기서 z cr은 특수 테이블에 따라 정규 분포에서 얻은 값입니다 (예 : 95 % 신뢰 구간의 경우 1.96).

이 경우 추정치의 표준 오차는 다음 비율로 표현됩니다.

.

매장은 큰 판매를 준비하기 위해 다음과 같은 시장 조사를 수행했습니다. 300 개 선택 베스트 바이어, 차례로 무작위로 150 명씩 두 그룹으로 나뉘 었습니다. 선발 된 모든 바이어들에게 세일 참여 초대를 받았지만, 첫 번째 그룹의 회원들에게만 5 % 할인을받을 수있는 쿠폰이 제공되었습니다. 판매 기간 동안 선정 된 300 명의 모든 구매자의 구매가 기록되었습니다. 관리자는 어떻게 결과를 해석하고 쿠폰 전달의 효과에 대한 결론을 내릴 수 있습니까? (COUPONS.XLS 파일 (템플릿 및 솔루션) 참조).

결정

특별한 경우에는 할인 쿠폰을받은 150 명의 구매자 중 55 명은 세일로 구매했고, 쿠폰을받지 못한 150 명 중 35 명만이 구매했다 (그림 103).
). 그런 다음 샘플 비율의 값은 각각 0.3667과 0.2333입니다. 그리고 그들 사이의 샘플 차이는 각각 0.1333입니다. 신뢰 구간이 95 %라고 가정하면 정규 분포표에서 z cr \u003d 1.96을 찾습니다. 표본 차이의 표준 오차 계산은 0.0524입니다. 마지막으로 95 % 신뢰 구간의 하한은 0.0307이고 상한은 각각 0.2359입니다. 결과는 할인 쿠폰을받는 100 명의 고객 당 3 ~ 23 명의 신규 고객을 기대할 수 있다는 의미로 해석 될 수 있습니다. 그러나이 결론 자체는 아직 쿠폰 사용의 효과를 의미하지는 않습니다 (할인을 제공함으로써 우리는 이익을 잃습니다!). 이를 특정 데이터로 시연 해 보겠습니다. 평균 구매 크기가 400 루블이고 그중 50 루블이라고 가정합니다. 상점 이익이 있습니다. 쿠폰을받지 못한 구매자 100 명당 예상 수익은 다음과 같습니다.

50 0.2333100 \u003d 1166.50 루블.

쿠폰을받은 100 명의 구매자에 대한 유사한 계산은 다음과 같습니다.

30 0.3667100 \u003d 1100.10 루블.

평균 이익이 30으로 감소하는 것은 할인을 사용하여 쿠폰을받은 고객이 평균 380 루블을 구매한다는 사실 때문입니다.

따라서 최종 결론은 이러한 특정 상황에서 이러한 쿠폰을 사용하는 것이 비효율적임을 말합니다.

논평. 이 작업은 표준 StatPro 도구를 사용하여 해결할 수 있습니다. 이를 위해서는이 문제를 방법으로 두 평균의 차이를 추정하는 문제로 축소 한 다음 적용하면됩니다. StatPro / 통계적 추론 / 2- 샘플 분석 두 평균값 간의 차이에 대한 신뢰 구간을 구축합니다.

신뢰 구간 길이 제어

신뢰 구간의 길이는 다음에 따라 달라집니다. 다음 조건 :

    직접 데이터 (표준 편차);

    유의 수준;

    표본의 크기.

평균을 추정하기위한 표본 크기

먼저 일반적인 경우의 문제를 고려하십시오. 우리에게 주어진 신뢰 구간 길이의 절반을 B로 지정합시다 (그림 104
). 일부 랜덤 변수 X의 평균값에 대한 신뢰 구간은 다음과 같이 표현됩니다. 어디 ... 가정 :

n을 표현하면 얻을 수 있습니다.

불행히도 우리는 확률 변수 X의 분산의 정확한 값을 알지 못합니다. 또한 t cr의 값은 자유도 수에 따라 n에 의존하기 때문에 알 수 없습니다. 이 상황에서 우리는 다음과 같이 진행할 수 있습니다. 분산 s 대신 연구중인 랜덤 변수의 사용 가능한 실현을 기반으로 분산 추정치를 사용합니다. t cr 값 대신 정규 분포에 z cr 값을 사용합니다. 정규 분포와 t- 분포에 대한 분포 밀도 함수가 매우 가깝기 때문에 (작은 n의 경우 제외) 이는 상당히 수용 가능합니다. 따라서 원하는 공식은 다음과 같은 형식을 취합니다.

.

공식은 일반적으로 정수가 아닌 결과를 제공하므로 필요한 샘플 크기는 결과를 초과하는 것으로 간주됩니다.

패스트 푸드 점은 새로운 형태의 샌드위치로 구색을 확대 할 계획이다. 이에 대한 수요를 평가하기 위해 관리자는 이미 시도한 방문자 중 특정 수의 방문자를 무작위로 선택하여 신제품에 대한 태도를 1 ~ 10 점으로 평가하도록 초대 할 계획입니다. 관리자는 새로운 제품이받을 예상 점수를 추정하려고합니다. 이 추정치에 대한 95 % 신뢰 구간을 구축하십시오. 동시에 그는 신뢰 구간 너비의 절반이 0.3을 초과하지 않기를 원합니다. 얼마나 많은 방문자를 인터뷰해야합니까?

다음과 같이 :

여기 로츠 분수 p의 추정치이고 B는 주어진 신뢰 구간 길이의 절반입니다. n에 대한 과대 평가는 값을 사용하여 얻을 수 있습니다. 로츠 \u003d 0.5. 이 경우 신뢰 구간의 길이는 p의 실제 값에 대해 주어진 B 값을 초과하지 않습니다.

이전 예의 관리자가 새로운 유형의 제품을 선호하는 고객의 비율을 추정하도록 계획합니다. 90 % 신뢰 구간을 작성하려고합니다.이 구간의 절반은 0.05를 초과하지 않습니다. 무작위 샘플에 몇 명의 클라이언트를 포함해야합니까?

결정

우리의 경우 z cr \u003d 1.645의 값입니다. 따라서 필요한 금액은 다음과 같이 계산됩니다. .

관리자가 p의 원하는 값이 예를 들어 약 0.3이라고 믿을만한 이유가있는 경우이 값을 위의 공식에 대입하면 더 작은 랜덤 샘플 값, 즉 228을 얻을 수 있습니다.

결정을위한 공식 두 평균이 다른 경우 무작위 표본 크기 다음과 같이 작성 :

.

일부 컴퓨터 회사에는 고객 서비스 센터가 있습니다. 최근에는 서비스 품질 저하에 대한 고객 불만이 증가하고 있습니다. 에 서비스 센터 주로 두 가지 유형의 직원이 일합니다. 좋은 경험, 그러나 특별 준비 과정을 이수하 고 광범위한 실무 경험이 있지만 특별 과정을 완료하지 않은 사람. 이 회사는 지난 6 개월 동안의 고객 불만을 분석하고 두 그룹의 직원 각각에 대한 평균 수치를 비교하려고합니다. 두 그룹에 대한 샘플의 수량이 동일하다고 가정합니다. 절반 길이가 2 이하인 95 % 간격을 얻으려면 표본에 몇 명의 직원이 포함되어야합니까?

결정

여기서 σ оц는 두 확률 변수가 가깝다는 가정하에 두 확률 변수의 표준 편차 추정치입니다. 따라서 우리의 임무에서 우리는 어떻게 든이 추정치를 얻어야합니다. 예를 들어 다음과 같이 수행 할 수 있습니다. 지난 6 개월 동안의 고객 불만 데이터를 살펴보면 관리자는 각 직원에 대해 주로 6 ~ 36 개의 불만이 있음을 알 수 있습니다. 정규 분포의 경우 거의 모든 값이 평균에서 3 표준 편차를 넘지 않는다는 것을 알기 때문에 그는 다음과 같이 합리적으로 믿을 수 있습니다.

, 어디서 σ оц \u003d 5.

이 값을 공식에 \u200b\u200b대입하면 .

결정을위한 공식 주식 간의 차이를 추정하는 경우 무작위 표본의 크기 다음과 같이 보입니다.

어떤 회사에는 유사한 제품을 생산하는 두 개의 공장이 있습니다. 한 회사 관리자가 두 공장의 불량품 비율을 비교하려고합니다. 사용 가능한 정보에 따르면 두 공장의 불량률은 3 ~ 5 %입니다. 길이의 절반이 0.005 (또는 0.5 %) 이하인 99 % 신뢰 구간을 구축해야합니다. 각 공장에서 몇 개의 품목을 가져와야합니까?

결정

여기서 p 1ots와 p 2ots는 1 공장과 2 공장에서 알려지지 않은 두 개의 불량률을 추정 한 것입니다. p 1ots \u003d p 2ots \u003d 0.5를 넣으면 n에 대해 과대 평가 된 값을 얻습니다. 그러나 우리의 경우에는 이러한 주식에 대한 사전 정보가 있으므로 이러한 주식의 상위 추정치 인 0.05를 취합니다. 우리는

모집단의 일부 모수를 표본 데이터에서 추정 할 때 모수의 점 추정치뿐만 아니라 추정 된 모수의 정확한 값이 위치 할 수있는 위치를 나타내는 신뢰 구간을 표시하는 것도 유용합니다.

이 장에서는 다양한 매개 변수에 대해 이러한 간격을 구축 할 수있는 정량적 비율에 대해서도 알게되었습니다. 신뢰 구간의 길이를 제어하는 \u200b\u200b방법을 배웠습니다.

또한 샘플 크기를 추정하는 문제 (실험 계획 문제)는 표준 StatPro 도구를 사용하여 해결할 수 있습니다. StatPro / 통계적 추론 / 샘플 크기 선택.

이 공유