신뢰 간격이 필요한 것은 무엇입니까? 샘플 및 신뢰 구간

통계적 문제를 해결하기위한 방법 중 하나는 신뢰 구간의 계산입니다. 작은 샘플링을 사용하여 점 추정치에 대한보다 바람직한 대안으로 사용됩니다. 신뢰 구간을 계산하는 과정은 다소 복잡하다는 것을 알아야합니다. 그러나 Excel 프로그램의 도구를 사용하면 쉽게 단순화 할 수 있습니다. 실제로 어떻게 수행되는지 알아 보겠습니다.

이 방법은 다양한 통계 값의 간격 추정치에 사용됩니다. 이 계산의 주요 작업은 점 추정의 불확실성을 제거하는 것입니다.

Excel 에서이 방법을 사용하여 계산을 할 수있는 두 가지 주요 옵션이 있습니다. 분산이 알려지지 않은 경우, 알 수 없을 때. 첫 번째 경우에는 함수가 계산에 사용됩니다. 신뢰. 정규그리고 두 번째 - 신뢰. 학생.

방법 1 : 기능 트러스트. 정상

운영자 신뢰. 정규Statistical Service와 관련된 기능 그룹이 Excel 2010에 처음 나타났습니다.이 프로그램의 이전 버전에서는 아날로그가 사용됩니다. 믿음...에 이 연산자의 작업은 평균에 대해 정상적인 분포로 신뢰 구간을 계산하는 것입니다. 일반 집계.

그 구문은 다음과 같습니다.

신뢰. 노르나 (알파, 표준 찌알; 크기)

"알파" - 신뢰 수준을 계산하는 데 사용되는 중요도 수준을 나타내는 인수. 신뢰 수준은 다음 식과 동일합니다.

(1- "알파") * 100.

"표준 편차" - 이것은 논쟁이며, 이는 이름에서 이해할 수있는 본질입니다. 이것은 제안 된 샘플의 표준 편차입니다.

"크기" - 샘플의 크기를 결정하는 인수입니다.

이 운영자의 모든 인수는 필수 항목입니다.

함수 믿음 이전의 주장과 기회가 정확히 있습니다. 그 구문은 다음과 같습니다.

신뢰 (alpha, standard_otchal; 크기)

보시다시피, 운영자의 이름에서만 차이점이 있습니다. 호환성을위한이 기능은 Excel 2010 및 특수 카테고리의 최신 버전에 남아 있습니다. "적합성"...에 Excel 2007 및 이전 버전에서는 통계 운영자의 주요 그룹에 있습니다.

신뢰 구간의 경계는 다음 형식의 공식에 의해 결정됩니다.

x + (-) 신뢰. 정상

어디 엑스.- 선택된 범위의 중간에있는 평균 선택적 값입니다.

이제 신뢰 구간을 계산하는 방법을 살펴 보겠습니다. 특정 예제...에 12 테스트가 실시되었는데,이 결과는 테이블에 등록 된 다양한 결과를 얻었다. 이것은 우리의 전체입니다. 표준 편차는 8입니다. 우리는 97 %의 신뢰 수준의 신뢰 구간을 계산해야합니다.

  1. 데이터 처리 결과가 표시되는 셀을 선택하십시오. 버튼을 클릭하십시오 "함수 삽입".
  2. 보입니다 기능의 마스터...에 카테고리로 이동하십시오 "통계" 이름을 할당하십시오 "신뢰. 노마"...에 그 후 우리는 버튼을 찰칩니다 확인.
  3. 인수 창이 열립니다. 그 필드는 자연스럽게 인수의 이름에 해당합니다.
    첫 번째 필드에 커서를 설치하십시오 - "알파"...에 여기서 우리는 중요성 수준을 나타내야합니다. 우리가 기억하는 것처럼 신뢰 수준은 97 %와 같습니다. 동시에, 우리는 이런 식으로 계산되었다고 말했습니다.

    (1 레벨 신뢰도) / 100.

    즉, 가치를 대체하고, 우리는 다음과 같습니다.

    간단한 계산은 인수를 알아보십시오 "알파" 갈가마귀 0,03 ...에 우리는 입장합니다 이 값 들판에서.

    알다시피, 조건에서 표준 편차는 동일합니다. 8 ...에 그러므로 현장에서 "표준 편차" 이 번호를 작성하십시오.

    들판에서 "크기" 테스트의 요소 수를 입력해야합니다. 우리는 어떻게 그들을 기억합니까? 12 ...에 그러나 수식을 자동화하고 새 테스트 중에 매번 편집하지 않으려면이 값을 기존 숫자로 설정하지만 운영자의 도움으로 수식을 설정하십시오. 점수...에 따라서 필드에 커서를 설정하십시오 "크기"그런 다음 수식 문자열의 왼쪽에있는 삼각형을 클릭하십시오.

    새로 적용되는 기능 목록이 나타납니다. 운영자 인 경우 점수 최근에 적용한 다음이 목록에 있어야합니다. 이 경우 이름을 클릭하면됩니다. 반대편에있는 경우, 그것을 찾지 못하면 항목을 통과하십시오. "다른 기능 ...".

  4. 이미 이미 익숙해졌습니다 기능의 마스터...에 다시 우리는 그룹으로 이동합니다 "통계"...에 우리는 그곳에서 이름을 할당합니다 "점수"...에 찰흙 버튼 확인.
  5. 위의 연산자의 인수 창이 나타납니다. 이 함수는 숫자 값을 포함하는 지정된 범위의 셀 수를 계산하기위한 것입니다. 구문은 다음과 같습니다.

    계정 (value1; value2; ...)

    인수의 그룹 "가치" 숫자 데이터로 채워진 셀 수를 계산 해야하는 범위의 참조입니다. 전체적으로 255 개의 인수가있을 수 있지만, 우리의 경우에는 하나만 필요합니다.

    필드에 커서를 설치하십시오 "value1" 왼쪽 마우스 버튼을 누르면 우리는 우리의 전체가 들어있는 시트의 범위를 할당합니다. 그런 다음 해당 주소가 필드에 표시됩니다. 찰흙 버튼 확인.

  6. 그 후, 응용 프로그램은 계산을 만들고 그 자체가있는 셀에서 결과를 출력합니다. 우리의 특별한 경우에는 공식 이이 종류로 밝혀졌습니다.

    신뢰. 정상 (0.03, 8, 점수 (B2 : B13))

    계산의 전반적인 결과는 5,011609 .

  7. 그러나 그것은 전부는 아닙니다. 우리가 기억하는 것처럼, 신뢰 구간의 경계는 계산 결과의 평균 선택적 값으로부터 추가 및 빼는 것으로 계산됩니다. 신뢰. 정규...에 이러한 방식으로 신뢰 구간의 오른쪽 및 왼쪽 제한이 계산됩니다. 평균 선택적 값은 운영자를 사용하여 계산할 수 있습니다. srnzoke..

    이 연산자는 선택한 숫자 수의 평균 산술 값을 계산하도록 설계되었습니다. 그것은 꽤 간단한 구문을 가지고 있습니다.

    srvnov (number1; number2; ...)

    논의 "번호" 그것은 둘 다 별도의 숫자 값과 셀을 포함하는 셀 또는 심지어 포함하는 범위 일 수 있습니다.

    따라서 평균값 계산이 출력되는 셀을 선택하고 버튼을 클릭하십시오. "함수 삽입".

  8. 열리기 기능의 마스터...에 카테고리로 가십시오 "통계" 목록 이름에서 선택하십시오 "srnnak"...에 언제나처럼, 찰흙 확인.
  9. 인수 창이 시작됩니다. 필드에 커서를 설치하십시오 "number1" 마우스 왼쪽 버튼을 사용하면 전체 값 범위를 강조 표시합니다. 좌표가 필드에 표시되면 버튼의 점토 확인.
  10. 그후에 srnzoke. 계산 결과를 잎 요소에 표시합니다.
  11. 우리는 신뢰 구간의 올바른 한계를 계산합니다. 이렇게하려면 별도의 셀을 강조 표시하고 부호를 둡니다. «=» 그리고 우리는 기능 계산 결과가있는 시트 요소의 내용을 접습니다. srnzoke.신뢰. 정규...에 계산을 수행하려면 키를 누릅니다. 시작하다...에 우리의 경우 다음 공식이 밝혀졌습니다.

    계산 결과 : 6,953276

  12. 같은 방식으로, 우리는 계산 결과에 대해서만 신뢰 구간의 왼쪽 경계의 계산을 생성합니다. srnzoke. 운영자의 계산 결과를 가져옵니다 신뢰. 정규...에 그것은 다음 유형의 예의 예를위한 수식을 꺼냅니다.

    계산 결과 : -3,06994

  13. 우리는 모든 조치를 자세히 계산하기 위해 모든 행동을 설명하려고 시도하여 각 수식을 자세히 설명했습니다. 그러나 모든 조치를 하나의 수식으로 연결할 수 있습니다. 신뢰 구간의 권리 경계의 계산은 다음과 같이 작성할 수 있습니다.

    srvnow (b2 : b13) + 신뢰. 정상 (0.03, 8, 점수 (B2 : B13))

  14. 왼쪽 테두리의 유사한 계산은 다음과 같습니다.

    SRNAVOV (B2 : B2 : B2) - 고용. 노마 (0.03, 8, 점수 (B2 : B13))

방법 2 : 기능 트러스트.

또한 신뢰 구간의 계산과 관련된 Excele의 또 다른 기능이 있습니다. 신뢰. 학생...에 Excel 2010에서만 시작합니다.이 운영자는 학생의 유통을 사용하여 일반 인구 신뢰 구간 계산을 수행합니다. 분산액을 사용하는 것이 매우 편리하며 따라서 표준 편차가 알려지지 않았습니다. 운영자의 구문은 다음과 같습니다.

신뢰 .styudient (알파, 표준 찌알; 크기)

우리가 보듯 이이 경우 운영자의 이름은 변경되지 않았습니다.

이전 방법에서 고려한 것과 동일한 전체의 전체의 예에서 알 수없는 표준 편차로 신뢰 구간의 경계를 계산하는 방법을 살펴 보겠습니다. 마지막으로 97 %를 차지하는 자신감 수준.

  1. 우리는 계산이 이루어질 셀을 강조 표시합니다. 찰흙 버튼 "함수 삽입".
  2. 개방에서 마법사 기능 카테고리로 이동하십시오 "통계"...에 이름을 선택하십시오 "신뢰."...에 찰흙 버튼 확인.
  3. 지정된 운영자의 인수의 인수가 시작됩니다.

    들판에서 "알파", 자신감 수준이 97 %이며, 숫자를 기록하십시오. 0,03 ...에 이 매개 변수의 계산의 원칙에 대한 두 번째 시간은 멈추지 않습니다.

    그 후에 필드에 커서를 설정하십시오 "표준 편차"...에 이번에이 표시등은 알 수 없으며이를 계산해야합니다. 이것은 특별한 기능을 사용하여 수행됩니다. standotclona.v....에 이 연산자의 창을 호출하려면 수식 문자열의 왼쪽으로 삼각형을 클릭하십시오. 열리는 목록에 올바른 이름을 찾지 못하면 항목을 통과하십시오. "다른 기능 ...".

  4. 달리는 기능의 마스터...에 우리는 카테고리로 이동합니다 "통계" 그 이름을 축하합니다 "Standotclona.v"...에 그런 다음 버튼을 찰칩니다 확인.
  5. 인수 창이 열립니다. 작업 연산자 standotclona.v. 샘플링 할 때 표준 편차의 정의입니다. 그 구문은 다음과 같습니다.

    standotclone.v (number1; number2; ...)

    인수를 추측하는 것은 어렵지 않습니다 "번호" - 이것은 샘플 요소의 주소입니다. 샘플을 단일 배열에 배치하면 하나의 인수 만 사용하는 경우이 범위에 대한 링크를 제공 할 수 있습니다.

    필드에 커서를 설치하십시오 "number1" 그리고 언제나처럼 마우스 왼쪽 버튼을 누르면 전체를 할당합니다. 좌표가 필드에 닿은 후, 버튼을 눌러 서두르지 마십시오. 확인결과가 잘못 될 것입니다. 우리는 먼저 운영자의 인수로 돌아갈 필요가 있습니다. 신뢰. 학생마지막 주장을 만듭니다. 이렇게하려면 수식 행에서 해당 이름을 클릭하십시오.

  6. 인수 창이 다시 대체됩니다. 필드에 커서를 설치하십시오 "크기"...에 다시 말은, 이미 익숙한 삼각형을 클릭하여 운영자 선택을 위해 이동하십시오. 당신이 이해할 때, 우리는 이름이 필요합니다 "점수"...에 이전 방법에서 계산할 때이 기능을 사용했기 때문에이 목록에 있으므로 클릭하십시오. 그것을 감지하지 못하면 첫 번째 방법에 설명 된 알고리즘에 따라 작동하십시오.
  7. 인수 창을 치는 것 점수, 필드에 커서를 넣으십시오 "number1" 그리고 클램핑 마우스 버튼을 사용하면 세트를 강조 표시합니다. 그런 다음 버튼을 찰칩니다 확인.
  8. 그 후, 프로그램은 계산을 만들고 신뢰 구간의 값을 표시합니다.
  9. 경계를 결정하려면 다시 평균 샘플 값을 계산해야합니다. 그러나 수식의 도움을 받아 계산 알고리즘이 srnzoke. 이전 방법과 동일하고 결과조차도 변경되지 않았으므로 두 번째로 자세히 멈추지 않습니다.
  10. 계산 결과 접기 srnzoke.신뢰. 학생우리는 신뢰 구간의 올바른 경계를 얻습니다.
  11. 운영자 계산 결과에서 언급 srnzoke. 계산의 결과 신뢰. 학생우리는 신뢰 구간의 왼쪽 제한을 \u200b\u200b가지고 있습니다.
  12. 계산이 한 공식으로 쓰기가되는 경우, 우리의 경우의 오른쪽 테두리 계산은 다음과 같습니다.

    srnavov (B2 : B13) + 신뢰 .styudient (0.03, StandotClonal.v (b2 : b13); 계정 (B2 : B13))

  13. 따라서 왼쪽 경계를 계산하는 공식은 다음과 같습니다.

    SRNAVOV (B2 : B2 : B13) - 등급 (0.03; StandotClone)

보시다시피 Excel의 도구는 신뢰 구간과 경계의 계산을 크게 촉진합니다. 이러한 목적을 위해 개별 연산자는 분산이 알려지지 않은 샘플에 사용됩니다.

et al. 그들 모두는 처분 할 때 샘플이 아닌 경우 얻을 수있는 이론적 유사체의 추정치이지만 일반적인 집합체입니다. 그러나 아아, 일반적인 집계는 매우 비싸고 종종 사용할 수 없습니다.

간격의 개념

어떤 선택적 평가에는 몇 가지 흩어져 있습니다 특정 샘플의 값에 따라 임의의 변수입니다. 따라서 더 신뢰할 수있는 통계적 결론을 위해 점 추정치뿐만 아니라 가능성이 높아지는 간격도 알려져야합니다. γ (감마) 추정 표시기를 다룹니다 θ (TETA).

공식적으로, 이들은 두 가지 값 (통계) T 1 (x)T 2 (x), 뭐 t 1.< T 2 주어진 수준의 확률로 γ 조건이 만족합니다.

짧은, 확률로 γ 또는 더 많은 진정한 지표가 점 사이에 있습니다 T 1 (x)T 2 (x)아래쪽과 상한 호출 기밀 간격.

건설 간격 조건 중 하나는 최대 좁은 I.E. 그것은 짧은만큼 짧아야합니다. 욕망은 아주 자연 스럽습니다 연구원은 원하는 매개 변수의 기초를보다 정확하게 찾으려고 노력하고 있습니다.

신뢰 구간은 분포의 최대 확률을 충족해야합니다. 점수 자체가 중앙에있는 것입니다.

당신은 더 작은면에서 편차 확률과 동일한 편차 (평가의 진정한 지표)의 확률을 의미합니다. 비대칭 분포의 경우 오른쪽의 간격은 왼쪽의 간격과 같지 않다는 점에 유의해야합니다.

이 그림에서 더 넓은 간격은 직접적인 의존성이 더욱 확률이 높아지는 것은 명확하게 나타냅니다.

알 수없는 매개 변수의 간격 추정 이론에 대한 작은 입문 부분이었습니다. 우리가 수학적 기대를 위해 자신감 테두리를 찾는 것으로 보도록하십시오.

수학적 기대를위한 신뢰 간격

초기 데이터가 소프트웨어에 의해 배포되면 평균은 크기보다 정상적입니다. 이것은 정상 값의 선형 조합이 정상적인 분포를 갖는 규칙에서 다음과 같습니다. 따라서 확률을 계산하기 위해 우리는 정상적인 분배법의 수학적 장치를 사용할 수 있습니다.

그러나 일반적으로 일반적으로 알려지지 않은 MatchMaker 및 Dispersion이라는 두 가지 매개 변수를 알아야합니다. 당연히 평균의 분포가 정상적이지는 않지만 평균의 배포가 아닌 매개 변수가 아닌 매개 변수 대신에 책을 조금 강화 할 것입니다. 이 사실은 1908 년 Biometrina Magazine의 3 월호 발행에서 그의 개봉을 출판하여 아일랜드에서 시민 윌리엄 교지를 비난하게 통보했다. 음모의 목적을 위해, Gsset은 스테이 타가 서명했습니다. 그래서 학생의 T 배포가 나타났습니다.

그러나 K. Gauss가 사용하는 데이터의 정상적인 분포는 지구의 삶에서 천문 관찰의 오류를 분석 할 때 매우 드물게 꽤 드물게되어 매우 어렵습니다 ( 높은 정확도 약 2,000 개의 관찰이 있습니다). 따라서 정상도의 가정은 소스 데이터의 분포에 의존하지 않는 방법을 버리고 사용하는 것이 가장 좋습니다.

문제가 발생합니다 : 알 수없는 분포의 데이터에 따라 계산 된 경우 평균 산술의 분포는 무엇입니까? 대답은 확률 이론에 알려져 있습니다 중앙 제한 정리. (CPT). 수학에서는 여러 가지 옵션이 있습니다 ( 오랜 세월 동안 문구가 명시되었지만 대략 말하기는 대략 말하기 승인으로 감소되어 정상적인 유통 법이 적용됩니다.

평균 산술을 계산할 때 랜덤 변수의 양이 사용됩니다. 여기서는 산술 평균이 많은 생물학적 데이터를 가진 정상적인 분포를 가지고 있으며, 분산액이 많다는 것을 밝혀 낸다.

똑똑한 사람 조건은 CPT를 증명할 수 있지만 Excel에서 수행 된 실험의 도움 으로이 사실을 확신 할 것입니다. 우리는 50 개의 균일하게 분산 된 무작위 변수를 시뮬레이션합니다 (영구의 Excel 기능을 사용하여). 그런 다음 1000 개의 샘플을 만들고 각각 우리는 평균 산술을 계산합니다. 그들의 분포를 살펴 보겠습니다.

정상 법칙에 가까운 매체의 분포를 볼 수 있습니다. 샘플의 크기와 양의 수량이 더 훨씬 더 멀리 있으면 유사성이 더 좋을 것입니다.

이제 우리가 TPT의 정의에서 정교함을 확신 할 때, 중간 크기의 산술의 신뢰 구간을 계산하는 것이 가능하며, 주어진 확률은 진정한 평균 또는 수학적 기대를 충당합니다.

상한 및 하한을 설정하려면 정규 분포의 매개 변수를 알아야합니다. 규칙으로서, 그들은 예상치가 사용되지 않습니다. 중간 산술선택적 분산...에 이 방법은 큰 샘플에 대해서만 좋은 접근을 제공합니다. 샘플이 작 으면 학생의 유통을 사용하는 것이 종종 권장됩니다. 믿을 수 없어! 학생의 평균에 대한 분포는 초기 데이터가 정상적인 분포가있는 경우에만 거의 결코 그렇지 않습니다. 따라서 필요한 데이터의 수에 대해 즉시 최소한의 막대를 넣는 것이 낫습니다. 비자 적으로 올바른 방법을 사용하십시오. 그들은 충분한 관찰이 충분하다고 말합니다. 50 - 실수하지 마십시오.

T 1.2. - 신뢰 구간의 하한 및 상한선

- 선택적 산술 평균

0. - 평균 2 차 샘플 편차 (불안정)

엔. - 표본의 크기

γ - 신뢰 확률 (일반적으로 0.9, 0.95 또는 0.99)

c γ \u003d φ -1 ((1 + γ) / 2) - 표준 정규 분포 기능의 역치. 간단히 말하면, 이것은 중간 산술의 표준 오류의 수가 낮은 또는 상한 또는 상한 (지정된 세 가지 확률은 1.64, 1.96 및 2.58의 값에 해당)입니다.

공식의 본질은 산술 산술이 취해지고 일정 금액이 그것으로부터 연기된다는 것입니다. γ.) 표준 오류 ( s 0 / øn.짐마자 모든 것이 알려져 있고, 취하고 고려합니다.

질량을 사용하기 전에 PEVM을 사용하여 정규 분포의 기능의 값을 얻고 반대로 사용되었습니다. 그들은 지금 이제 사용되지만 완성 된 Excel 수식에 연락하는 것이 더 효율적입니다. 위의 수식 (및)의 모든 요소는 Excel에서 쉽게 계산할 수 있습니다. 그러나 신뢰 구간을 계산하기위한 완성 된 공식이 있습니다. 신뢰. 정규...에 그 구문은 다음에 있습니다.

신뢰. 노르나 (알파, 표준 찌알; 크기)

알파의 - 상기 표기법에서의 중요성 또는 신뢰 수준의 수준은 1- Γ이다. 수학적 가능성기다리는 것은 신뢰 구간을 벗어날 것입니다. 신뢰 확률로 0.95, 알파는 0.05 등입니다.

standard_tack. - 샘플 데이터의 평균 2 차단. 표준 오류를 계산할 필요가 없으며 Excel 자체가 n에서 루트로 나뉩니다.

크기 - 샘플 크기 (n).

함수의 결과는 신뢰할 것입니다. nore - 이것은 신뢰 구간을 계산하기위한 공식의 두 번째 용어, 즉 I.E. 반 간격 따라서, 하부 및 상부 점은 평균 ± 결과 값이다.

따라서, 소스 데이터의 분포에 의존하지 않는 평균 산술에 대한 신뢰 구간을 계산하기위한 범용 알고리즘을 구성 할 수있다. 다양성을위한 이사회는 그 점도적 인 것입니다. I.E. 비교적 큰 샘플을 사용할 필요가 있습니다. 그러나, 세기에 현대 기술 수집 적절한 금액 데이터는 일반적으로 어렵지 않습니다.

신뢰 간격으로 통계적 가설을 확인하는 것

(모듈 111)

통계에서 해결 된 주요 작업 중 하나가 있습니다. 그 본질은 간단히. 예를 들어, 일반 집계의 마스터가 일부 값과 동일하다는 것을 예를 들어, 가정을 전달합니다. 그런 다음이 중매자로 관찰 할 수있는 샘플 매체의 분포. 다음으로,이 조건부 분포의 위치가 실제 평균이 있는지가 있습니다. 허용 한계를 넘어서는 경우, 그러한 평균의 외모는 매우 가능성이 없으며 실험의 단일 반복이 거의 불가능합니다. 이는 가설은 확장 된 가설과는 반대로 이루어지며 이는 성공적으로 이탈됩니다. 평균이 중요한 수준을 초과하지 않는 경우 가설은 거부되지 않습니다 (그러나 입증되지 않았습니다.).

따라서 신뢰 구간의 도움으로 우리의 경우 가설을 체크 할 수도 있습니다. 그것은 매우 쉽습니다. 일부 샘플의 평균 산술이 100이고, 로션이 동일하다는 것을 확인한다고 가정합니다. 즉, 90. 즉, 당신이 질문을하지 않으면 이렇게 소리가 들리겠습니다. 90의 평균이 90 개, 관찰 된 평균은 100으로 밝혀 졌습니까?

이 질문에 답하기 위해 평균에 대한 정보가 추가로 필요합니다. 2 차 편차 및 샘플링. 뿌리 평균 정사각형 편차가 30이고 관측치 (64)의 수 (루트를 쉽게 제거 할 수 있음)를 가정 해보십시오. 그런 다음 표준 중간 오류는 30/8 또는 3.75입니다. 기밀 간격의 95 %를 계산하려면 중간의 두 가지 표준 오류 (보다 정확하게 1.96)의 양면에 연기되어야합니다. 신뢰 간격 그것은 약 100 ± 7.5 또는 92.5에서 107.5로 밝혀졌습니다.

다음으로, 인수는 다음과 같습니다. 검증 가능한 가치가 신뢰 구간에 들어가면 가설과 모순되지 않습니다. 왜냐하면 그것은 무작위 변동 (95 %의 확률로)에서 공급됩니다. 테스트 포인트가 신뢰 구간의 한계를 초과하면 그러한 사건의 확률은 매우 작습니다. 허용 수준...에 따라서, 관찰 된 데이터와는 반대로 가설이 편향됩니다. 우리의 경우, 일치하는 것에 대한 가설은 신뢰 구간 이외의 것입니다 (90의 검증 가능한 값은 100 ± 7.5의 간격에 포함되지 않음)이므로 거부해야합니다. 위의 원시적 인 질문에 응답하면, 그렇지 않으면, 어쩌면 어떤 경우에도 매우 드물게 일어날 수 있습니다. 종종, 동시에, 가설 (P 수준)의 잘못된 편차의 특정 확률이 표시되고, 신뢰 구간이 지어지지 않았지만 다른 시간에 대해서는 명시되지 않은 수준을 나타냅니다.

보시다시피, 중간 (또는 수학적 기대)에 대한 신뢰 간격을 쉽게 구축 할 수 있습니다. 주요한 것은 본질을 잡는 것입니다. 그러면 문제가 될 것입니다. 실제로 대부분의 경우 기밀 간격의 95 %가 사용되어 중간의 양면에 두 가지 표준 오류가 있습니다.

그게 다야. 모두 제일 좋다!

교수

그건 주목하라 간격 (L1 또는 L2)의 중앙 영역은 L *의 평가뿐만 아니라 매개 변수의 진정한 가치가 동봉 될 것인지 아마도 신뢰할 수 있습니다. 간격oM 또는 알파의 신뢰 확률의 해당 값. 이 경우 L *는 점 추정치를 참조합니다. 예를 들어, 랜덤 값 X (x1, x2, ..., xn)의 선택적 값의 결과에 따라 배포판이 의존 할 L 지시자의 알 수없는 파라미터를 계산해야합니다. 이 경우, 지정된 L * 매개 변수의 추정치는 각 샘플에 따라 매개 변수의 특정 값을 넣어야하는 경우, 즉 지표 Q의 관찰 기능을 작성하는 것이 필요합니다. 그 중 공식에서 파라미터 L *의 추정 된 값과 동일하게 취해질 것입니다. l * \u003d q * (x1, x2, ..., xn).

관찰 결과에 따른 모든 기능을 통계라고합니다. 동시에, 해당 파라미터 (현상)의 매개 변수를 완전히 설명하면 충분한 통계라고합니다. 따라서 관찰 결과는 무작위로, L *도 랜덤 변수 일 것입니다. 통계 계산 작업은 품질의 기준을 고려해야합니다. 여기서 추정 유통 법이 확률 밀도 W (X, L)의 분포가 상당히 정의된다는 것을 고려해야합니다.

자신감을 계산할 수 있습니다 간격 평가의 분포에 대한 법률이 알려지면 충분히 간단합니다. 예를 들어, 신뢰합니다 간격 수학적 기대에 관한 평가 ( 중간 크기 무작위) mx * \u003d (1 / n) * (x1 + x2 + ... + xn). 이 추정치는 믿을 수 없을 것입니다. 즉, 지표의 수학적 대기 또는 평균값은 매개 변수 (m (mx *) \u003d mx의 true 값과 같습니다).

BH * ^ 2 \u003d dx / n의 수학적 기대 추정의 분산을 확립 할 수 있습니다. 한계 중앙 정리에 기초하여,이 평가 가우시안 (정상)의 분포 법칙을 결론 내릴 수있다. 따라서 계산을 위해 표시기 f (z) - 확률의 필수 요소를 사용할 수 있습니다. 이 경우 트러스트의 길이를 선택하십시오. 간격및 2LD를 사용하므로 다음을 받게됩니다. alpha \u003d p (mx-ld (수식에 따라 확률 적분의 속성을 사용하는 것 : f (f (-z) \u003d 1- F (z)).

신뢰를 쌓다 간격 수학적 기대 평가 : - 수식 (알파 + 1) / 2의 값을 찾습니다. - LD / SQRT (dx / n)와 같은 확률 적분 테이블 값을 선택합니다. - 진정한 분산액을 평가합니다. dx * \u003d (1 / n) * (x1 - mx *) ^ 2+ (x2 - mx *) ^ 2 + ... + (xn - mx *) ^ 2); - ld 결정; - 신뢰 찾기 간격 공식 : (mx * -ld, mx * + ld).

종종 평가자는 평가 물체가있는 세그먼트의 부동산 시장을 분석해야합니다. 시장이 개발 된 경우, 제시된 객체의 전체 세트를 분석하기 위해 객체 샘플을 분석하는 데 사용됩니다. 이 샘플은 항상 균질하지는 않습니다. 너무 높거나 너무 낮은 시장 제안을 극단적으로 청소해야합니다. 이 목적을 위해 적용됩니다 신뢰 간격...에 이 연구의 목적은 신뢰 구간을 계산하고 선택하는 두 가지 방법의 비교 분석을 수행하는 것입니다. 최적의 옵션 exposatica.pro 시스템에서 다른 샘플로 작업 할 때 계산.

기밀 간격은 알려진 확률을 갖는 사인의 특성의 특징이며, 일반 인구의 추정 된 파라미터를 포함합니다.

신뢰 구간 계산의 의미는 추정 된 파라미터의 값 이이 간격에 있음을 주어진 확률로 주장 할 수 있도록 그러한 간격의 샘플에 따라 빌드하는 것입니다. 즉, 특정 확률이있는 신뢰 구간은 예상 값의 알려지지 않은 값을 포함합니다. 간격이 더 높을수록 부정확성이 높아집니다.

신뢰 구간을 결정하기위한 다른 방법이 있습니다. 이 기사에서는 2 가지 방법을 고려하십시오.

  • 중앙값 및 RMS 편차를 통해;
  • t-Statistics (stttyUdent 계수)의 임계 값을 통해.

단계 비교 분석 다른 방법으로 계산 DI :

1. 우리는 데이터 샘플을 형성합니다.

2. 통계 방법 처리 : 평균, 중앙값, 분산 등을 계산합니다.

3. 두 가지 방법으로 신뢰 구간을 계산하십시오.

4. 정제 된 샘플과 수신 된 신뢰 구간을 분석합니다.

단계 1. 데이터 샘플링

샘플은 exestatica.pro 시스템을 사용하여 형성됩니다. 91 판매 제안 1 1 샘플에 입력되었습니다 룸 아파트 3 번째 가격 벨트에서 계획 유형 "Khrushchevka".

표 1. 원본 샘플

가격 1 sq.m., D.E.

그림 1. 소스 샘플



단계 2. 원래 샘플링 처리

샘플링 처리 통계의 메소드는 다음 값을 계산해야합니다.

1. 평균 산술 값

2. Mediana - 샘플을 특징 짓는 숫자 : 샘플의 정확히 절반의 샘플의 절반, 다른 절반은 중앙값이 적습니다.

(홀수 가치가있는 샘플링 용)

3. 스케일 - 샘플의 최대 값과 최소값의 차이점

4. 분산 - 데이터 변형의보다 정확한 추정을 위해 사용

5. 샘플에 의한 방사성 편차 (이하, 평균 산술 값의 조정 값의 값의 산란의 가장 일반적인 지표).

6. 변동 계수 - 조정 값의 산란 정도를 반영합니다.

7. 진동 계수 - 평균 주변의 샘플에서 극한 가격 값의 상대적인 변동을 반영합니다.

표 2. 원래 샘플링의 통계 지표

데이터의 균질성을 특징 짓는 변이 계수는 12.29 %이지만 진동 계수가 너무 큽니다. 따라서 초기 샘플이 균질하지 않으므로 신뢰 구간 계산을 진행할 수 있습니다.

단계 3. 신뢰 구간 계산

방법 1. 중앙값 및 RMS 편차의 계산.

신뢰 구간은 다음과 같이 결정됩니다. 최소값 - 중앙값을 빼냅니다. 최대 값 - 중앙값이 추가됩니다.

따라서 신뢰 구간 (47179 d.e.; 60689 d.e.)

무화과. 2. 기밀 간격으로 떨어지는 값.



방법 2. T- 통계의 중요한 가치를 통해 신뢰 구간을 구성합니다 (학생 계수)

S.V. 책의 곰팡이 "속성의 가치를 추정하기위한 수학 방법"은 학생 계수를 통해 신뢰 구간을 계산하는 방법을 설명합니다. 이 방법을 계산할 때, 감정인은 신뢰 구간을 구축 할 가능성을 결정하는 중요도 α의 수준을 지정해야합니다. 일반적으로 유의 수준 0.1; 0.05 및 0.01. 그들은 신뢰 확률 0.9에 해당합니다. 0.95 및 0.99. 이 방법으로 수학적 기대와 분산의 진정한 의미는 거의 알려지지 않은 것으로 간주됩니다 (실제 평가를 해결할 때 거의 항상 사실).

신뢰 구간의 공식 :

n - 샘플링;

특수 통계 테이블에 의해 결정되거나 MS Excel (→ "통계"→ StraudSpobrov)에 의해 결정되는 N-1의 자유도의 수준의 중요성 α의 수준의 T- 통계 (학생의 분포)의 중요한 가치.

α - 중요성 수준, 우리는 α \u003d 0.01을 받아들입니다.

무화과. 2. 기밀 간격 2에 속하는 값.

단계 4. 신뢰 구간을 계산하기위한 다른 방법의 분석

중앙값과 학생 계수를 통해 신뢰 구간을 계산하는 두 가지 방법 - 다른 값 간격. 따라서, 2 개의 상이한 정제 된 샘플이 밝혀졌다.

표 3. 3 개의 샘플에 대한 통계 지표.

지시자

소스 샘플

1 옵션

옵션 2.

평균

분산

쿠프. 변화

쿠프. 진동

폐기물 수, PC의 수.

수행 된 계산에 따라 얻은 것이라고 말할 수 있습니다. 다른 방법 신뢰 구간의 가치는 교차하므로 평가자의 재량에 따라 계산 방법을 사용할 수 있습니다.

그러나 우리는 expositya.pro 시스템에서 일할 때 시장 개발의 정도에 따라 신뢰 간격을 계산하는 방법을 선택하는 것이 좋습니다.

  • 시장이 저개발 된 경우,이 경우의 폐기물 수가 작기 때문에 중앙값 및 표준 편차를 계산하는 방법을 적용하는 방법을 적용합니다.
  • 시장이 개발되면 대규모 소스 샘플을 형성 할 수 있기 때문에 T- 통계 (stttyUdent 계수)의 임계 값을 통해 계산을 적용하십시오.

기사의 준비에서 사용 된 경우 :

1. Gribovsky S.V., Sivets S.a., Levykina I.A. 재산 비용을 평가하기위한 수학적 방법. 모스크바, 2014 년

2. exposatica.pro 시스템 데이터

신뢰 구간 평가

훈련의 목적

통계는 다음을 고려합니다 두 가지 주요 작업:

    우리는 샘플 데이터를 기반으로하는 몇 가지 평가를 가지고 있으며, 추정 된 매개 변수의 진정한 가치가있는 위치에 대해 몇 가지 확률 성 명령문을 만들고 싶습니다.

    우리는 선택적 데이터를 기반으로 검사 해야하는 특정 가설을 가지고 있습니다.

이 항목에서는 첫 번째 작업을 고려합니다. 우리는 또한 신뢰 구간의 정의를 도입합니다.

기밀 간격은 매개 변수의 예상 값을 둘러싼 간격이며 주어진 확률에 의해 주어진 선험적 인 예상 파라미터의 실제 값이있는 위치를 보여줍니다.

이 주제의 재료를 검사 한 후 :

    기밀 평가 간격이 무엇인지 알아보십시오.

    통계 작업을 분류하는 방법을 배우십시오.

    통계 공식을 사용하여 신뢰 구간을 구성하는 기술을 밝히고 소프트웨어 도구를 사용합니다.

    정의 방법을 배우십시오 필요한 크기 업적 샘플 정의 된 매개 변수 통계적 견적의 정확성.

샘플 특성의 분포

T 배포

상술 한 바와 같이 분포 무작위 변수 매개 변수 0과 1. 표준화 된 정규 분포에 가깝습니다. 우리는 알려지지 않았기 때문에 등급 s에서 그것을 대체합니다. 이 값은 이미 다른 분포, 즉 또는 학생 유통매개 변수 n -1 (자유도의 수)에 의해 결정됩니다. 이 분포는 정상 분포 (더 큰 n, 항목이 더 가깝다)와 가깝습니다.

도 1의 95.
30 도의 자유도를 가진 학생의 배포를 제시했습니다. 볼 수 있듯이 정상적인 분포와 매우 가깝습니다.

Normarasp 및 Normo의 정상적인 분포로 작업하기위한 기능과 마찬가지로 T 배포와 작업하는 기능 - Steondsp (TDIST) 및 스터드 세트 (TINV)...에 이러한 기능을 사용하는 예는 studundsp.xls 파일 (템플릿 및 솔루션)에서 볼 수 있고 그림에서 볼 수 있습니다. 96.
.

다른 특성의 분포

우리가 이미 알고 있듯이 수학적 기대의 정확성을 결정하기 위해 우리는 T 배포가 필요합니다. 분산과 같은 다른 매개 변수의 추정을 위해 다른 분포가 필요합니다. 그들 중 두 명은 F 배포와 x 2 배포.

평균을위한 신뢰 간격

신뢰 간격 - 이것은 매개 변수의 예상 값을 둘러싼 간격이며 확률로 주어진 선험적 인 예상 파라미터의 진정한 값이있는 위치를 보여줍니다.

평균값에 대한 신뢰 구간을 구성하는 것은 발생합니다 다음과 같은 방법으로:

빠른 서비스 레스토랑은 새로운 유형의 샌드위치로 범위를 확장 할 계획입니다. 관리자는 이미 시도한 사람들로부터 40 명의 방문자를 선택하고 1에서 10까지의 새로운 제품에 대한 새로운 제품에 대한 태도를 평가하도록 제안 할 계획을 무작위로 선택할 계획이다. 받을 수있는 포인트의 신상품 이 평가의 95 % 신뢰 구간을 구축하십시오. 그것을 구현하는 방법? (sandwich1.xls 파일 (템플릿 및 솔루션)을 참조하십시오.

결정

이 작업을 해결하려면 사용할 수 있습니다. 결과는도 2에 제시되어있다. 97.
.

총 가치를위한 신뢰 간격

때로는 샘플 데이터에서 수학적 기대가 아닌 평가가 필요하지만 총량의 총량을 평가해야합니다. 예를 들어, 감사인이있는 상황에서는이자가 계정의 평균값 및 모든 계정의 합계가 아닌 평가 일 수 있습니다.

n은 샘플 크기, T 3 - 샘플의 값의 합계 (샘플 크기, T3), 전체 전체를 따라 금액을 추정한 다음 또한, 신뢰 구간은 S가 샘플의 표준 편차의 추정치이며, 샘플링을위한 평균 추정치이다.

세금 서비스는 10,000 명의 납세자를위한 총 세금 환급 금액을 평가하려고한다고 가정합니다. 납세자는 세금 환급을 받거나 지불합니다. 샘플 크기가 500 명인 경우 95 %의 신뢰 구간을 찾아보십시오 (returns.xls (템플릿 및 솔루션의 양) 파일을 참조하십시오.

결정

StatPro는이 경우에 특별한 절차가 없지만, 경계는 위의 수식에 기초하여 평균의 경계에서 얻을 수 있다는 것을 알 수 있습니다 (그림 98
).

비례에 대한 신뢰 간격

p가 고객의 몫에 대한 수학적 기대를하자, p b - 샘플 크기 n에 의해 얻어진 이주의 평가. 아주 큰 것으로 표시 될 수 있습니다 평가의 배포는 수학적 기대 P 및 표준 편차로 정상에 가깝습니다. ...에 표준 평가 오류 이 경우 대로 표현된다 및 신뢰 구간과 같이 .

빠른 서비스 레스토랑은 새로운 유형의 샌드위치로 범위를 확장 할 계획입니다. 그에게 수요를 평가하기 위해 관리자는 이미 시도한 사람들로부터 40 명의 방문객을 선택하여 새로운 제품에 대한 태도를 1에서 10으로 평가하도록 제안했습니다. 관리자는 고객의 예상치를 평가하려고합니다. 신제품을 6 점 이상으로 평가하는 사람 (이 고객은 이러한 고객이 정확히 기대하고 신제품 소비자가 될 것으로 기대합니다).

결정

처음에는 클라이언트의 평가가 6 점 이상 0이 넘는 경우 1을 기준으로 새 열을 만듭니다. 그렇지 않으면 sandwich2.xls 파일 (템플릿 및 솔루션)을 참조하십시오.

방법 1.

1 금액을 계산하는 경우, 우리는 공유를 추정 한 다음 수식을 사용합니다.

Z KR의 값은 정규 분포의 특수 테이블 (예 : 95 % 신뢰 구간의 경우 1.96)에서 가져옵니다.

간격의 95 %의 구축을 위해이 접근법 및 특정 데이터를 사용하여 다음과 같은 결과를 얻습니다 (그림 99
짐마자 매개 변수 z KR의 임계 값은 1.96과 같습니다. 표준 견적 오류 - 0.077. 신뢰 구간의 낮은 경계는 0.475입니다. 신뢰 구간의 상한은 0.775입니다. 따라서 관리자는 6 점 이상 6 점의 신제품에 의해 평가 된 고객의 비율이 47.5와 77.5 사이의 정확성의 95 %를 가정 할 권리가 있습니다.

방법 2.

이 작업을 사용하면 솔루션을 표준 StatPro 도구로 사용할 수 있습니다. 이 경우 공유가 유형 열의 평균값과 일치하는지 확인하기에 충분합니다. 다음을 적용하십시오 statpro / 통계 추론 / 한 샘플 분석 열 유형의 평균 (수학적 기대 평가)의 기밀 간격을 구축하려면. 이 경우에 수득 된 결과는 제 1 방법의 결과에 매우 가깝다 (도 99).

표준 편차를위한 신뢰 간격

표준 편차의 추정치로서 S (수식이 섹션 1에 나와 있음)가 사용됩니다. 추정 S의 분포 밀도의 함수는 T 배포와 마찬가지로, N-1 자유도를 갖는 Xi-Square 함수이다. HI2RACSP (chidist) 및 Chi2OB (Chiinv)의 배포와 함께 작동하는 특별한 기능이 있습니다.

이 경우 신뢰 구간은 대칭이 아닐 것입니다. 조건부 구성표 테두리는도 1에 제시되어있다. 100.

기계는 직경이 10cm 인 세부 사항을 생성해야합니다. 그러나 상황에 따라 오류가 발생합니다. 품질 컨트롤러 두 가지 상황을 걱정합니다. 첫째, 평균값은 10cm이어야합니다. 둘째,이 경우에도 편차가 훌륭한 경우 많은 세부 사항이 거부됩니다. 매일 그는 50 부분의 샘플을 만듭니다 (품질 관리 파일 .xls (템플릿 및 솔루션). 그런 샘플을 줄 수있는 결론은 무엇입니까?

결정

중간 및 표준 편차를 사용하여 95 %의 신뢰 구간을 구축합니다. statpro / 통계 추론 / 한 샘플 분석 (그림 101)
).

또한, 지름의 정상 분포의 가정을 사용하여 결함이있는 제품의 공유를 계산하여 0.065의 한계 편차를 설정합니다. 대체 테이블의 가능성 (두 매개 변수의 경우)을 사용하여 평균 및 표준 편차와의 결혼 몫의 의존성을 구성합니다 (그림 102
).

두 개의 평균값의 차이를위한 신뢰 간격

이것은 통계적 방법의 가장 중요한 응용 분야 중 하나입니다. 상황의 예.

    의류 매장 관리자는 매장 평균 여성 구매자에게 얼마나 훨씬 더 많이 소비되는지 알고 싶습니다.

    두 항공사는 유사한 경로를 비행합니다. 조직 - 소비자는 두 항공사에서 항공편의 중간 줄 지연 시간 간의 차이를 비교하고자합니다.

    이 회사는 한 도시에서 특정 유형의 물품에 대한 쿠폰을 보내고 다른 도시에서 보내지 않습니다. 관리자는 다음 2 개월 동안 이러한 제품의 평균 구매량을 비교하고자합니다.

    자동차 딜러는 종종 결혼 한 부부를 다룹니다. 프레젠테이션에 대한 개인적인 반응을 이해하기 위해 쌍은 종종 별도로 폴링됩니다. 관리자는 남성과 여성이 지시 한 사람들의 순위의 차이를 추정하고자합니다.

독립 샘플의 경우

평균값의 차이점은 N 1 + N 2-2 도의 자유와 T 배포를 갖게됩니다. μ 1 - μ 2의 신뢰 구간은 비율로 표현됩니다.

이 작업은 위의 수식에 따라뿐만 아니라 표준을 의미하는 솔루션을 허용합니다. 이렇게하려면 적용 할만 큼 충분합니다

비율의 차이를위한 신뢰 간격

그것이 주식의 수학적 기대가되도록하십시오. 각각 샘플 크기 N 1 및 N 2에 의해 구성된 선택적 추정치를합시다. 그런 다음 차이에 대한 평가입니다. 결과적으로,이 차이의 신뢰 구간은 다음과 같이 표현됩니다.

여기서 Z Cr은 특수 테이블에 의한 정규 분포에서 얻은 값 (예 : 95 % 신뢰 구간의 경우 1.96)입니다.

표준 견적 오차는이 경우 비율로 표현됩니다.

.

상점, 큰 판매 준비, 다음 마케팅 연구를 수행했습니다. 300이 선택되었습니다 최고의 바이어들차례로 각각 150 명의 구성원의 두 그룹으로 무작위로 분할되었습니다. 선택한 모든 구매자가 판매에 참여하기 위해 초대장을 보냈지 만 첫 번째 그룹의 구성원은 쿠폰이 첨부되어 5 \u200b\u200b% 할인 권리를 부여했습니다. 300 명의 모든 구매자의 모든 구매자의 구매 판매 중에 기록되었습니다. 관리자는 쿠폰 조항의 효과성에 대해 얻은 결과를 어떻게 해석 할 수 있습니까? (파일 쿠폰 .xls (템플릿 및 솔루션) 참조).

결정

할인 쿠폰을받은 150 명의 구매자의 특정 사례를 위해 55 명이 판매를 구매했으며 쿠폰을받지 못한 150 명 중에서 구입은 35만이되었습니다 (그림 103
짐마자 그런 다음 샘플 비율의 값은 각각 0.3667 및 0.2333입니다. 그리고 그 사이의 선택적 차이는 0.1333과 같습니다. 95 %의 신뢰 구간을 믿는 것은 정상 유통 Z KR \u003d 1.96 테이블에서 찾습니다. 샘플 차이의 표준 오차를 계산하는 것은 0.0524입니다. 우리는 최종적으로 95 % 신뢰 구간의 하한이 0.0307이고 0.2359의 상한은 각각 얻은 결과는 할인 쿠폰을받은 모든 100 명의 구매자가 3 ~ 23 개의 신규 구매자가 예상 할 수있는 방식으로 해석 될 수 있습니다. 그러나,이 결론 자체는 쿠폰 사용의 효과를 의미하지 않는다는 것을 명심하지 않는다는 것을 명심해야한다는 것을 명심해야합니다 (할인, 우리는 이익을 잃었습니다). 우리는이 문제를 해결할 것입니다. 평균 구매 크기가 400 루블이며, 그 중 50 루블입니다. 잡지 이익이 있습니다. 쿠폰을받지 못한 100 명당 예상 이익은 다음과 같습니다.

50 0.2333 100 \u003d 1166.50 문지름.

100 개의 구매자를위한 유사한 계산은 쿠폰을 받았습니다.

30 0.3667 100 \u003d 1100,10 문지름.

평균 이익의 감소는 쿠폰을받은 할인, 평균 380 루블에 대해 쿠폰을받는 구매자가 구매할 것이라는 사실 때문입니다.

따라서 최종 결론은 이러한 특정 상황에서 이러한 쿠폰을 사용하는 효율성을 나타냅니다.

논평. 이 작업을 사용하면 솔루션을 표준 StatPro 도구로 사용할 수 있습니다. 이를 위해이 작업을 방해하는 두 매체 간의 차이를 추정하는 작업 에이 작업을 줄이고 적용 할 수 있습니다. statpro / 통계 추론 / 2 샘플 분석 두 평균의 차이의 신뢰 간격을 구축하는 것.

신뢰 구간의 길이를 제어합니다

신뢰 구간의 길이는에 달려 있습니다 다음 조건 :

    직접 데이터 (표준 편차);

    중요성 수준;

    표본의 크기.

샘플 크기 평균값을 평가합니다

먼저 일반적인 경우에 작업을 생각해보십시오. B에 대한 신뢰 구간의 절반의 값 절반의 값을 나타냅니다 (그림 104
짐마자 우리는 일부 무작위 변수 x의 평균값의 신뢰 구간이 다음과 같이 표현된다는 것을 알고 있습니다. 어디 ...에 믿음 :

그리고 n을 표현하고, 우리는 얻는다.

불행하게도, 우리는 무작위 값 x의 분산의 정확한 값을 모른다. 또한, 우리는 자유도의 수를 통해 n을 n으로 의존하기 때문에, 우리는 알려지지 않았으며, Cr의 가치가 있습니다. 이 상황에서 우리는 다음과 같이 할 수 있습니다. 분산 된 대신에, 기본 무작위 변수의 기존의 구현에 따라 분산액의 평가를 사용합니다. T KR의 값 대신에, 우리는 정상적인 분포를 위해 Z KR을 사용합니다. 이것은 정상 및 T 배포의 분포 밀도 기능이 매우 가깝기 때문에 (작은 n의 경우를 제외하고) 허용 할 수 있습니다. 따라서 원하는 공식이 형식을 취합니다.

.

수식이 일반적으로 말하기 때문에, 과도한 결과를 반올림하는 것은 원하는 샘플로서 반올림됩니다.

빠른 서비스 레스토랑은 새로운 유형의 샌드위치로 범위를 확장 할 계획입니다. 관리자는 이미 시도한 사람들로부터 특정 수의 방문자를 선택할 계획을 세우고 새로운 제품에 대한 새로운 제품에 대한 태도를 1에서 10으로 추정하도록 제안하고 있습니다. 관리자는 이 평가의 신제품을 수령하고 95 % 신뢰 구간을 구축하는 예상치 수를 평가하십시오. 동시에, 그는 신뢰 구간의 너비의 절반이 0.3을 초과하지 않기를 원합니다. 어떤 방문자가 투표해야합니까?

다음과 같이 :

여기 or ots. - 공유 P의 평가, 그리고 자신감 간격의 길이의 절반이 있습니다. n에 과대화 된 값은 값을 사용하여 얻을 수 있습니다. or ots. \u003d 0.5. 이 경우 신뢰 구간의 길이는 진정한 값 p에서 지정된 값을 초과하지 않습니다.

이전 예제의 관리자가 새로운 유형의 제품을 선호하는 고객의 점유율을 추정 할 계획입니다. 그는 90 %의 신뢰 구간을 건설하고 있으며, 그 길이의 절반은 0.05를 초과하지 않을 것입니다. 얼마나 많은 고객이 무작위 샘플에 포함되어야합니까?

결정

우리의 경우, z kr \u003d 1.645의 값. 따라서 원하는 양은대로 계산됩니다 .

관리자가 P의 원하는 값이 P의 원하는 값 (예 : 약 0.3)이고,이 값을 상기 수식으로 대체한다고 믿는 이유가 있다면, 우리는 랜덤 샘플의 더 작은 값, 즉 228을 얻을 것이다.

결정을위한 공식 두 개의 평균값의 차이가있는 경우 임의의 샘플 크기 다음과 같이 작성 :

.

일부 컴퓨터 회사에는 고객 서비스 센터가 있습니다. 최근에는 품질이 떨어지는 서비스가 부족한 고객 불만 수가 증가했습니다. 에 서비스 센터 기본적으로 두 가지 유형의 직원 : 가지 않음 굉장한 경험그러나 특별한 예비 과정을 마치고 실제적인 경험이 많지만 특별한 과정을 마쳤습니다. 이 회사는 지난 6 개월 동안 고객 불만을 분석하고 두 직원 그룹 각각에 대해 평균 수량을 비교하고자합니다. 두 그룹의 샘플의 양이 동일하게 될 것으로 가정합니다. 샘플에 몇 명의 직원이 포함되어야합니까? 95 % 간격으로 2 개 이상 반 이하입니까?

결정

여기서 Σ OC는 가까운 가정에서 임의의 변수의 표준 편차의 추정치입니다. 따라서 우리의 작업에서는 어떻게 든이 평가를 받아야합니다. 예를 들어 다음과 같이 수행 할 수 있습니다. 지난 6 개월 동안 고객 불만 사항에 대한 데이터를 검토 한 후 관리자는 각 직원이 주로 6에서 36 불만을 초래할 수 있습니다. 정상적인 분포를 위해 거의 모든 값이 평균값으로 3 개의 표준 편차가 아니라는 것을 알면 다음과 같은 이유로 고려할 수 있습니다.

여기서 σ oc \u003d 5.

수식 에서이 값을 대체하면 우리가 얻습니다 .

결정을위한 공식 주식의 차이의 추정치의 경우 임의의 샘플링 그것은 형식이 있습니다.

일부 회사는 유사한 제품의 생산을위한 두 가지 공장이 있습니다. 회사 관리자는 두 공장에서 결함이있는 제품의 주식을 비교하려고합니다. 이용 가능한 정보에 따르면 두 공장 모두의 결혼 비율은 3 ~ 5 %입니다. 99 %의 신뢰 구간과 0.005 (또는 0.5 %)가 넘는 절반의 길이를 만들어야합니다. 각 공장에서 얼마나 많은 제품을 선택해야합니까?

결정

여기서 P 1oC와 R 2ots는 첫 번째와 두 번째 공장에서 결혼의 두 가지 미지의 분수의 추정치입니다. 우리가 P 1OT \u003d P 2oC \u003d 0.5를 넣으면 n에 대한 비싼 값을 얻을 것입니다. 그러나 우리의 경우에 우리는 이러한 분수에 대한 선험적 정보를 가지고 있기 때문에, 우리는이 분수의 상위 평가, 즉 0.05입니다. 받다

샘플 데이터 세트의 일부 매개 변수의 등급이 이루어지면 매개 변수의 점 추정치뿐만 아니라 예상 파라미터의 정확한 값이 될 수있는 위치를 보여주는 신뢰 구간을 지정하는 것이 유용합니다.

이 장에서는 다양한 매개 변수에 대한 그러한 간격을 허용하는 정량적비에 대해서도 알려졌습니다. 신뢰 구간의 길이를 제어하는 \u200b\u200b방법을 배웠습니다.

또한 표준 STATPRO 도구를 사용하여 샘플 크기 (실험 계획 작업)를 추정하는 작업을 해결할 수 있습니다. statpro / 통계 추론 / 샘플 크기 선택.

공유