مقالات

5.2: استخدام نظرية النهاية المركزية - الرياضيات


من المهم أن تفهم متى تستخدم نظرية الحد المركزي (clt). إذا طُلب منك إيجاد احتمال المتوسط ​​، فاستخدم clt للمتوسط. إذا طُلب منك إيجاد احتمال مبلغ أو إجمالي ، فاستخدم clt للمبالغ. ينطبق هذا أيضًا على النسب المئوية للوسائل والمبالغ.

إذا طُلب منك إيجاد احتمال قيمة فردية ، فلا تستخدم clt. استخدم توزيع متغيرها العشوائي.

قانون الأعداد الكبيرة

ينص قانون الأعداد الكبيرة على أنه إذا أخذت عينات ذات حجم أكبر وأكبر من أي مجموعة ، فإن متوسط ​​ ( شريط {x} ) للعينة يميل إلى الاقتراب أكثر فأكثر من ( mu ). من نظرية الحد المركزية ، نعلم أنه كلما زاد حجم (n ) وأكبر ، فإن العينة تعني اتباع التوزيع الطبيعي. كلما زاد (n ) كلما قل الانحراف المعياري. (تذكر أن الانحراف المعياري لـ ( bar {X} ) هو ( dfrac { sigma} { sqrt {n}} ).) وهذا يعني أن النموذج يعني ( bar {x} ) يجب أن يكون قريبًا من متوسط ​​السكان ( mu ). يمكننا أن نقول أن ( mu ) هي القيمة التي تعني العينة الاقتراب حيث (n ) يكبر. توضح نظرية الحد المركزي قانون الأعداد الكبيرة.

مثال ( PageIndex {1} )

يتم إجراء دراسة تنطوي على الإجهاد بين الطلاب في الحرم الجامعي. تتبع درجات الإجهاد توزيعًا موحدًا بأقل درجة إجهاد تساوي واحدًا وأعلى درجة تساوي خمسة. باستخدام عينة من 75 طالبًا ، ابحث عن:

  1. احتمال أن يكون يعني درجة الإجهاد بالنسبة لـ 75 طالبًا أقل من اثنين.
  2. 90ذ النسبة المئوية ل يعني درجة الإجهاد لـ 75 طالبًا.
  3. احتمال أن يكون مجموع درجات الإجهاد 75 أقل من 200.
  4. 90ذ النسبة المئوية ل مجموع نقاط الإجهاد لـ 75 طالبًا.

حلول

دع (X = ) درجة ضغط واحدة.

تطلب منك المشكلتان (أ) و (ب) إيجاد احتمال أو نسبة مئوية لمتوسط. تطلب منك المشكلتان (ج) و (د) إيجاد احتمال أو نسبة مئوية لـ a المجموع أو المجموع. حجم العينة (n ) يساوي 75.

نظرًا لأن درجات الإجهاد الفردية تتبع توزيعًا موحدًا ، (X sim U (1 ، 5) ) حيث (أ = 1 ) و (ب = 5 ).

[ mu_ {x} = dfrac {a + b} {2} = dfrac {1 + 5} {2} = 3 ]

[ sigma_ {x} = sqrt { dfrac {(ba) ^ {2}} {12}} = sqrt { dfrac {(5-1) ^ {2}} {12}} = 1.15 ]

بالنسبة للمشكلتين 1. و 2. ، دع ( bar {X} = ) متوسط ​​درجة الإجهاد لـ 75 طالبًا. ثم،

[ bar {X} sim N left (3، dfrac {1،15} { sqrt {75}} right) ]

حيث (n = 75 ).

  1. ابحث عن (P ( bar {x} <2) ). ارسم الرسم البياني.
  2. أوجد 90ذ النسبة المئوية لمتوسط ​​75 درجة إجهاد. ارسم رسمًا بيانيًا.
  3. أوجد (P ( sum x <2000) ). ارسم الرسم البياني.
  4. أوجد 90ذ النسبة المئوية لإجمالي 75 درجة إجهاد. ارسم رسمًا بيانيًا.

الإجابات

أ. (P ( bar {x} <2) = 0 )

احتمال أن يكون متوسط ​​درجة الإجهاد أقل من اثنين هو حوالي صفر.

الشكل 7.4.1.

عادي ( left (1،2،3، dfrac {1.15} { sqrt {75}} right) = 0 )

أصغر درجة ضغط هي واحدة

ب. دعونا (ك = ) 90ذ النسبة المئوية.

ابحث عن (k ) ، حيث (P ( bar {x}

(ك = 3.2 )

الشكل 7.4.2.

90ذ النسبة المئوية لمتوسط ​​75 درجة حوالي 3.2. هذا يخبرنا أن 90٪ من جميع وسائل 75 درجة إجهاد هي 3.2 على الأكثر ، و 10٪ على الأقل 3.2.

InvNorm ( left (0.90،3،1. dfrac {1.15} { sqrt {75}} right) = 3.2 )

بالنسبة للمسائل c و d ، دع ( sum X = ) مجموع درجات الإجهاد 75. ثم،

[ sum X sim N [(75) (3) )، ( sqrt {75}) (1.15) ]

ج. متوسط ​​مجموع 75 درجة ضغط هو ((75) (3) = 225 )

الانحراف المعياري لمجموع 75 درجة ضغط هو (( sqrt {75}) (1.15) = 9.96 )

(ف (مجموع س <200) )

الشكل 7.4.3.

احتمال أن يكون إجمالي النقاط البالغ 75 أقل من 200 هو حوالي صفر.

عادي (75200، (75) (3)، ( sqrt {75}) (1.15) ).

أصغر مجموع من درجات الإجهاد 75 هو 75 ، لأن أصغر درجة فردية هي واحدة.

د. دعونا (ك = ) 90ذ النسبة المئوية.

ابحث عن (k ) حيث (P ( sum x

(ك = 237.8 )

الشكل 7.4.4.

90ذ النسبة المئوية لمجموع 75 درجة حوالي 237.8. هذا يخبرنا أن 90٪ من مجموع 75 درجة لا تزيد عن 237.8 وأن 10٪ لا تقل عن 237.8.

InvNorm ( يسار (0.90، (75) (3)، ( sqrt {75}) (1.15) يمين) = 237.8 )

تمرين ( PageIndex {1} )

استخدم المعلومات الموجودة في المثال ( PageIndex {1} ) ، ولكن استخدم حجم عينة من 55 للإجابة على الأسئلة التالية.

  1. ابحث عن (P ( bar {x} <7) ).
  2. أوجد (P ( sum x <7) ).
  3. أوجد 80ذ النسبة المئوية لمتوسط ​​55 درجة.
  4. أوجد 85ذ النسبة المئوية لمجموع 55 درجة.

إجابه

  1. 0.0265
  2. 0.2789
  3. 3.13
  4. 173.84

مثال ( PageIndex {2} )

لنفترض أن محلل أبحاث السوق لشركة الهواتف المحمولة يجري دراسة لعملائهم الذين يتجاوزون الوقت المسموح به في عقد الهاتف الخلوي الأساسي ؛ يجد المحلل أنه بالنسبة لأولئك الأشخاص الذين تجاوزوا الوقت المدرج في عقدهم الأساسي ، فإن الوقت الزائد المستخدم يتبع التوزيع الأسي بمتوسط ​​22 دقيقة.

ضع في اعتبارك عينة عشوائية من 80 عميلًا تجاوزوا الحد الزمني المتاح في عقد الهاتف الخلوي الأساسي.

اسمح (X = ) بالوقت الإضافي الذي يستخدمه عميل واحد للهاتف الخلوي الفردي الذي يتجاوز الوقت المتعاقد عليه.

(X sim Exp left ( dfrac {1} {22} right) ). من الفصول السابقة ، نعلم أن ( مو = 22 ) و ( سيجما = 22 ).

اسمح ( bar {X} ) = متوسط ​​الوقت الزائد الذي تستخدمه عينة من (n = 80 ) العملاء الذين تجاوزوا الوقت المسموح به المتعاقد عليهم.

[ bar {X} sim N left (22، dfrac {22} { sqrt {80}} right) ]

بواسطة نظرية الحد المركزي لوسائل العينة

  1. أوجد احتمال أن يكون متوسط ​​الوقت الزائد الذي استخدمه 80 عميلًا في العينة أطول من 20 دقيقة. هذا يطلب منا إيجاد (P ( bar {x}> 20) ). ارسم الرسم البياني.
  2. لنفترض أن أحد العملاء الذي تجاوز الحد الزمني لعقد هاتفه الخلوي قد تم اختياره عشوائيًا. أوجد احتمال أن يكون الوقت الإضافي لهذا العميل الفردي أطول من 20 دقيقة. هذا يطلب منا إيجاد (P (x> 20) ).
  3. اشرح سبب اختلاف الاحتمالات في الجزأين (أ) و (ب).
  4. أوجد 95ذ النسبة المئوية ل العينة تعني الوقت الزائد لعينات من 80 عميلًا تجاوزوا حدود وقت العقد الأساسي. ارسم رسمًا بيانيًا.

إجابه

  1. البحث: (P ( bar {x}> 20) )

    (P ( bar {x}> 20) = 0.79199 ) باستخدامعادي ( left (20،1 text {E} 99،22، dfrac {22} { sqrt {80}} right) )

    الاحتمال هو 0.7919 أن متوسط ​​الوقت الزائد المستخدم هو أكثر من 20 دقيقة ، لعينة من 80 عميلًا يتجاوزون الوقت المسموح به المتعاقد معهم.

    الشكل 7.4.5.

    1E99 = 1099 و –1E99 = –1099. اضغط علىإيمفتاح E. أو استخدم فقط 1099 بدلاً من 1E99.

  2. أوجد (P (x> 20) ). تذكر استخدام التوزيع الأسي لـ فرد: (X sim Exp left ( dfrac {1} {22} right)).

    (P (x> 20) = e ^ {(- left ( dfrac {1} {22} right) (20))} ) أو (e ^ {(- 0.04545 (20))} = 0.4029 )
    1. (P (x> 20) = 0.4029 ) لكن (P ( bar {x}> 20) = 0.7919 )
    2. الاحتمالات ليست متساوية لأننا نستخدم توزيعات مختلفة لحساب الاحتمال للأفراد وللوسائل.
    3. عندما يُطلب منك إيجاد احتمال قيمة فردية ، استخدم التوزيع المحدد لمتغيرها العشوائي ؛ لا تستخدم clt. استخدم clt مع التوزيع الطبيعي عندما يُطلب منك إيجاد احتمال الوسط.
  3. دع (ك ) = 95ذ النسبة المئوية. ابحث عن (k ) حيث (P ( bar {x}

    (ك = 26.0 ) باستخدامInvNorm ( left (0.95،22، dfrac {22} { sqrt {80}} right) = 26.0 )

    الشكل 7.4.6.

    95ذ النسبة المئوية ل العينة تعني الوقت الزائد المستخدم حوالي 26.0 دقيقة للعينات العشوائية لـ 80 عميلًا تجاوزوا الوقت المسموح به في العقد.

    خمسة وتسعون في المائة من هذه العينات سيكون لها وسائل أقل من 26 دقيقة ؛ خمسة بالمائة فقط من هذه العينات سيكون لها متوسط ​​أعلى من 26 دقيقة.

تمرين ( PageIndex {2} )

استخدم المعلومات الموجودة في المثال ( PageIndex {2} ) ، ولكن قم بتغيير حجم العينة إلى 144.

  1. أوجد (P (20 < bar {x} <30) ).
  2. أوجد (P ( sum x text {ما لا يقل عن 3000) ).
  3. أوجد 75ذ تعني النسبة المئوية للعينة وقتًا إضافيًا لـ 144 عميلًا.
  4. أوجد 85ذ النسبة المئوية لمجموع 144 مرة زائدة يستخدمها العملاء.

إجابه

  1. 0.8623
  2. 0.7377
  3. 23.2
  4. 3,441.6

مثال ( PageIndex {3} )

في الولايات المتحدة ، يتم الاعتداء الجنسي على شخص كل دقيقتين في المتوسط ​​، وفقًا لعدد من الدراسات. لنفترض أن الانحراف المعياري هو 0.5 دقيقة وأن حجم العينة هو 100.

  1. أوجد الوسيط والربيع الأول والربيع الثالث للعينة متوسط ​​وقت الاعتداءات الجنسية في الولايات المتحدة.
  2. أوجد الوسيط والربيع الأول والربيع الثالث لمجموع أوقات عينة الاعتداءات الجنسية في الولايات المتحدة.
  3. أوجد احتمال حدوث اعتداء جنسي في المتوسط ​​بين 1.75 و 1.85 دقيقة.
  4. أوجد القيمة التي تكون انحرافين معياريين أعلى من متوسط ​​العينة.
  5. أعثر على IQR لمجموع أوقات العينة.

إجابه

  1. لدينا ( mu_ {x} = mu = 2 ) و ( sigma_ {x} = dfrac { sigma} { sqrt {n}} = dfrac {0.5} {10} = 0.05 ). وبالتالي:
    1. 50ذ النسبة المئوية (= مو_ {س} = مو = 2 )
    2. 25ذ النسبة المئوية (= نص {invNorm} (0.25،2،0.05) = 1.97 )
    3. 75ذ النسبة المئوية (= نص {invNorm} (0.75،2،0.05) = 2.03 )
  2. لدينا ( mu _ { sum X} = n ( mu_ {x}) = 100 (2) ) و ( sigma _ { mu X} = sqrt {n} ( sigma_ {x}) = 10 (0.5) = 5 ). وبالتالي
    1. 50ذ النسبة المئوية = ( mu _ { sum X} = n ( mu_ {X}) = 100 (2) = 200 )
    2. 25ذ النسبة المئوية (= text {invNorm} (0.25،200،5) = 196.63 )
    3. 75ذ النسبة المئوية (= text {invNorm} (0.75،200،5) = 203.37 )
  3. (P (1.75 عادي((1.75,1.85,2,0.05) = 0.0013)
  4. باستخدام (z ) - معادلة النتيجة ، (z = dfrac { bar {x} - mu _ { bar {x}}} { sigma _ { bar {x}}} ) ، والحل بالنسبة إلى (س ) ، لدينا (س = 2 (0.05) + 2 = 2.1 )
  5. معدل (معدل الذكاء ) هو 75ذ النسبة المئوية - 25ذ النسبة المئوية (= 203.37 - 196.63 = 6.74 )

تمرين ( PageIndex {3} )

استنادًا إلى بيانات المسح الصحي الوطني ، فإن النساء اللائي تتراوح أعمارهن بين 18 و 24 عامًا لديهن متوسط ​​ضغط دم انقباضي (ملم زئبق) يبلغ 114.8 مع انحراف معياري قدره 13.1. ضغط الدم الانقباضي للنساء اللواتي تتراوح أعمارهن بين 18 و 24 عامًا يتبعن توزيعًا طبيعيًا.

  1. إذا تم اختيار امرأة واحدة من هذه المجموعة بشكل عشوائي ، فابحث عن احتمال أن يكون ضغط الدم الانقباضي لديها أكبر من 120.
  2. إذا تم اختيار 40 امرأة من هذه المجموعة بشكل عشوائي ، فابحث عن احتمال أن يكون متوسط ​​ضغط الدم الانقباضي لديهن أكبر من 120.
  3. إذا كانت العينة تتكون من أربع نساء تتراوح أعمارهن بين 18 و 24 عامًا ولم نكن نعرف التوزيع الأصلي ، فهل يمكن استخدام نظرية الحد المركزي؟

إجابه

  1. (ف (س> 120) ) =عادي ((120،99،114.8،13.1) = 0.0272 ). هناك حوالي 3 ٪ ، أن المرأة المختارة عشوائياً سيكون لديها ضغط دم انقباضي أكبر من 120.
  2. (P ( bar {x}> 120) = )عادي ( left (120،114.8، dfrac {13.1} { sqrt {40}} right) = 0.006 ). هناك احتمال بنسبة 0.6٪ فقط أن يكون متوسط ​​ضغط الدم الانقباضي للمجموعة المختارة عشوائياً أكبر من 120.
  3. لا يمكن استخدام نظرية الحد المركزي إذا كان حجم العينة أربعة ولم نكن نعلم أن التوزيع الأصلي كان طبيعيًا. سيكون حجم العينة صغيرًا جدًا.

مثال ( PageIndex {4} )

تم إجراء دراسة حول العنف ضد البغايا وأعراض إجهاد ما بعد الصدمة الذي أصابهن. كان النطاق العمري للبغايا من 14 إلى 61. وكان متوسط ​​العمر 30.9 سنة مع انحراف معياري قدره تسع سنوات.

  1. في عينة مكونة من 25 عاهرة ، ما هو احتمال أن يكون متوسط ​​عمر المومسات أقل من 35؟
  2. هل من المحتمل أن يكون متوسط ​​عمر مجموعة العينة أكثر من 50 عامًا؟ فسر النتائج.
  3. في عينة من 49 مومس ، ما هو احتمال ألا يقل مجموع الأعمار عن 1600؟
  4. هل من المحتمل أن يكون مجموع أعمار 49 عاهرة هو 1595 كحد أقصى؟ فسر النتائج.
  5. أوجد 95ذ النسبة المئوية للعينة تعني سن 65 بائعة هوى. فسر النتائج.
  6. أوجد 90ذ النسبة المئوية لمجموع أعمار 65 عاهرة. فسر النتائج.

إجابه

  1. (P ( bar {x} <35) = )عادي ((- E99،35،30.9،1.8) = 0.9886 )
  2. (P ( bar {x}> 50) = )عادي ((50، E99،30.9،1.8) تقريبًا 0 ). بالنسبة لمجموعة العينة هذه ، يكاد يكون من المستحيل أن يكون متوسط ​​عمر المجموعة أكثر من 50. ومع ذلك ، لا يزال من الممكن أن يكون عمر الفرد في هذه المجموعة أكبر من 50 عامًا.
  3. (الفوسفور (مجموع س جغ 1600) = )عادي ((1600، E99،1514.10،63) = 0.0864 )
  4. (الفوسفور (مجموع س ليق 1،595) = )عادي ((- 99،1595،1514.10،63) = 0.9005 ). هذا يعني أن هناك احتمال بنسبة 90٪ أن يكون مجموع أعمار مجموعة العينة (n = 49 ) 1595 على الأكثر.
  5. 95 بالمائة =InvNorm ((0.95،30.9،1.1) = 32.7 ). وهذا يشير إلى أن 95٪ من بائعات الهوى في عينة الـ 65 تقل أعمارهن عن 32.7 سنة في المتوسط.
  6. النسبة المئوية التسعون =InvNorm ((0.90،2008.5،72.56) = 2101.5 ). يشير هذا إلى أن 90٪ من بائعات الهوى في عينة الـ 65 لديهن مجموع أعمار أقل من 2101.5 سنة.

تمرين ( PageIndex {4} )

ووفقًا لبيانات بوينج ، فإن طائرة 757 تقل 200 راكب ولها أبواب يبلغ متوسط ​​ارتفاعها 72 بوصة. افترض أن لدينا متوسط ​​69.0 بوصة وانحراف معياري 2.8 بوصة.

  1. ما هو متوسط ​​ارتفاع المدخل الذي يسمح لـ 95٪ من الرجال بدخول الطائرة دون الانحناء؟
  2. افترض أن نصف ال 200 راكب هم من الرجال. ما هو متوسط ​​ارتفاع المدخل الذي يفي بشرط وجود احتمال 0.95 أن يكون هذا الارتفاع أكبر من متوسط ​​ارتفاع 100 رجل؟
  3. للمهندسين الذين يصممون 757 ، ما النتيجة الأكثر صلة: الارتفاع من الجزء أ أم الجزء ب؟ لماذا ا؟

إجابه

  1. نعلم أن ( mu_ {x} = mu = 69 ) ولدينا ( sigma_ {x} = 2.8 ). تم العثور على ارتفاع المدخلInvNorm((0.95,69,2.8) = 73.61)
  2. نعلم أن ( mu_ {x} = mu = 69 ) ولدينا ( sigma_ {x} = 2.8 ). وبالتالي،InvNorm((0.95,69,0.28) = 69.49)
  3. عند تصميم ارتفاعات المدخل ، نحتاج إلى دمج أكبر قدر ممكن من التباين من أجل استيعاب أكبر عدد ممكن من الركاب. لذلك ، نحتاج إلى استخدام النتيجة بناءً على الجزء أ.

مثال ( PageIndex {5} )

افترض في روضة أطفال محلية من خلال 12ذ الصف (K - 12) بالمنطقة التعليمية ، يفضل 53 بالمائة من السكان مدرسة مستقلة للصفوف من K إلى 5. تم مسح عينة عشوائية بسيطة من 300.

  1. أوجد احتمال ذلك 150 على الأقل تفضل مدرسة تشارتر.
  2. أوجد احتمال ذلك 160 على الأكثر تفضل مدرسة تشارتر.
  3. أوجد احتمال ذلك أكثر من 155 تفضل مدرسة تشارتر.
  4. أوجد احتمال ذلك أقل من 147 تفضل مدرسة تشارتر.
  5. أوجد احتمال ذلك 175 بالضبط تفضل مدرسة تشارتر.

لنفترض (X = ) الرقم الذي يفضل مدرسة تشارتر للصفوف K من خلال 5. (X sim B (n، p) ) حيث (n = 300 ) و (p = 0.53 ). منذ (np> 5 ) و (nq> 5 ) ، استخدم التقريب العادي للحدين. الصيغ الخاصة بالمتوسط ​​والانحراف المعياري هي ( mu = np ) و ( sigma = sqrt {npq} ). المتوسط ​​هو 159 والانحراف المعياري 8.6447. المتغير العشوائي للتوزيع الطبيعي هو (X ). (Y sim N (159 ، 8.6447) ). راجع التوزيع العادي للحصول على تعليمات بشأن إرشادات الآلة الحاسبة.

بالنسبة للجزء أ ، أنت تشمل 150 لذلك (P (X geq 150) ) لها تقريب طبيعي (P (Y geq 149.5) = 0.8641 ).

عادي((149.5,10^{99},159,8.6447) = 0.8641).

بالنسبة للجزء ب ، أنت تشمل 160 لذلك (P (X leq 160) ) لها تقريب طبيعي (P (Y leq 160.5) = 0.5689 ).

عادي((0,160.5,159,8.6447) = 0.5689)

بالنسبة للجزء ج ، أنت استبعاد 155 لذلك (P (X> 155) ) لها تقريب طبيعي (P (y> 155.5) = 0.6572 ).

عادي((155.5,10^{99},159,8.6447) = 0.6572).

بالنسبة للجزء د ، أنت استبعاد 147 لذلك (P (X <147) ) لها تقريب طبيعي (P (Y <146.5) = 0.0741 ).

عادي((0,146.5,159,8.6447) = 0.0741)

بالنسبة للجزء هـ ، (P (X = 175) ) له تقريب طبيعي (P (174.5

عادي((174.5,175.5,159,8.6447) = 0.0083)

بسبب الآلات الحاسبة وبرامج الكمبيوتر التي تتيح لك حساب الاحتمالات ذات الحدين للقيم الكبيرة (n ) بسهولة ، فليس من الضروري استخدام التقريب العادي للتوزيع ذي الحدين ، بشرط أن يكون لديك حق الوصول إلى أدوات التكنولوجيا هذه. تحتوي معظم المعامل المدرسية على Microsoft Excel ، وهو مثال على برامج الكمبيوتر التي تحسب الاحتمالات ذات الحدين. يمكن للعديد من الطلاب الوصول إلى حاسبات سلسلة TI-83 أو 84 ، كما يمكنهم بسهولة حساب الاحتمالات للتوزيع ذي الحدين. إذا قمت بكتابة "حساب توزيع الاحتمال ذي الحدين" في مستعرض الإنترنت ، فيمكنك العثور على آلة حاسبة واحدة على الأقل عبر الإنترنت للحساب ذي الحدين.

على سبيل المثال ، يتم حساب الاحتمالات باستخدام التوزيع ذي الحدين التالي: ( (n = 300 and p = 0.53 )). قارن إجابتي التوزيع ذي الحدين والتوزيع العادي. راجع المتغيرات العشوائية المنفصلة للحصول على تعليمات حول إرشادات الآلة الحاسبة للحالة ذات الحدين.

(P (X geq 150) ):1 - ذو الحدين cdf((300,0.53,149) = 0.8641)

(P (X leq 160) ):ذو الحدين((300,0.53,160) = 0.5684)

(P (X> 155) ):1 - ذو الحدين cdf((300,0.53,155) = 0.6576)

(P (X <147) ):ذو الحدين((300,0.53,146) = 0.0742)

(P (X = 175) ): (أنت تستخدم ملف pdf ذي الحدين.)ذات الحدين pdf((300,0.53,175) = 0.0083)

تمرين ( PageIndex {5} )

في المدينة ، يفضل 46 في المائة من السكان الرئيس الحالي دون مورغان لمنصب رئيس البلدية. يتم أخذ عينة عشوائية بسيطة من 500. باستخدام عامل تصحيح الاستمرارية ، أوجد احتمال أن 250 على الأقل يفضلون دون مورغان لمنصب العمدة.

إجابه

0.0401

مراجع

  • بيانات من صحيفة وول ستريت جورنال.
  • "الصحة الوطنية وفحص التغذية." مركز السيطرة على الأمراض والوقاية منها. متاح على الإنترنت على http://www.cdc.gov/nchs/nhanes.htm (تمت الزيارة في 17 مايو 2013).

قائمة المصطلحات

توزع استثنائى
متغير عشوائي مستمر (RV) يظهر عندما نهتم بالفترات الزمنية بين بعض الأحداث العشوائية ، على سبيل المثال ، طول الفترة الزمنية بين وصول الطوارئ إلى المستشفى ، التدوين: (X sim Exp (m) ) . المتوسط ​​ ( mu = dfrac {1} {m} ) والانحراف المعياري هو ( sigma = dfrac {1} {m} ).دالة كثافة الاحتمال هي (f (x) = me ^ {- mx} )، (x geq 0 ) ودالة التوزيع التراكمي هي (P (X leq x) = 1 - e ^ { -mx} ).
تعني
رقم يقيس الاتجاه المركزي ؛ الاسم الشائع للمتوسط ​​هو "المتوسط". مصطلح "يعني" هو شكل مختصر من "الوسط الحسابي". بحكم التعريف ، متوسط ​​العينة (المشار إليه بواسطة ( bar {x} )) هو ( bar {x} = dfrac { text {مجموع جميع القيم في النموذج}} { text {Number من القيم في العينة}} ) ، والمتوسط ​​لمحتوى (يُشار إليه بواسطة ( mu )) هو ( mu = dfrac { text {مجموع جميع القيم في السكان}} { text {عدد القيم في المجتمع}} ).
التوزيع الطبيعي
متغير عشوائي مستمر (RV) مع pdf (f (x) = dfrac {1} { sigma sqrt {2 pi}} e ^ { dfrac {(x - mu) ^ {2}} { 2 sigma ^ {2}}} ) ، حيث ( mu ) هو متوسط ​​التوزيع و ( sigma ) هو الانحراف المعياري .؛ التدوين: (X sim N ( mu، sigma) ). إذا ( mu = 0 ) و ( sigma = 1 ) ، فإن RV يسمى التوزيع القياسي.
توزيع موحد
متغير عشوائي مستمر (RV) له نتائج محتملة متساوية على المجال ، (أ <س <ب)؛ غالبًا ما يشار إليه باسم التوزيع المستطيل لأن الرسم البياني لقوات الدفاع الشعبي له شكل مستطيل. تدوين: (X sim U (a، b) ). المتوسط ​​ ( mu = dfrac {a + b} {2} ) والانحراف المعياري هو ( sigma = sqrt { dfrac {(ba) ^ {2}} {12}} ) . دالة كثافة الاحتمال هي (f (x) = dfrac {a + b} {2} ) لـ (a

نظرية الحدود المركزية (CLT)

في دراسة نظرية الاحتمالات ، تنص نظرية الحد المركزي (CLT) على أن توزيع العينة يقارب التوزيع الطبيعي (المعروف أيضًا باسم "منحنى الجرس") حيث يصبح حجم العينة أكبر ، على افتراض أن جميع العينات متطابقة في الحجم ، وبغض النظر عن شكل توزيع السكان.

بطريقة أخرى ، تعتبر CLT نظرية إحصائية تنص على أنه بالنظر إلى حجم عينة كبير بما فيه الكفاية من مجموعة سكانية ذات مستوى تباين محدود ، فإن متوسط ​​جميع العينات من نفس المجتمع سيكون مساويًا تقريبًا لمتوسط ​​السكان. علاوة على ذلك ، ستتبع جميع العينات نمط توزيع طبيعي تقريبي ، مع تساوي جميع الفروق تقريبًا مع تباين السكان ، مقسومًا على حجم كل عينة.

الماخذ الرئيسية

  • تنص نظرية الحد المركزي (CLT) على أن توزيع العينة يقارب التوزيع الطبيعي مع زيادة حجم العينة.
  • تعتبر أحجام العينات التي تساوي أو تزيد عن 30 كافية لعقد CLT.
  • يتمثل أحد الجوانب الرئيسية لـ CLT في أن متوسط ​​متوسط ​​العينة والانحرافات المعيارية ستساوي متوسط ​​المحتوى والانحراف المعياري.
  • يمكن لحجم العينة الكبير بدرجة كافية أن يتنبأ بخصائص السكان بدقة.

على الرغم من أن أبراهام دي موفر قد طور هذا المفهوم لأول مرة في عام 1733 ، إلا أنه لم يتم تسميته رسميًا حتى عام 1930 ، عندما أطلق عليه عالم الرياضيات المجري الشهير جورج بوليا اسم نظرية الحدود المركزية.

نظرية الحد المركزي


قانون الأعداد الكبيرة

ينص قانون الأعداد الكبيرة على أنه إذا أخذت عينات ذات حجم أكبر وأكبر من أي مجموعة ، فإن المتوسط ​​ ( bar) من العينة يميل إلى الاقتراب أكثر فأكثر من ( mu ). من نظرية الحد المركزية ، نعلم أنه كلما زاد حجم (n ) وأكبر ، فإن العينة تعني اتباع التوزيع الطبيعي. كلما زاد (n ) كلما قل الانحراف المعياري. (تذكر أن الانحراف المعياري لـ ( bar) هو ( dfrac < سيغما> < sqrt> ).) وهذا يعني أن العينة تعني ( شريط) يجب أن يكون قريبًا من متوسط ​​السكان ( mu ). يمكننا أن نقول أن ( mu ) هي القيمة التي تعني العينة الاقتراب حيث (n ) يكبر. توضح نظرية الحد المركزي قانون الأعداد الكبيرة.

يتم إجراء دراسة تنطوي على الإجهاد بين الطلاب في الحرم الجامعي. تتبع درجات الإجهاد توزيعًا موحدًا بأقل درجة إجهاد تساوي واحدًا وأعلى درجة تساوي خمسة. باستخدام عينة من 75 طالبًا ، ابحث عن:

  1. احتمال أن يكون يعني درجة الإجهاد بالنسبة لـ 75 طالبًا أقل من اثنين.
  2. النسبة المئوية التسعون لـ يعني درجة الإجهاد لـ 75 طالبًا.
  3. احتمال أن يكون مجموع درجات الإجهاد 75 أقل من 200.
  4. النسبة المئوية التسعون لـ مجموع نقاط الإجهاد لـ 75 طالبًا.

تطلب منك المشكلتان (أ) و (ب) إيجاد احتمال أو نسبة مئوية لمتوسط. تطلب منك المشكلتان (ج) و (د) إيجاد احتمال أو نسبة مئوية لـ a المجموع أو المجموع. حجم العينة (n ) يساوي 75.

نظرًا لأن درجات الإجهاد الفردية تتبع توزيعًا موحدًا ، (X sim U (1 ، 5) ) حيث (أ = 1 ) و (ب = 5 ).

للمشاكل 1. و 2. ، دع ( bar = ) متوسط ​​درجة الإجهاد لـ 75 طالبًا. ثم،

  1. ابحث عن (P ( bar & lt 2) ). ارسم الرسم البياني.
  2. أوجد النسبة المئوية 90 لمتوسط ​​75 درجة من درجات الإجهاد. ارسم رسمًا بيانيًا.
  3. أوجد (P ( sum x & lt 2000) ). ارسم الرسم البياني.
  4. أوجد النسبة المئوية التسعين لإجمالي 75 درجة من درجات الإجهاد. ارسم رسمًا بيانيًا.

أ. (ف ( بار & lt 2) = 0 )

احتمال أن يكون متوسط ​​درجة الإجهاد أقل من اثنين هو حوالي صفر.

الشكل ( PageIndex <1> ).

أصغر درجة ضغط هي واحدة

ب. دع (k = ) النسبة المئوية التسعين.

ابحث عن (k ) حيث (P ( bar & lt ك) = 0.90 ).

الشكل ( PageIndex <2> ).

النسبة المئوية 90 لمتوسط ​​75 درجة هي حوالي 3.2. هذا يخبرنا أن 90٪ من جميع وسائل 75 درجة إجهاد هي 3.2 على الأكثر ، و 10٪ على الأقل 3.2.

بالنسبة للمسائل c و d ، دع ( sum X = ) مجموع درجات الإجهاد 75. ثم،

ج. متوسط ​​مجموع 75 درجة ضغط هو ((75) (3) = 225 )

الانحراف المعياري لمجموع 75 درجة ضغط هو (( sqrt <75>) (1.15) = 9.96 )

الشكل ( PageIndex <3> ).

احتمال أن يكون إجمالي النقاط البالغ 75 أقل من 200 هو حوالي صفر.

أصغر مجموع من درجات الإجهاد 75 هو 75 ، لأن أصغر درجة فردية هي واحدة.

د. دع (k = ) النسبة المئوية التسعين.

ابحث عن (k ) حيث (P ( sum x & lt k) = 0.90 ).

الشكل ( PageIndex <4> ).

النسبة المئوية 90 لمجموع 75 درجة هي حوالي 237.8. هذا يخبرنا أن 90٪ من مجموع 75 درجة لا تزيد عن 237.8 وأن 10٪ لا تقل عن 237.8.

InvNorm ( left (0.90، (75) (3)، ( sqrt <75>) (1.15) right) = 237.8 )

استخدم المعلومات الموجودة في المثال ( PageIndex <1> ) ، ولكن استخدم حجم عينة من 55 للإجابة على الأسئلة التالية.

  1. ابحث عن (P ( bar العلامة & lt 7) ).
  2. أوجد (P ( sum x & lt 7) ).
  3. أوجد المئين 80 لمتوسط ​​55 درجة.
  4. أوجد المئين 85 لمجموع 55 درجة.

لنفترض أن محلل أبحاث السوق في شركة للهواتف المحمولة يجري دراسة لعملائهم الذين تجاوزوا الحد الزمني المدرج في عقد الهاتف الخلوي الأساسي الخاص بهم ، وجد المحلل أنه بالنسبة لأولئك الأشخاص الذين تجاوزوا الوقت المدرج في عقدهم الأساسي ، الوقت الزائد المستخدم يتبع التوزيع الأسي بمتوسط ​​22 دقيقة.

ضع في اعتبارك عينة عشوائية من 80 عميلًا تجاوزوا الحد الزمني المتاح في عقد الهاتف الخلوي الأساسي.

اسمح (X = ) بالوقت الإضافي الذي يستخدمه عميل واحد للهاتف الخلوي الفردي الذي يتجاوز الوقت المتعاقد عليه.

(X sim Exp left ( dfrac <1> <22> right) ). من الفصول السابقة ، نعلم أن ( مو = 22 ) و ( سيجما = 22 ).

اسمحوا ( بار) = متوسط ​​الوقت الإضافي الذي تستخدمه عينة من (n = 80 ) العملاء الذين تجاوزوا الوقت المسموح لهم بالتعاقد معهم.

بواسطة نظرية الحد المركزي لوسائل العينة

  1. أوجد احتمال أن يكون متوسط ​​الوقت الزائد الذي استخدمه 80 عميلًا في العينة أطول من 20 دقيقة. هذا يطلب منا إيجاد (P ( bar & GT 20) ). ارسم الرسم البياني.
  2. لنفترض أن أحد العملاء الذي تجاوز الحد الزمني لعقد هاتفه الخلوي قد تم اختياره عشوائيًا. أوجد احتمال أن يكون الوقت الإضافي لهذا العميل الفردي أطول من 20 دقيقة. هذا يطلب منا إيجاد (P (x & gt 20) ).
  3. اشرح سبب اختلاف الاحتمالات في الجزأين (أ) و (ب).
  4. أوجد المئين 95 عشر لـ العينة تعني الوقت الزائد لعينات من 80 عميلًا تجاوزوا حدود وقت العقد الأساسي. ارسم رسمًا بيانيًا.

(ف ( بار & gt 20) = 0.79199 ) باستخدام normalcdf ( left (20،1 text99،22، dfrac <22> < sqrt <80>> right) )

الاحتمال هو 0.7919 أن متوسط ​​الوقت الزائد المستخدم هو أكثر من 20 دقيقة ، لعينة من 80 عميلًا يتجاوزون الوقت المسموح به المتعاقد معهم.

الشكل ( PageIndex <5> ).

1E99 = 10 99 و & ndash1E99 = & ndash10 99 . اضغط على مفتاح EE لـ E. أو استخدم فقط 10 99 بدلاً من 1E99.

  1. (P (x & gt 20) = 0.4029 ) لكن (P ( bar & GT 20) = 0.7919 )
  2. الاحتمالات ليست متساوية لأننا نستخدم توزيعات مختلفة لحساب الاحتمال للأفراد وللوسائل.
  3. عندما يُطلب منك العثور على احتمال قيمة فردية ، استخدم التوزيع المحدد لمتغيرها العشوائي لا تستخدم clt. استخدم clt مع التوزيع الطبيعي عندما يُطلب منك إيجاد احتمال الوسط.

(k = 26.0 ) باستخدام invNorm ( left (0.95،22، dfrac <22> < sqrt <80>> right) = 26.0 )

الشكل ( PageIndex <6> ).

المئين 95 عشر ل العينة تعني الوقت الزائد المستخدم حوالي 26.0 دقيقة للعينات العشوائية لـ 80 عميلًا تجاوزوا الوقت المسموح به في العقد.

خمسة وتسعون في المائة من هذه العينات سيكون لها وسائل أقل من 26 دقيقة فقط خمسة في المائة من هذه العينات سيكون لها متوسط ​​أعلى من 26 دقيقة.

استخدم المعلومات الموجودة في المثال ( PageIndex <2> ) ، ولكن قم بتغيير حجم العينة إلى 144.

  1. ابحث عن (P (20 & lt bar & LT 30) ).
  2. أوجد (P ( sum x text <هو على الأقل> 3،000) ).
  3. أوجد المئين 75 للعينة يعني الوقت الزائد لـ 144 عميلًا.
  4. أوجد المئين 85 لمجموع 144 مرة زائدة يستخدمها العملاء.

في الولايات المتحدة ، يتم الاعتداء الجنسي على شخص كل دقيقتين في المتوسط ​​، وفقًا لعدد من الدراسات. لنفترض أن الانحراف المعياري هو 0.5 دقيقة وأن حجم العينة هو 100.

  1. أوجد الوسيط والربيع الأول والربيع الثالث للعينة متوسط ​​وقت الاعتداءات الجنسية في الولايات المتحدة.
  2. أوجد الوسيط والربيع الأول والربيع الثالث لمجموع أوقات عينة الاعتداءات الجنسية في الولايات المتحدة.
  3. أوجد احتمال حدوث اعتداء جنسي في المتوسط ​​بين 1.75 و 1.85 دقيقة.
  4. أوجد القيمة التي تكون انحرافين معياريين أعلى من متوسط ​​العينة.
  5. أعثر على IQR لمجموع أوقات العينة.
  1. لدينا ( mu_ = مو = 2 ) و ( سيغما_ = dfrac < سيغما> < sqrt> = dfrac <0.5> <10> = 0.05 ). وبالتالي:
    1. النسبة المئوية الخمسون (= mu_ = مو = 2 )
    2. النسبة المئوية الخامسة والعشرون (= text(0.25,2,0.05) = 1.97)
    3. النسبة المئوية الخامسة والسبعون (= text(0.75,2,0.05) = 2.03)
    1. النسبة المئوية الخمسون = ( mu_ < sum X> = n ( mu_) = 100(2) = 200)
    2. النسبة المئوية الخامسة والعشرون (= text(0.25,200,5) = 196.63)
    3. النسبة المئوية الخامسة والسبعون (= text(0.75,200,5) = 203.37)

    استنادًا إلى بيانات المسح الصحي الوطني ، فإن النساء اللائي تتراوح أعمارهن بين 18 و 24 عامًا لديهن متوسط ​​ضغط دم انقباضي (ملم زئبق) يبلغ 114.8 مع انحراف معياري قدره 13.1. ضغط الدم الانقباضي للنساء اللواتي تتراوح أعمارهن بين 18 و 24 عامًا يتبعن توزيعًا طبيعيًا.

    1. إذا تم اختيار امرأة واحدة من هذه المجموعة بشكل عشوائي ، فابحث عن احتمال أن يكون ضغط الدم الانقباضي لديها أكبر من 120.
    2. إذا تم اختيار 40 امرأة من هذه المجموعة بشكل عشوائي ، فابحث عن احتمال أن يكون متوسط ​​ضغط الدم الانقباضي لديهن أكبر من 120.
    3. إذا كانت العينة تتكون من أربع نساء تتراوح أعمارهن بين 18 و 24 عامًا ولم نكن نعرف التوزيع الأصلي ، فهل يمكن استخدام نظرية الحد المركزي؟
    1. (P (x & gt 120) ) = normalcdf ((120،99،114.8،13.1) = 0.0272 ). هناك حوالي 3 ٪ ، أن المرأة المختارة عشوائياً سيكون لديها ضغط دم انقباضي أكبر من 120.
    2. (ف ( بار & gt 120) = ) normalcdf ( left (120114.8، dfrac <13.1> < sqrt <40>> right) = 0.006 ). هناك احتمال بنسبة 0.6٪ فقط أن يكون متوسط ​​ضغط الدم الانقباضي للمجموعة المختارة عشوائياً أكبر من 120.
    3. لا يمكن استخدام نظرية الحد المركزي إذا كان حجم العينة أربعة ولم نكن نعلم أن التوزيع الأصلي كان طبيعيًا. سيكون حجم العينة صغيرًا جدًا.

    تم إجراء دراسة حول العنف ضد البغايا وأعراض إجهاد ما بعد الصدمة الذي أصابهن. كان النطاق العمري للبغايا من 14 إلى 61. وكان متوسط ​​العمر 30.9 سنة مع انحراف معياري قدره تسع سنوات.

    1. في عينة مكونة من 25 عاهرة ، ما هو احتمال أن يكون متوسط ​​عمر المومسات أقل من 35؟
    2. هل من المحتمل أن يكون متوسط ​​عمر مجموعة العينة أكثر من 50 عامًا؟ فسر النتائج.
    3. في عينة من 49 مومس ، ما هو احتمال ألا يقل مجموع الأعمار عن 1600؟
    4. هل من المحتمل أن يكون مجموع أعمار 49 عاهرة هو 1595 كحد أقصى؟ فسر النتائج.
    5. أوجد النسبة المئوية الخامسة والتسعين لعينة متوسط ​​عمر 65 بائعة هوى. فسر النتائج.
    6. أوجد النسبة المئوية التسعين لمجموع أعمار 65 عاهرة. فسر النتائج.
    1. (ف ( بار & lt 35) = ) normalcdf ((- E99،35،30.9،1.8) = 0.9886 )
    2. (ف ( بار & gt 50) = ) normalcdf ((50، E99،30.9،1.8) تقريبًا 0 ). بالنسبة لمجموعة العينة هذه ، يكاد يكون من المستحيل أن يكون متوسط ​​عمر المجموعة و rsquos أكثر من 50. ومع ذلك ، لا يزال من الممكن أن يكون عمر الفرد في هذه المجموعة أكبر من 50 عامًا.
    3. (P ( sum x geq 1،600) = ) normalcdf ((1600، E99،1514.10،63) = 0.0864 )
    4. (P ( sum x leq 1،595) = ) normalcdf ((- E99،1595،1514.10،63) = 0.9005 ). هذا يعني أن هناك احتمال بنسبة 90٪ أن يكون مجموع أعمار مجموعة العينة (n = 49 ) 1595 على الأكثر.
    5. المئين 95 = invNorm ((0.95،30.9،1.1) = 32.7 ). وهذا يشير إلى أن 95٪ من بائعات الهوى في عينة الـ 65 تقل أعمارهن عن 32.7 سنة في المتوسط.
    6. النسبة المئوية التسعون = invNorm ((0.90،2008.5،72.56) = 2101.5 ). يشير هذا إلى أن 90٪ من بائعات الهوى في عينة الـ 65 لديهن مجموع أعمار أقل من 2101.5 سنة.

    ووفقًا لبيانات بوينج ، فإن طائرة 757 تقل 200 راكب ولها أبواب يبلغ متوسط ​​ارتفاعها 72 بوصة. افترض أن لدينا متوسط ​​69.0 بوصة وانحراف معياري 2.8 بوصة.

    1. ما هو متوسط ​​ارتفاع المدخل الذي يسمح لـ 95٪ من الرجال بدخول الطائرة دون الانحناء؟
    2. افترض أن نصف ال 200 راكب هم من الرجال. ما هو متوسط ​​ارتفاع المدخل الذي يفي بشرط وجود احتمال 0.95 أن يكون هذا الارتفاع أكبر من متوسط ​​ارتفاع 100 رجل؟
    3. للمهندسين الذين يصممون 757 ، ما النتيجة الأكثر صلة: الارتفاع من الجزء أ أم الجزء ب؟ لماذا ا؟
    1. نحن نعلم أن ( mu_ = مو = 69 ) ولدينا ( سيجما_ = 2.8 ). تم العثور على ارتفاع المدخل ليكون invNorm ((0.95،69،2.8) = 73.61 )
    2. نحن نعلم أن ( mu_ = مو = 69 ) ولدينا ( سيجما_ = 2.8 ). إذن ، invNorm ((0.95،69،0.28) = 69.49 )
    3. عند تصميم ارتفاعات المدخل ، نحتاج إلى دمج أكبر قدر ممكن من التباين من أجل استيعاب أكبر عدد ممكن من الركاب. لذلك ، نحتاج إلى استخدام النتيجة بناءً على الجزء أ.

    ملاحظة تاريخية: تقريب عادي إلى ذي الحدين

    من الناحية التاريخية ، كانت القدرة على حساب الاحتمالات ذات الحدين أحد أهم تطبيقات نظرية الحد المركزي. تم عرض الاحتمالات ذات الحدين ذات القيمة الصغيرة لـ (n ) (على سبيل المثال ، 20) في جدول في كتاب. لحساب الاحتمالات ذات القيم الكبيرة لـ (n ) ، كان عليك استخدام الصيغة ذات الحدين ، والتي قد تكون معقدة للغاية. استخدام التقريب العادي للتوزيع ذي الحدين يبسط العملية. لحساب التقريب الطبيعي للتوزيع ذي الحدين ، خذ عينة عشوائية بسيطة من المجتمع. يجب أن تستوفي شروط التوزيع ذي الحدين:

    • يوجد عدد محدد (n ) من التجارب المستقلة
    • نتائج أي تجربة هي النجاح أو الفشل
    • كل تجربة لها نفس احتمالية النجاح (ع )

    تذكر أنه إذا كان (X ) هو المتغير العشوائي ذي الحدين ، ثم (X sim B (n، p) ). يجب أن يكون شكل التوزيع ذي الحدين مشابهًا لشكل التوزيع الطبيعي. لضمان ذلك ، يجب أن تكون الكميتان (np ) و (nq ) أكبر من خمسة ( (np & gt 5 ) و (nq & gt 5 )) يكون التقريب أفضل إذا كان كلاهما أكبر من أو يساوي 10). ثم يمكن تقريب ذات الحدين بالتوزيع العادي بمتوسط ​​ ( mu = np ) والانحراف المعياري ( sigma = sqrt). تذكر أن (q = 1 - p ). للحصول على أفضل تقريب ، أضف 0.5 إلى (س ) أو اطرح 0.5 من (س ) (استخدم (س + 0.5 ) أو (س - 0.5 )). الرقم 0.5 يسمى عامل تصحيح الاستمرارية ويستخدم في المثال التالي.

    لنفترض أنه في إحدى المدارس المحلية من روضة الأطفال حتى الصف الثاني عشر (K - 12) ، يفضل 53 بالمائة من السكان مدرسة تشارتر للصفوف من K إلى 5. تم مسح عينة عشوائية بسيطة من 300.

    1. أوجد احتمال ذلك 150 على الأقل تفضل مدرسة تشارتر.
    2. أوجد احتمال ذلك 160 على الأكثر تفضل مدرسة تشارتر.
    3. أوجد احتمال ذلك أكثر من 155 تفضل مدرسة تشارتر.
    4. أوجد احتمال ذلك أقل من 147 تفضل مدرسة تشارتر.
    5. أوجد احتمال ذلك 175 بالضبط تفضل مدرسة تشارتر.

    لنفترض (X = ) الرقم الذي يفضل مدرسة تشارتر للصفوف K من خلال 5. (X sim B (n، p) ) حيث (n = 300 ) و (p = 0.53 ). منذ (np & gt 5 ) و (nq & gt 5 ) ، استخدم التقريب العادي للحدين. الصيغ الخاصة بالمتوسط ​​والانحراف المعياري هي ( mu = np ) و ( sigma = sqrt). المتوسط ​​هو 159 والانحراف المعياري 8.6447. المتغير العشوائي للتوزيع الطبيعي هو (X ). (Y sim N (159 ، 8.6447) ). راجع التوزيع العادي للحصول على تعليمات بشأن إرشادات الآلة الحاسبة.

    بالنسبة للجزء أ ، أنت تشمل 150 لذلك (P (X geq 150) ) لها تقريب طبيعي (P (Y geq 149.5) = 0.8641 ).

    normalcdf ((149.5،10 ^ <99>، 159،8.6447) = 0.8641 ).

    بالنسبة للجزء ب ، أنت تشمل 160 لذلك (P (X leq 160) ) لها تقريب طبيعي (P (Y leq 160.5) = 0.5689 ).

    عادي cdf ((0،160.5،159،8.6447) = 0.5689 )

    بالنسبة للجزء ج ، أنت استبعاد 155 لذلك (P (X & gt 155) ) لها تقريب طبيعي (P (y & gt 155.5) = 0.6572 ).

    normalcdf ((155.5،10 ^ <99> ، 159،8.6447) = 0.6572 ).

    بالنسبة للجزء د ، أنت استبعاد 147 لذلك (P (X & lt 147) ) له تقريب طبيعي (P (Y & lt 146.5) = 0.0741 ).

    عادي cdf ((0،146.5،159،8.6447) = 0.0741 )

    بالنسبة للجزء هـ ، (P (X = 175) ) له تقريب طبيعي (P (174.5 & lt Y & lt 175.5) = 0.0083 ).

    عادي cdf ((174.5،175.5،159،8.6447) = 0.0083 )

    بسبب الآلات الحاسبة وبرامج الكمبيوتر التي تتيح لك حساب الاحتمالات ذات الحدين للقيم الكبيرة (n ) بسهولة ، فليس من الضروري استخدام التقريب العادي للتوزيع ذي الحدين ، بشرط أن يكون لديك حق الوصول إلى أدوات التكنولوجيا هذه. تحتوي معظم المعامل المدرسية على Microsoft Excel ، وهو مثال على برامج الكمبيوتر التي تحسب الاحتمالات ذات الحدين. يمكن للعديد من الطلاب الوصول إلى حاسبات سلسلة TI-83 أو 84 ، كما يمكنهم بسهولة حساب الاحتمالات للتوزيع ذي الحدين. إذا كتبت & quot؛ حساب توزيع الاحتمالات ذات الحدين & quot في مستعرض الإنترنت ، فيمكنك العثور على آلة حاسبة واحدة على الأقل عبر الإنترنت للحساب ذي الحدين.

    على سبيل المثال ، يتم حساب الاحتمالات باستخدام التوزيع ذي الحدين التالي: ( (n = 300 and p = 0.53 )). قارن بين إجابتي التوزيع ذي الحدين والتوزيع العادي. راجع المتغيرات العشوائية المنفصلة للحصول على تعليمات حول إرشادات الآلة الحاسبة للحالة ذات الحدين.

    (P (X geq 150) ): 1 - ذي الحدين cdf ((300،0.53،149) = 0.8641 )

    (P (X leq 160) ): ذو الحدين cdf ((300،0.53،160) = 0.5684 )

    (P (X & gt 155) ): 1 - ذي الحدين cdf ((300،0.53،155) = 0.6576 )

    (P (X & lt 147) ): ذي الحدين cdf ((300،0.53،146) = 0.0742 )

    (P (X = 175) ): (يمكنك استخدام ملف pdf ذي الحدين.) binomialpdf ((300،0.53،175) = 0.0083 )

    في المدينة ، يفضل 46 في المائة من السكان الرئيس الحالي دون مورغان لمنصب رئيس البلدية. يتم أخذ عينة عشوائية بسيطة من 500. باستخدام عامل تصحيح الاستمرارية ، أوجد احتمال أن 250 على الأقل يفضلون دون مورغان لمنصب العمدة.


    5.2: استخدام نظرية النهاية المركزية - الرياضيات

    في نشاط The Central Limit Theorem (الجزء الأول) ، اختتمنا بالملاحظات التالية حول نظرية الحدود المركزية.

    1. إذا قمت بسحب عينات من التوزيع الطبيعي ، فإن توزيع متوسط ​​العينة أمر طبيعي أيضًا.
    2. يكون متوسط ​​توزيع وسائل العينة مطابقًا لمتوسط ​​"السكان الأصليين" ، أي المجتمع الذي يتم أخذ العينات منه.
    3. كلما زاد حجم العينة التي يتم رسمها ، سيكون انتشار توزيع وسائل العينة "أضيق".

    ذكرنا أننا سنقوم بتنقيح هذا البيان الخاص بنظرية الحدود المركزية في المزيد من الأنشطة. دعنا ننتقل إلى القيام بذلك الآن.

    ماذا لو كان توزيع الوالدين غير طبيعي؟

    في نشاط The Central Limit Theorem (الجزء الأول) ، أخذنا عينات عشوائية من مجموعة السكان "الأم" التي كان توزيعها "طبيعيًا". في هذا النشاط ، سنختار السكان الأبوين غير الطبيعيين ، ثم نرى ما إذا كانت استنتاجات نظرية الحدود المركزية لا تزال سارية.

    في نشاط التوزيعات المستمرة ، قدمنا ​​التوزيع الأسي المحدد بواسطة دالة كثافة الاحتمال التالية.

    دالة الكثافة الاحتمالية الأسية

    شكل 1. دالة كثافة الاحتمال الأسي لها متوسط ​​وانحراف معياري يساوي 1 / & lambda.

    يمكننا بسهولة رسم مخطط التوزيع لـ & lambda = 1.

    بعض التعليقات بالترتيب للأمر منحنى.

    • بناء الجملة منحنى (expr، from =، to =) اسكتشات الرسم البياني لـ إكسبر على الفاصل الزمني (من ، إلى).
    • في هذا المثال ، من = 0 إلى = 4.

    ال منحنى ينتج الأمر أعلاه منحنى كثافة الاحتمال للتوزيع الأسي الموضح في الشكل 2.

    الشكل 2. رسم دالة كثافة الاحتمال للتوزيع الأسي (& lambda = 1).

    لاحظ أن التوزيع الأسي الموضح في الشكل 2 هو ليس عادي.

    الحرف r & [مدش] رسم أرقام عشوائية

    في الأنشطة السابقة (على سبيل المثال ، التوزيع الطبيعي والتوزيعات المستمرة) ، قدمنا ​​استخدام الأحرف d و p و q فيما يتعلق بالتوزيعات المختلفة (على سبيل المثال ، عادي وموحد وأسي). تذكير باستخدامها كما يلي:

    • "d" تعني "الكثافة". يتم استخدامه لإيجاد قيم دالة كثافة الاحتمال.
    • "p" تعني "احتمال". يتم استخدامه لإيجاد احتمال أن المتغير العشوائي تقع على اليسار من رقم معين.
    • "q" تعني "quantile." يتم استخدامه لإيجاد الكميات لتوزيع معين.

    يوجد حرف رابع ، وهو "r" ، يستخدم لرسم أرقام عشوائية من التوزيع. دعنا نستخدم rexp أمر بسحب 500 رقم عشوائيًا من التوزيع الأسي بمتوسط ​​1 والانحراف المعياري 1.

    يمكننا عرض النتيجة ، وبعضها معروض أدناه.

    عند فحص الأرقام المخزنة في المتغير x، من الصعب فهم توزيع الأرقام. ومع ذلك ، يوفر الرسم البياني لهذا التحديد فهماً أفضل للبيانات المخزنة في x.

    ينتج عن الأمر أعلاه الرسم البياني الموضح في الشكل 3.

    الشكل 3. رسم بياني من 500 رقم عشوائي مأخوذ من التوزيع الأسي باستخدام & lambda = 1

    عدة تعليقات بالترتيب فيما يتعلق بالرسم البياني في الشكل 3:

    1. الرسم البياني هو ليس عادي. في الواقع ، التوزيع منحرف بالتأكيد إلى اليمين.
    2. بصريًا ، ليس من غير المعقول تقدير أن "نقطة التوازن" أو "مركز" التوزيع قريبة من 1. ومع ذلك ، فإن الحساب السريع يوفر دليلًا مقنعًا على أن المتوسط ​​هو 1.

    وسائل توزيع العينة

    في الأمثلة السابقة ، قمنا بسحب 500 رقم عشوائي من التوزيع الأسي بمتوسط ​​وانحراف معياري يساوي 1. وهذا ما يسمى "رسم عينة بحجم 500" من التوزيع الأسي مع الانحراف المتوسط ​​والمعياري eqyak ti 1. وهذا يؤدي إلى عينة من 500 رقم عشوائي. أحد الأسئلة الفورية التي يمكننا طرحها هو "ما هو متوسط ​​العينة لدينا؟"

    وبالتالي ، فإن متوسط ​​هذه العينة هو 1.006549.

    بالطبع ، إذا أخذنا عينة أخرى من 500 رقم عشوائي من التوزيع الأسي بمتوسط ​​وانحراف معياري يساوي 1 ، نحصل على عينة جديدة لها متوسط ​​مختلف.

    في هذه الحالة لدينا عينة جديدة من 500 رقم تم اختيارهم عشوائياً ، والمتوسط ​​الخاص بهذه العينة يقدم نتيجة مختلفة وهي 0.9780556. السؤال التالي الذي يجب طرحه هو "ماذا سيحدث إذا فعلنا ذلك بشكل متكرر؟"

    إنتاج متجه من وسائل العينة

    في النشاط التالي ، سنقوم بأخذ عينات من التوزيع الأسي بشكل متكرر. ستختار كل عينة خمسة أرقام عشوائية من التوزيع الأسي بمتوسط ​​وانحراف معياري يساوي 1. ثم سنجد متوسط ​​الأرقام الخمسة في عينتنا. سنكرر هذه التجربة 500 مرة ، ونجمع متوسط ​​العينة في متجه xbar ونحن نمضي.

    نبدأ بالإعلان عن معدل التوزيع الأسي الذي سنستخلص منه أرقامًا عشوائية. ثم نعلن حجم العينة (عدد الأرقام العشوائية المرسومة).

    في كل مرة نرسم عينة من الحجم ن = 5 من التوزيع الأسي الذي يعني & مو = 1 والانحراف المعياري & سيجما = 1، نحتاج إلى مكان ما لتخزين متوسط ​​العينة. نظرًا لأننا نعتزم جمع وسائل 500 عينة ، فإننا نبدأ متجهًا xbar لاحتواء 500 صفر في البداية.

    ال اعادة عد الأمر "يكرر" الإدخال صفر 500 مرة. نتيجة لذلك ، فإن المتجه xbar يحتوي الآن على 500 إدخال ، كل منها صفر.

    من السهل رسم عينة من الحجم ن = 5 من التوزيع الأسي الذي يعني & مو = 1 والانحراف المعياري & سيجما = 1. نحن ببساطة نصدر الأمر إكسب (ن ، معدل = لامدا). للعثور على متوسط ​​هذه النتيجة ، نقوم ببساطة بإضافة التعديل يعني (exp (n ، rate = lambda)). الخطوة الأخيرة هي تخزين هذه النتيجة في المتجه xbar. ثم يجب أن نكرر هذه العملية نفسها 499 مرة إضافية ليصبح المجموع 500 عينة. هذا يتطلب استخدام ملف ل عقدة.

    ال ل البناء المستخدم من قبل R يشبه "حلقات for" المستخدمة في العديد من لغات البرمجة.

    • ال أنا في لـ (أنا في 1: 500) يسمى فهرس من "حلقة for".
    • مؤشر أنا يتم ضبطه أولاً على 1 ، ثم يتم تنفيذ "جسم" "حلقة for" (الجزء بين الأقواس المتعرجة). في التكرار التالي ، أنا يساوي 2 ويتم تنفيذ جسم الحلقة مرة أخرى. تستمر الحلقة بهذه الطريقة ، بزيادة الفهرس أنا بمقدار 1 ، أخيرًا إعداد الفهرس أنا إلى 500 ، حيث يتم تنفيذ جسم الحلقة مرة أخيرة. ثم يتم إنهاء "حلقة for".
    • في جسم "for loop" لدينا xbar [i] = متوسط ​​(exp (n، rate = lambda)). هذا يرسم عينة من الحجم ن = 5 من التوزيع الأسي ، ويحسب متوسط ​​العينة ، ويخزن النتيجة في xbar [i]، دخول xbar.
    • عندما تكمل "الحلقة for" 500 تكرار ، يكون المتجه xbar يحتوي على 500 عينة من الحجم ن = 5 مستمدة من التوزيع الأسي الذي يعني & مو = 1 والانحراف المعياري & سيجما = 1.

    إنها مهمة بسيطة لرسم الرسم البياني لوسائل العينة الواردة في المتجه xbar.

    ينتج عن الأمر أعلاه الرسم البياني الموضح في الشكل 4.

    الشكل 4. يعني الرسم البياني للعينة.

    هناك عدد من الملاحظات المهمة التي يجب إجراؤها حول الرسم البياني لوسائل العينة في الشكل 4 ، لا سيما عند مقارنتها مع الرسوم البيانية للشكلين 2 و 3.

    1. من الضروري ملاحظة الملصقات على المحور الأفقي. في الشكلين 2 و 3 ، التسمية هي x. وذلك لأن الرسوم البيانية في الشكلين 2 و 3 تصف ببساطة شكل 500 رقم عشوائي تم اختياره من التوزيع الأسي بمتوسط & مو = 1 والانحراف المعياري & سيجما = 1. من ناحية أخرى ، يصف الرسم البياني للشكل 4 توزيع 500 يعني العينة، تم العثور على كل منها عن طريق التحديد ن = 5 الأرقام من التوزيع الأسي بمتوسط & مو = 1 والانحراف المعياري & سيجما = 1، حساب متوسطهم (المتوسط). يؤكد المحور الأفقي في الشكل 4 على هذه الحقيقة بالتسمية xbar.
    2. من المهم أن نلاحظ أن توزيع xbar في الشكل 4 ليس طبيعيافي الشكل. في الواقع ، التوزيع منحرف بالتأكيد إلى اليمين.

    زيادة حجم العينة

    دعنا نكرر التجربة الأخيرة ، لكن هذه المرة لنرسم عينات من الحجم ن = 10 من نفس "السكان الأصل" ، فإن التوزيع الأسي يعني & مو = 1 والانحراف المعياري & سيجما = 1.

    الأوامر المذكورة أعلاه تنتج الرسم البياني في الشكل 5.

    الشكل 5. زيادة حجم العينة إلى ن = 10.

    لا يزال الرسم البياني في الشكل 5 غير طبيعي في الشكل. مرة أخرى ، إنه منحرف بالتأكيد إلى اليمين ، على الرغم من أنه ربما لا يكون بنفس قدر الرسم البياني في الشكل 4 الذي تم إنتاجه بحجم عينة أصغر.

    دعونا نزيد حجم العينة إلى ن = 20 وكرر التجربة.

    سوف ينتج الكود أعلاه الصورة في الشكل 6.

    الشكل 6. زيادة حجم العينة إلى ن = 20.

    آها! الرسم البياني في الشكل 6 له مظهر التوزيع الطبيعي. بدأ "الانحراف الأيمن" في الاختفاء ، عند مقارنته بالرسم البياني في الشكلين 4 و 5.

    سوف ينتج الكود أعلاه الصورة في الشكل 7.

    الشكل 7. زيادة حجم العينة إلى ن = 30.

    الرسم البياني في الشكل 7 له شكل الجرس المتماثل للتوزيع الطبيعي.

    الملاحظة الرئيسية: يبدو أن توزيع وسائل العينة سيكون طبيعيًا في الشكل ، بغض النظر عن شكل السكان "الأصل" ، بشرط أن يكون حجم العينة كبيرًا بدرجة كافية. في الشكل 7 ، حجم عينة من ن = 30 يبدو أنه كافٍ لضمان أن يكون توزيع متوسط ​​العينة طبيعيًا في الشكل ، على الرغم من أن العينات مأخوذة من التوزيع الأسي ، وهو توزيع منحرف بدرجة كبيرة إلى اليمين.

    هناك ملاحظتان أكثر أهمية يجب إجراؤها حول التوزيع الموضح في Fiugre 7:

      الملاحظة الرئيسية: يبدو أن المدرج التكراري في الشكل 7 "متوازن" أو "متمركز" حوله xbar = 1. في الواقع:

    أخذ العينات من السكان المنفصل

    دعنا نكرر التجربة مرة أخرى (زيادة حجم العينة) ، هذه المرة فقط دعونا نستخدم مجموعة سكانية "أصلية" منفصلة ومنحرفة إلى اليسار. خاصة:

    توزيع منفصل
    x ص
    1 0.1
    2 0.1
    3 0.1
    4 0.1
    5 0.2
    6 0.4

    يمكننا "تحميل" قيم المتغير العشوائي واحتمالاتها في R على النحو التالي:

    يمكننا توفير مخطط "ثابت" لهذا التوزيع المنفصل مع الكود التالي:

    سوف ينتج الكود أعلاه التوزيع المنفصل الموضح في الشكل 8.

    الشكل 7. توزيع منفصل منحرف بشدة إلى اليسار.

    حدد متوسط ​​التوزيع المنفصل

    هذه معادلة بسيطة لحساب متوسط ​​التوزيع المنفصل.

    صيغة لمتوسط ​​التوزيع المنفصل

    شكل 1.تم العثور على المتوسط ​​من خلال جمع حاصل ضرب قيم المتغير العشوائي والاحتمالات المرتبطة بها.

    وبالتالي ، يمكننا إيجاد متوسط ​​التوزيع المنفصل باستخدام الحساب التالي:

    إجراء هذا الحساب هو R يبسط المهمة إلى حد كبير. ابحث أولاً عن حاصل ضرب المتجهات x و ص. ملحوظة: عندما تأخذ حاصل ضرب متجهين ، فإن R ستنتج متجهًا ثالثًا ، كل إدخال منه هو منتج المدخلات المقابلة في المتجهات التي يتم ضربها.

    اجمع هذه الأرقام لإيجاد المتوسط.

    وبالتالي ، فإن متوسط ​​التوزيع المنفصل هو & mu = 4.4.

    الملاحظة الرئيسية: انظر مرة أخرى إلى مخطط "السكين" في الشكل 7. تخيل "حد السكين" عند 4.4 وقم بتعيين توزيع الشكل 7 فوق "حافة السكين". هل سيكون رصيد التوزيع؟ ضع في اعتبارك "مبدأ الرافعة" أو "تأثير التأرجح". القيم المتطرفة ، مثل س = 1، إذا تم وضعها على مسافة أبعد من المتوسط ​​ولكن باحتمالية أقل ، فيمكنها موازنة القيم مع الاحتمالات "الهائلة" التي يتم تجميعها بالقرب من المتوسط. مع وضع هذه الأفكار في الاعتبار ، فإن القيمة المتوسطة & mu = 4.4 تبدو معقولة.

    أخذ العينات من التوزيع المنفصل

    في نشاط أخذ عينات السكان المنفصل ، فإن عينة تم استخدام الأمر لرسم عينة. بناء الجملة العينة (س ، الحجم ، استبدال = ، احتمال =) يشير إلى أنه يجب علينا تقديم الحجج التالية:

    • x: متجه يحتوي على قيم المتغير العشوائي
    • بحجم: حجم العينة التي ترغب في رسمها
    • يستبدل: تؤدي قيمة TRUE إلى استبدال قيمة المتغير المنفصل قبل إجراء سحب آخر.
    • مشكلة: متجه يحتوي على الاحتمالات المرتبطة بكل قيمة من قيم المتغير العشوائي

    لنرسم عينة بحجم 1000 وننشئ مدرج تكراري للعينة الناتجة.

    كما هو الحال في نشاط أخذ عينات التوزيع المنفصل ، فإن الطاولة يوفر الأمر ملخصًا لطيفًا للعينة.

    والأفضل من ذلك هو التصور الذي يوفره barplot.

    ينتج عن هذا الأمر الأخير barplot الموضح في الشكل 8.

    الشكل 8.رسم عينة بحجم 1000 مختارة من التوزيع المنفصل.

    يمثل Barplot في الشكل 8 عينة عشوائية من التوزيع المنفصل الموضح في الشكل 7 ، والذي يبلغ متوسطه النظري 4.4. دعونا نرى ما هو متوسط ​​العينة الخاصة بنا.

    بالطبع ، إذا رسمنا عينة عشوائية أخرى ، فسنحصل على متوسط ​​عينة مختلف.

    وسائل توزيع العينة

    كما في المثال الأخير ، لنبدأ بحجم العينة ن = 5. سيتم سحب 500 عينة ، ثم رسم توزيع العينات باستخدام الرسم البياني.

    ينتج عن هذا الأمر الأخير barplot الموضح في الشكل 9.

    الشكل 9. عينات تآمر الحجم ن = 5 مختارة من التوزيع المنفصل.

    لاحظ أن توزيع وسائل العينة في الشكل 9 غير طبيعي. في الواقع ، التوزيع منحرف إلى اليسار. هذا أمر متوقع لأن السكان "الأم" منحرفون بدرجة كبيرة إلى اليسار وحجم العينة الذي نستخدمه صغير جدًا. دعونا نزيد حجم العينة ونرى ما سيحدث.

    ينتج عن هذا الأمر الأخير barplot الموضح في الشكل 10.

    الشكل 10. عينات تآمر الحجم ن = 10 مختارة من التوزيع المنفصل.

    هناك بعض التحسن (بدأ يبدو طبيعيًا إلى حد ما) ولكن توزيع العينة في الشكل 10 لا يزال منحرفًا إلى اليسار. دعونا نزيد حجم العينة ونرى ما سيحدث.

    ينتج عن هذا الأمر الأخير barplot الموضح في الشكل 11.

    الشكل 11. عينات تآمر الحجم ن = 20 مختارة من التوزيع المنفصل.

    يأخذ التوزيع الآن تناسق و "شكل جرس" التوزيع الطبيعي. دعنا نزيد حجم العينة مرة أخرى ونرى ما سيحدث.

    ينتج عن هذا الأمر الأخير barplot الموضح في الشكل 12.

    الشكل 12. عينات تآمر الحجم ن = 30 مختارة من التوزيع المنفصل.

    الرسم البياني في الشكل 7 له شكل الجرس المتماثل للتوزيع الطبيعي.

    الملاحظة الرئيسية: يبدو أن توزيع وسائل العينة سيكون طبيعياً ، بغض النظر عن شكل السكان "الأصل" ، بشرط أن يكون حجم العينة كبيرًا بدرجة كافية. في الشكل 12 ، حجم عينة من ن = 30 يبدو أنه كافٍ لضمان أن يكون توزيع متوسط ​​العينة طبيعيًا في الشكل ، على الرغم من أن العينات مأخوذة من توزيع منفصل ، وهو توزيع منحرف للغاية إلى اليسار.

    الملاحظة الرئيسية: يبدو أن المدرج التكراري في الشكل 12 "متوازن" أو "متمركز" حوله xbar = 4.4. في الواقع:

    هذا المتوسط ​​هو نفسه متوسط ​​السكان "الأصل" (التوزيع المنفصل للشكل 7 بمتوسط ​​& mu = 4.4) التي تم أخذ عيناتنا منها.

    نظرية الحدود المركزية

    نحن الآن في وضع يسمح لنا بتنقيح بياننا حول نظرية الحدود المركزية.

    1. إذا قمت بسحب عينات من التوزيع ، فسيكون توزيع متوسط ​​العينة أمرًا طبيعيًا أيضًا ، بشرط استخدام حجم عينة كبير بما يكفي. يبدو أن الرقم السحري لحجم عينة كافٍ هو ن = 30. ملاحظة: هذا هو سبب الإشارة إلى نظرية الحدود المركزية في كثير من الأحيان إلى "قانون الأعداد الكبيرة".
    2. يكون متوسط ​​توزيع وسائل العينة مطابقًا لمتوسط ​​"السكان الأصليين" ، أي المجتمع الذي يتم أخذ العينات منه.
    3. كلما زاد حجم العينة التي يتم رسمها ، سيكون انتشار توزيع وسائل العينة "أضيق".

    بيان نظرية الحدود المركزية هذا لم يكتمل بعد. ما زلنا بحاجة إلى مناقشة كيف يختلف الانحراف المعياري لوسائل العينة باختلاف حجم العينة.سنهاجم هذا السؤال في نشاط لاحق.

    يتمتع!

    نأمل أن تكون قد استمتعت بهذا النشاط الثاني على نظام The Central Limit Theorem. نحن نشجعك على استكشاف المزيد. يمكنك محاولة تكرار التجارب في هذا النشاط بتوزيعات "رئيسية" مختلفة.


    لأي شخص يتابع الدراسة في علوم البيانات أو الإحصاء أو التعلم الآلي ، موضحًا ذلك "نظرية الحدود المركزية (CLT) مهمة يجب معرفتها" هو بخس. على وجه الخصوص من منظور الإحصاء الرياضي ، في معظم الحالات ، فإن CLT هو ما يجعل استرداد التغطية الاستنتاجية الصالحة حول تقديرات المعلمات مشكلة قابلة للحل ويمكن تتبعها.

    هناك العديد من المقالات على منصة Medium بخصوص CLT. ومع ذلك ، لم ألحظ أي مقال واحد (على حد علمي) يتعمق في الرياضيات الخاصة بالنظرية ، ولا حتى يحدد الافتراضات التي يحملها CLT بشكل صحيح. هذا ضرر هائل من وجهة نظري. هذه أسس رياضية يجب أن يعرفها كل ممارس في المجالات المذكورة أعلاه.

    ليس من المهم فقط فهم الأسس الرياضية التي يقوم عليها CLT ، ولكن فهم الظروف التي بموجبها لا معلق. على سبيل المثال ، إذا كان لدينا سلسلة من n i.i.d. قام Cauchy بتوزيع RVs ، متوسطها المتوسط ​​والانحراف المعياري المعياري لا تتقارب في التوزيع مع المعيار العادي ولا ينطبق قانون التشابه والتسجيل إذا كان كل ما لدينا هو فهم "رقيق ومتموج يدويًا" لـ CLT ، فسيكون من الصعب فهم مثال كوشي أعلاه. آمل أن تتمكن المعلومات الواردة في هذه المقالة من سد هذه الفجوة في المعرفة للأطراف المهتمة.

    هذه المقالة مقسمة إلى ثلاثة أجزاء:

    1. CLT - التعريف الرياضي (على وجه التحديد Lindeberg – Lévy CLT)، ولماذا علينا أن نهتم؟
    2. الاستعدادات الرياضية لإثبات CLT
    3. دليل على Lindeberg – Lévy CLT

    لاحظ أن نظرية الحدود المركزية ليست في الواقع نظرية واحدة بل هي مجموعة من النظريات ذات الصلة. تعتمد هذه النظريات على مجموعات مختلفة من الافتراضات والقيود. في هذه المقالة ، سنعمل على وجه التحديد من خلال Lindeberg – Lévy CLT. هذا هو الإصدار الأكثر شيوعًا من CLT وهو النظرية المحددة التي يشير إليها معظم الأشخاص بالفعل عند الإشارة بالعامية إلى CLT.


    5.2: استخدام نظرية النهاية المركزية - الرياضيات

    واحدة من أهم النظريات في جميع الإحصائيات تسمى نظرية الحد المركزي أو ال قانون الأعداد الكبيرة. يتطلب إدخال نظرية الحدود المركزية فحص عدد من المفاهيم الجديدة بالإضافة إلى تقديم عدد من الأوامر الجديدة في لغة البرمجة R. وبالتالي ، سنقسم مقدمة نظرية الحدود المركزية إلى عدة أجزاء.

    في هذا الجزء الأول من مقدمة نظرية الحدود المركزية ، سوف نوضح كيفية رسم وتصور عينة من الأرقام العشوائية من التوزيع. من هناك ندرس المتوسط ​​والانحراف المعياري للعينة ، ثم نفحص توزيع وسائل العينة.

    نبدأ بتعلم كيفية رسم أرقام عشوائية من التوزيع.

    الحرف r & [مدش] رسم أرقام عشوائية

    في الأنشطة السابقة (على سبيل المثال ، التوزيع الطبيعي والتوزيعات المستمرة) ، قدمنا ​​استخدام الأحرف d و p و q فيما يتعلق بالتوزيعات المختلفة (على سبيل المثال ، عادي وموحد وأسي). تذكير باستخدامها كما يلي:

    • "d" تعني "الكثافة". يتم استخدامه لإيجاد قيم دالة كثافة الاحتمال.
    • "p" تعني "الاحتمال". يتم استخدامه لإيجاد احتمال أن المتغير العشوائي تقع على اليسار من رقم معين.
    • "q" تعني "quantile." يتم استخدامه لإيجاد الكميات لتوزيع معين.

    يوجد حرف رابع ، وهو "r" ، يستخدم لرسم أرقام عشوائية من التوزيع. لذلك ، على سبيل المثال ، رونيف و rexp سيتم استخدامها لرسم أرقام عشوائية من التوزيعين المنتظم والأسي ، على التوالي.

    دعنا نستخدم rnorm أمر بسحب 500 رقم عشوائيًا من التوزيع الطبيعي بمتوسط ​​100 والانحراف المعياري 10.

    يمكننا عرض النتيجة ، وبعضها معروض أدناه.

    عند فحص الأرقام المخزنة في المتغير x، هناك شعور بأنك تسحب أرقامًا عشوائية مجمعة حول متوسط ​​100. ومع ذلك ، يوفر الرسم البياني لهذا التحديد فهمًا أفضل للبيانات المخزنة في x.

    ينتج عن الأمر أعلاه الرسم البياني الموضح في الشكل 1.

    شكل 1. رسم بياني من 500 رقم عشوائي مأخوذ من التوزيع الطبيعي بمتوسط ​​100 وانحراف معياري 10.

    عدة تعليقات بالترتيب فيما يتعلق بالرسم البياني في الشكل 1:

    1. الرسم البياني طبيعي الشكل تقريبًا.
    2. يبدو أن "نقطة التوازن" في المدرج التكراري تقع بالقرب من 100 ، مما يشير إلى أن الأرقام العشوائية مأخوذة من توزيع يعني 100.
    3. يبدو أن جميع القيم تقريبًا تظهر ضمن 3 زيادات كل منها 10 من المتوسط ​​، مما يشير إلى أن الأرقام العشوائية مأخوذة من توزيع له انحراف معياري 10.

    لنجرب التجربة مرة أخرى ، ونرسم مجموعة جديدة من 500 رقم عشوائي من التوزيع الطبيعي الذي يعني 100 والانحراف المعياري 10.

    تنتج هذه الأوامر المؤامرة الموضحة في الشكل 2.

    الشكل 2. رسم ثانٍ مكون من 500 رقم عشوائي من توزيع عادي يعني 100 وانحراف معياري 10.

    يختلف الرسم البياني في الشكل 2 عن المدرج التكراري الموضح في الشكل 1 ، بسبب الاختيار "العشوائي" للأرقام. ومع ذلك ، فإنه يشترك في بعض السمات المشتركة مع المدرج التكراري الموضح في الشكل 1: (1) يبدو "طبيعيًا" في الشكل ، (2) يبدو أنه "متوازن" أو "متمركز" حوالي 100 ، و (3) جميع البيانات يبدو أنه يحدث في حدود 3 زيادات من 10 من المتوسط. هذا دليل قوي على أن الأرقام العشوائية قد تم استخلاصها من التوزيع الطبيعي بمتوسط ​​100 والانحراف المعياري 10. يمكننا تقديم المزيد من الأدلة على هذا الادعاء من خلال فرض دالة كثافة احتمالية عادية بمتوسط ​​100 وانحراف معياري 10.

    يركب الأمر أعلاه المنحنى الطبيعي الموضح في الشكل 3.

    الشكل 3. قم بتركيب منحنى عادي يعني 100 والانحراف المعياري 10.

    ال منحنى الأمر جديد. بعض التعليقات على استخدامه بالترتيب:

    1. في أبسط أشكالها ، بناء الجملة منحنى (و (س) ، من = ، إلى =) يرسم "الوظيفة" المحددة بواسطة و (خ) على الفاصل الزمني (من ، إلى). وظيفتنا هي غير طبيعي (س ، يعني = 100 ، sd = 10). يرسم أمر المنحنى هذه الوظيفة x على الفاصل الزمني (من ، إلى).
    2. التدوين "من =" و "إلى من" ثانيًا ، ثم قيمة "إلى" ثالثًا. هذا ما فعلناه ، واستبدلنا بـ 70 لـ "from" و 130 بـ "to".
    3. إذا تم تعيين الوسيطة "add" على القيمة TRUE ، كما فعلنا ، فسيتم "إضافة" المنحنى إلى الشكل الحالي. إذا تم حذف هذه الوسيطة ، أو إذا تم تعيينها على FALSE ، فسيتم رسم مخطط جديد ، ومسح أي رسومات سابقة تم رسمها.

    وسائل توزيع العينة

    في الأمثلة السابقة ، سحبنا 500 رقم عشوائي من التوزيع الطبيعي بمتوسط ​​100 وانحراف معياري 10. وهذا ما يسمى "رسم عينة بحجم 500" من التوزيع الطبيعي بمتوسط ​​100 وانحراف معياري 10. وهذا يؤدي إلى عينة من 500 رقم عشوائي. أحد الأسئلة الفورية التي يمكننا طرحها هو "ما معنى العينة الخاصة بنا؟"

    وبالتالي ، فإن متوسط ​​هذه العينة هو 99.75439.

    بالطبع ، إذا أخذنا عينة أخرى من 500 رقم عشوائي من التوزيع الطبيعي بمتوسط ​​100 وانحراف معياري 10 ، نحصل على عينة جديدة لها متوسط ​​مختلف.

    في هذه الحالة لدينا عينة جديدة من 500 رقم تم اختيارهم عشوائياً ، ومتوسط ​​هذه العينة يقدم نتيجة مختلفة وهي 99.91978. السؤال التالي الذي يجب طرحه هو "ماذا سيحدث إذا فعلنا ذلك بشكل متكرر؟"

    إنتاج متجه من وسائل العينة

    في النشاط التالي ، سنقوم بأخذ عينات بشكل متكرر من التوزيع الطبيعي. ستختار كل عينة خمسة أرقام عشوائية من التوزيع الطبيعي بمتوسط ​​100 وانحراف معياري 10. ثم سنجد متوسط ​​الأرقام الخمسة في عينتنا. سنكرر هذه التجربة 500 مرة ، ونجمع متوسط ​​العينة في متجه xbar ونحن نمضي.

    نبدأ بالإعلان عن المتوسط ​​والانحراف المعياري للتوزيع الذي سنستمد منه أرقامًا عشوائية. ثم نعلن حجم العينة (عدد الأرقام العشوائية المرسومة).

    في كل مرة نرسم عينة من الحجم ن = 5 من التوزيع الطبيعي يعني & مو = 100 والانحراف المعياري & سيجما = 10، نحتاج إلى مكان ما لتخزين متوسط ​​العينة. نظرًا لأننا نعتزم جمع وسائل 500 عينة ، فإننا نبدأ متجهًا xbar لاحتواء 500 صفر في البداية.

    ال اعادة عد الأمر "يكرر" الإدخال صفر 500 مرة. نتيجة لذلك ، فإن المتجه xbar يحتوي الآن على 500 إدخال ، كل منها صفر.

    من السهل رسم عينة من الحجم ن = 5 من التوزيع الطبيعي يعني & مو = 100 والانحراف المعياري & سيجما = 10. نحن ببساطة نصدر الأمر rnorm (n، mean = mu، sd = sigma). للعثور على متوسط ​​هذه النتيجة ، نقوم ببساطة بإضافة التعديل يعني (rnorm (n ، يعني = mu ، sd = sigma)). الخطوة الأخيرة هي تخزين هذه النتيجة في المتجه xbar. ثم يجب أن نكرر هذه العملية نفسها 499 مرة إضافية ليصبح المجموع 500 عينة. هذا يتطلب استخدام ملف إلى عن على عقدة.

    ال إلى عن على البناء المستخدم من قبل R يشبه "حلقات for" المستخدمة في العديد من لغات البرمجة.

    • ال أنا في لـ (أنا في 1: 500) يسمى فهرس من "حلقة for".
    • مؤشر أنا يتم ضبطه أولاً على 1 ، ثم يتم تنفيذ "جسم" "حلقة for" (الجزء بين الأقواس المتعرجة). في التكرار التالي ، أنا يساوي 2 ويتم تنفيذ جسم الحلقة مرة أخرى. تستمر الحلقة بهذه الطريقة ، بزيادة الفهرس أنا بمقدار 1 ، أخيرًا إعداد الفهرس أنا إلى 500 ، حيث يتم تنفيذ جسم الحلقة مرة أخيرة. ثم يتم إنهاء "حلقة for".
    • في جسم "for loop" لدينا xbar [i] = متوسط ​​(n ، الوسط = mu ، sd = sigma)). هذا يرسم عينة من الحجم ن = 5 من التوزيع الطبيعي ، ويحسب متوسط ​​العينة ، ويخزن النتيجة في xbar [i]، دخول xbar.
    • عندما تكمل "الحلقة for" 500 تكرار ، يكون المتجه xbar يحتوي على 500 عينة من الحجم ن = 5 مستمدة من التوزيع الطبيعي الذي يعني & مو = 100 والانحراف المعياري & سيجما = 10.

    إنها مهمة بسيطة لرسم الرسم البياني لوسائل العينة الواردة في المتجه xbar.

    ينتج عن الأمر أعلاه الرسم البياني الموضح في الشكل 4.

    الشكل 4. يعني الرسم البياني للعينة.

    هناك عدد من الملاحظات المهمة التي يجب إجراؤها حول الرسم البياني لوسائل العينة في الشكل 4 ، لا سيما عند مقارنتها مع الرسوم البيانية للشكلين 2 و 3.

    1. من الضروري ملاحظة الملصقات على المحور الأفقي. في الشكلين 2 و 3 ، التسمية هي x. وذلك لأن الرسوم البيانية في الشكلين 2 و 3 تصف ببساطة شكل 500 رقم عشوائي تم اختياره من التوزيع الطبيعي بمتوسط & مو = 100 والانحراف المعياري & سيجما = 10. من ناحية أخرى ، يصف الرسم البياني للشكل 4 توزيع 500 يعني العينة، تم العثور على كل منها عن طريق التحديد ن = 5 أرقام من التوزيع الطبيعي بمتوسط & مو = 100 والانحراف المعياري & سيجما = 10، ثم حساب متوسطها (المتوسط). يؤكد المحور الأفقي في الشكل 4 على هذه الحقيقة بالتسمية xbar.
    2. من المهم أن نلاحظ أن توزيع xbar في الشكل 4 يبدو "طبيعي" في الشكل. هذا صحيح على الرغم من أن حجم العينة صغير نسبيًا (ن = 5).
    3. يبدو أن "نقطة التوازن" أو "مركز" التوزيع في الشكل 4 تحدث بالقرب من 100. ويمكن التحقق من ذلك باستخدام الأمر التالي:

    زيادة حجم العينة

    دعنا نكرر التجربة الأخيرة ، لكن هذه المرة لنرسم عينات من الحجم ن = 10 من نفس "السكان الأصليين" ، فإن التوزيع الطبيعي يعني & مو = 100 والانحراف المعياري & سيجما = 10.

    الأوامر المذكورة أعلاه تنتج الرسم البياني في الشكل 5.

    الشكل 5. زيادة حجم العينة يقلل من انتشارها.

    تسلط الصورة في الشكل 5 الضوء على ثلاث أفكار رئيسية:

    الفكرة الأساسية: عندما نختار عينات من التوزيع الطبيعي ، فإن توزيع وسائل العينة يكون أيضًا "طبيعيًا" في الشكل.

    الفكرة الأساسية: يبدو أن متوسط ​​توزيع وسائل العينة هو نفسه متوسط ​​"السكان الأصليين" الذي اخترنا منه عيناتنا (انظر "نقطة التوازن" أو "المركز" في الشكل 5). يتم التحقق من هذا بسهولة.

    الفكرة الرئيسية: عن طريق زيادة حجم عيناتنا (ن = 10) ، يعني الرسم البياني للعينة "أقل انتشارًا" أو "أضيق" ، كما يتضح بوضوح عند مقارنة انتشار المدرج التكراري في الشكلين 4 و 5. يبدو هذا السلوك (زيادة حجم العينة يقلل الانتشار) معقولًا تمامًا . نتوقع تقديرًا أكثر دقة لمتوسط ​​السكان الأم إذا أخذنا متوسط ​​حجم عينة أكبر. على سبيل المثال ، لديك فرصة أفضل لتقدير متوسط ​​ارتفاع عدد الطلاب في المدرسة إذا سألت عشرة طلاب طولهم ومتوسطهم عما إذا سألت خمسة طلاب فقط عن طولهم ومتوسطهم.

    نظرية الحدود المركزية

    ننتهي ببيان نظرية الحدود المركزية.

    1. إذا قمت بسحب عينات من التوزيع الطبيعي ، فإن توزيع متوسط ​​العينة أمر طبيعي أيضًا.
    2. يكون متوسط ​​توزيع وسائل العينة مطابقًا لمتوسط ​​"السكان الأصليين" ، أي المجتمع الذي يتم أخذ العينات منه.
    3. كلما زاد حجم العينة التي يتم رسمها ، سيكون انتشار توزيع وسائل العينة "أضيق".

    بيان نظرية الحدود المركزية هذا ليس كاملاً. سنضيف تحسينات على هذا البيان في الأنشطة اللاحقة.

    يتمتع!

    نأمل أن تكون قد استمتعت بهذه المقدمة لنظام نظرية الحدود المركزية. نحن نشجعك على استكشاف المزيد. يمكنك محاولة تكرار التجارب المقدمة في هذا النشاط بأحجام العينات ن = 15, 20، و 25.


    يتم إجراء دراسة تنطوي على الإجهاد بين الطلاب في الحرم الجامعي. تتبع درجات الإجهاد توزيعًا موحدًا مع أدنى درجة إجهاد تساوي واحد وأعلى درجة تساوي خمسة. باستخدام عينة من 75 طالبًا ، ابحث عن:

    1. احتمال أن يكون يعني درجة الإجهاد بالنسبة لـ 75 طالبًا أقل من اثنين.
    2. النسبة المئوية التسعون لـ يعني درجة الإجهاد لـ 75 طالبًا.
    3. احتمال أن يكون مجموع درجات الإجهاد 75 أقل من 200.
    4. النسبة المئوية التسعون لـ مجموع نقاط الإجهاد لـ 75 طالبًا.

    تطلب منك المشكلتان "أ" و "ب" إيجاد احتمال أو نسبة مئوية لـ a تعني. تطلب منك المشكلتان (ج) و (د) إيجاد احتمال أو نسبة مئوية لـ a المجموع أو المجموع. حجم العينة ، ن، يساوي 75.

    نظرًا لأن درجات الإجهاد الفردية تتبع توزيعًا موحدًا ،
    X

    للمشكلتين 1. و 2. ، دع [اللاتكس] يعرض خط مستقيم[/ لاتكس] = متوسط ​​درجة الإجهاد لـ 75 طالبًا. ثم،

    مثال

    1. ابحث عن P ([اللاتكس] displaystyleoverline< normalcdf [latex]displaystyle<(<1>,<2>,<3>,frac<<1.15>>>>)> = <0> [/ لاتكس]
      يتذكر أن أقل درجة ضغط هي واحدة.

    تبلغ النسبة المئوية التسعون لمتوسط ​​75 درجة حوالي 3.2. يخبرنا هذا أن 90٪ من جميع وسائل 75 درجة إجهاد هي 3.2 على الأكثر ، و 10٪ على الأقل 3.2. InvNorm للمشاكل c و d ، دعنا
    ΣX = مجموع درجات الإجهاد 75. ثم ، [اللاتكس] displaystylesum<[<(<75>)> <(<3>)> ، <(sqrt <<75>>)> <(<1.15>)>]> [/ لاتكس]

    3. متوسط ​​مجموع 75 درجة ضغط هو (75) (3) = 225 الانحراف المعياري لمجموع 75 درجة ضغط هو
    [لاتكس] displaystyle <(sqrt <<75>>)> [/ latex] (1.15) = 9.96
    ص(Σx & lt 200) = 0

    احتمال أن يكون إجمالي النقاط البالغ 75 أقل من 200 هو حوالي صفر. normalcdf (75،200، (75) (3)، [لاتكس] displaystyle <(sqrt <<75>>)> [/ latex] (1.15)).
    يتذكر، أصغر مجموع من درجات الإجهاد 75 هو 75 ، لأن أصغر درجة فردية هي واحدة.

    النسبة المئوية التسعون لمجموع 75 درجة هي حوالي 237.8. هذا يخبرنا أن 90٪ من مجموع 75 درجة لا تزيد عن 237.8 وأن 10٪ لا تقل عن 237.8. invNorm (0.90، (75) (3)، [لاتكس] displaystyle <(sqrt <<75>>)> [/ latex] (1.15)) = 237.8

    جربها

    استخدم المعلومات الموجودة في & # 8220 Central Limit Theorem للحصول على أمثلة المتوسط ​​والمجمع & # 8220 ، ولكن استخدم حجم عينة من 55 للإجابة على الأسئلة التالية.

    1. ابحث عن نمط عرض [اللاتكس]

      <(تسطير <> <> <170>)> [/ لاتكس].

    2. أوجد المئين 80 لمتوسط ​​55 درجة.
    3. أوجد المئين 85 لمجموع 55 درجة.

    مثال

    لنفترض أن محلل أبحاث السوق في شركة للهواتف المحمولة يجري دراسة لعملائهم الذين تجاوزوا الحد الزمني المدرج في عقد الهاتف الخلوي الأساسي الخاص بهم ، وجد المحلل أنه بالنسبة لأولئك الأشخاص الذين تجاوزوا الوقت المدرج في عقدهم الأساسي ، الوقت الزائد المستخدم يتبع أ توزع استثنائى بمتوسط ​​22 دقيقة.

    ضع في اعتبارك عينة عشوائية من 80 عميلًا تجاوزوا الحد الزمني المتاح في عقد الهاتف الخلوي الأساسي.

    يترك X = الوقت الإضافي الذي يستخدمه عميل الهاتف الخلوي الفردي الذي يتجاوز الوقت المتعاقد عليه.

    [اللاتكس] displaystyle

    <(فارك <<1>> <<22>>)> [/ لاتكس]. من الفصول السابقة ، نعلم ذلك ميكرومتر = 22 و σ = 22.

    دع [لاتكس] يعرض ستايل أوفرلاين <> [/ اللاتكس] = متوسط ​​الوقت الزائد الذي تستخدمه عينة من ن = 80 عميلاً تجاوزوا الحد الزمني المتعاقد معهم.

    [اللاتكس] displaystyleoverline <><(<22> ، فارك <<22>> <>>>)> [/ latex] بواسطة نظرية الحد المركزية لوسائل العينة

    1. استخدام clt لإيجاد الاحتمال. أوجد احتمال أن يكون متوسط ​​الوقت الزائد الذي استخدمه 80 عميلًا في العينة أطول من 20 دقيقة. هذا يطلب منا العثور على نمط العرض [اللاتكس]

      <(تسطير <> <>> <20>)> [/ لاتكس]. ارسم الرسم البياني.

    2. استخدام clt لإيجاد الاحتمال. افترض أن أحد العملاء الذي تجاوز الحد الزمني لعقد الهاتف الخلوي الخاص به تم اختياره عشوائيًا. أوجد احتمال أن يكون الوقت الزائد لهذا العميل الفردي أطول من 20 دقيقة. هذا يطلب منا أن نجد ص(x & GT 20).
    3. استخدام clt لإيجاد الاحتمال. اشرح سبب اختلاف الاحتمالات في الجزأين 1 و 2.
    4. استخدام clt لإيجاد النسب المئوية. أوجد النسبة المئوية 95 للعينة تعني الوقت الزائد لعينات من 80 عميلًا تجاوزوا حدود وقت العقد الأساسي. ارسم رسمًا بيانيًا.
    1. ابحث عن: [اللاتكس] displaystyle

      <(تسطير <> <>> <20>)> [/ لاتكس] [لاتكس] displaystyle

      <(تسطير <> <>> <20>)> = <0.79199> [/ latex] باستخدام normalcdf
      [لاتكس] displaystyle <(<20> ، <1> text، <22> ، فارك <<22>>>>)> [/ latex] الاحتمال هو 0.7919 أن متوسط ​​الوقت الزائد المستخدم هو أكثر من 20 دقيقة ، لعينة من 80 عميلًا تجاوزوا الوقت المسموح به المتعاقد معهم. InvNorm = 26.0

    المئين 95 ل العينة تعني الوقت الزائد المستخدم حوالي 26.0 دقيقة للعينات العشوائية من 80 عميلًا تجاوزوا الوقت المسموح به في التعاقد. خمسة وتسعون بالمائة من هذه العينات سيكون لها وسيلة أقل من 26 دقيقة فقط خمسة بالمائة من هذه العينات سيكون لها وسائل تزيد عن 26 دقيقة.

    جربها

    استخدم المعلومات الواردة في المثال 2 ، ولكن قم بتغيير حجم العينة إلى 144.

    1. ابحث عن نمط عرض [اللاتكس]

      <(<20>

    2. باستخدام ض- معادلة النتيجة ، [اللاتكس] displaystyle= فارك <<>-_<>>>><<_<>>>> [/ لاتكس]. لدينا حل من أجل x x = 2(0.05) + 2 = 2.1
    3. ال IQR هو 75 بالمائة - 25 بالمائة = 203.37 - 196.63 = 6.74

    جربها

    استنادًا إلى بيانات من المسح الصحي الوطني ، فإن النساء اللواتي تتراوح أعمارهن بين [اللاتكس] 18 [/ اللاتكس] و [اللاتكس] 24 [/ اللاتكس] لديهن متوسط ​​ضغط الدم الانقباضي (بالمليمتر الزئبقي) من [اللاتكس] 114.8 [/ اللاتكس ] مع الانحراف المعياري [اللاتكس] 13.1 [/ اللاتكس]. ضغط الدم الانقباضي للنساء بين أعمار [اللاتكس] 18 [/ اللاتكس] إلى [اللاتكس] 24 [/ اللاتكس] يتبع التوزيع الطبيعي.

    1. إذا تم اختيار امرأة من هذه المجموعة بشكل عشوائي ، فابحث عن احتمال أن يكون ضغط الدم الانقباضي لديها أكبر من [اللاتكس] 120 [/ اللاتكس].
    2. إذا تم اختيار [اللاتكس] 40 [/ اللاتكس] امرأة من هذه المجموعة بشكل عشوائي ، فابحث عن احتمال أن يكون متوسط ​​ضغط الدم الانقباضي لديهن أكبر من [اللاتكس] 120 [/ اللاتكس].
    3. إذا كانت العينة من أربع نساء تتراوح أعمارهن بين [اللاتكس] 18 [/ اللاتكس] إلى [اللاتكس] 24 [/ اللاتكس] ولم نكن نعرف التوزيع الأصلي ، فهل يمكن استخدام نظرية الحد المركزي؟
    1. ص(x & gt 120) = normalcdf (120،99،114.8،13.1) = 0.0272. هناك حوالي 3٪ ، أن المرأة المختارة عشوائياً سيكون لديها ضغط دم انقباضي أكبر من [اللاتكس] 120 [/ لاتكس].
    2. ص(& GT 120) = normalcdf.
      هناك فرصة بنسبة 0.6٪ فقط أن يكون متوسط ​​ضغط الدم الانقباضي للمجموعة المختارة عشوائيًا أكبر من [اللاتكس] 120 [/ اللاتكس].
    3. لا يمكن استخدام نظرية الحد المركزي إذا كان حجم العينة أربعة ولم نكن نعلم أن التوزيع الأصلي كان طبيعيًا. سيكون حجم العينة صغيرًا جدًا.

    مثال

    تم إجراء دراسة حول العنف ضد البغايا وأعراض إجهاد ما بعد الصدمة الذي أصابهن. كان النطاق العمري للبغايا من 14 إلى 61. وكان متوسط ​​العمر 30.9 سنة مع انحراف معياري قدره تسع سنوات.

    1. في عينة مكونة من 25 عاهرة ، ما هو احتمال أن يكون متوسط ​​عمر المومسات أقل من 35؟
    2. هل من المحتمل أن يكون متوسط ​​عمر مجموعة العينة أكثر من 50 عامًا؟ فسر النتائج.
    3. في عينة من 49 مومس ، ما هو احتمال ألا يقل مجموع الأعمار عن 1600؟
    4. هل من المحتمل أن يكون مجموع أعمار 49 عاهرة هو 1595 كحد أقصى؟ فسر النتائج.
    5. أوجد النسبة المئوية 95 للعينة متوسط ​​عمر 65 بائعة هوى. فسر النتائج.
    6. أوجد النسبة المئوية التسعين لمجموع أعمار 65 عاهرة. فسر النتائج.
    1. ص(& lt 35) = normalcdf (-ه99,35,30.9,1.8) = 0.9886
    2. ص(& GT 50) = normalcdf (50 ، ه99،30.9،1.8) ≈ 0. بالنسبة لمجموعة العينة هذه ، يكاد يكون من المستحيل أن يكون متوسط ​​عمر المجموعة & # 8217s أكثر من 50. ومع ذلك ، لا يزال من الممكن للفرد في هذه المجموعة أن يكون عمره أكبر من 50 .
    3. ص(Σx ≥ 1600) = cdf العادي (1600 ، E99 ، 1514.10 ، 63) = 0.0864
    4. ص(Σx ≤ 1،595) = cdf العادي (-E99،1595،1514.10،63) = 0.9005. هذا يعني أن هناك فرصة بنسبة 90٪ لمجموع الأعمار لمجموعة العينة ن = 49 هي 1595 كحد أقصى.
    5. المئين 95 = invNorm (0.95،30.9،1.1) = 32.7. وهذا يشير إلى أن 95٪ من بائعات الهوى في عينة الـ 65 تقل أعمارهن عن 32.7 سنة في المتوسط.
    6. المئين التسعين = invNorm (0.90،2008.5،72.56) = 2101.5. يشير هذا إلى أن 90٪ من بائعات الهوى في عينة الـ 65 لديهن مجموع أعمار أقل من 2101.5 سنة.

    جربها

    ووفقًا لبيانات بوينج ، فإن طائرة 757 تقل 200 راكب ولها أبواب يبلغ متوسط ​​ارتفاعها 72 بوصة. افترض أن لدينا متوسط ​​69.0 بوصة وانحراف معياري 2.8 بوصة.

    1. ما هو متوسط ​​ارتفاع المدخل الذي يسمح لـ 95٪ من الرجال بدخول الطائرة دون الانحناء؟
    2. افترض أن نصف ال 200 راكب هم من الرجال. ما هو متوسط ​​ارتفاع المدخل الذي يفي بشرط وجود احتمال 0.95 أن يكون هذا الارتفاع أكبر من متوسط ​​ارتفاع 100 رجل؟
    3. للمهندسين الذين يصممون 757 ، ما النتيجة الأكثر صلة: الارتفاع من الجزء 1 أم الجزء 2؟ لماذا ا؟
    4. نحن نعرف ذلك ميكرومترx = ميكرومتر = 69 ولدينا σx = 2.8. تم العثور على ارتفاع المدخل ليكون invNorm (0.95،69،2.8) = 73.61
    5. نحن نعرف ذلك ميكرومترx = ميكرومتر = 69 ولدينا σx = 0.28. إذن ، invNorm (0.95،69،0.28) = 69.49
    6. عند تصميم ارتفاعات المدخل ، نحتاج إلى دمج أكبر قدر ممكن من التباين من أجل استيعاب أكبر عدد ممكن من الركاب. لذلك ، نحتاج إلى استخدام النتيجة بناءً على الجزء 1.

    ملاحظة تاريخية: تقريب عادي إلى ذي الحدين

    من الناحية التاريخية ، كانت القدرة على حساب الاحتمالات ذات الحدين أحد أهم تطبيقات نظرية الحد المركزي. الاحتمالات ذات الحدين بقيمة صغيرة لـ ن(لنقل ، 20) تم عرضها في جدول في كتاب. لحساب الاحتمالات ذات القيم الكبيرة لـ ن، كان عليك استخدام صيغة ذات الحدين ، والتي يمكن أن تكون معقدة للغاية. باستخدام التقريب الطبيعي للحدين التوزيع يبسط العملية. لحساب التقريب الطبيعي للتوزيع ذي الحدين ، خذ عينة عشوائية بسيطة من المجتمع. يجب أن تستوفي شروط أ توزيع ثنائي:

    • هناك عدد معين ن من المحاكمات المستقلة
    • نتائج أي تجربة هي النجاح أو الفشل
    • كل تجربة لها نفس احتمالية النجاح ص

    أذكر ذلك إذا X هو المتغير العشوائي ذي الحدين ، إذن X

    ب(ن ، ص). يجب أن يكون شكل التوزيع ذي الحدين مشابهًا لشكل التوزيع الطبيعي. لضمان هذا الكميات np و nq يجب أن يكون كلاهما أكبر من خمسة (np & GT 5 و nq & gt 5 يكون التقريب أفضل إذا كان كلاهما أكبر من أو يساوي 10). ثم يمكن تقريب ذات الحدين بالتوزيع الطبيعي بمتوسط ميكرومتر = np والانحراف المعياري. تذكر ذلك ف = 1 – ص. للحصول على أفضل تقدير تقريبي ، أضف 0.5 إلى x أو اطرح 0.5 من x (استعمال x + 0.5 أو x - 0.5). الرقم 0.5 يسمى عامل تصحيح الاستمرارية ويستخدم في المثال التالي.

    مثال

    لنفترض أنه في منطقة تعليمية من روضة أطفال محلية حتى الصف الثاني عشر (K & # 8211 12) ، يفضل 53 بالمائة من السكان مدرسة تشارتر للصفوف من K إلى 5. تم مسح عينة عشوائية بسيطة من 300.

    1. أوجد احتمال ذلك 150 على الأقل تفضل مدرسة تشارتر.
    2. أوجد احتمال ذلك 160 على الأكثر تفضل مدرسة تشارتر.
    3. أوجد احتمال ذلك أكثر من 155 تفضل مدرسة تشارتر.
    4. أوجد احتمال ذلك أقل من 147 لصالح مدرسة تشارتر.
    5. أوجد الاحتمال هذا بالضبط 175 تفضل مدرسة تشارتر.

    يترك X = الرقم الذي يفضل مدرسة تشارتر للصفوف من K حتى 5. X

    ب(ن ، ص) أين ن = 300 و ص = 0.53. حيث np & GT 5 و nq & gt 5 ، استخدم التقريب العادي للقيمة ذات الحدين. الصيغ الخاصة بالمتوسط ​​والانحراف المعياري هي ميكرومتر = np و . المتوسط ​​هو 159 والانحراف المعياري 8.6447. المتغير العشوائي للتوزيع الطبيعي هو ص. ص

    بالنسبة للجزء أ ، أنت تشمل 150 وبالتالي ص(X ≥ 150) له تقريب عادي ص(ص ≥ 149.5) = 0.8641.

    normalcdf (149.5،10 ^ 99،159،8.6447) = 0.8641.

    بالنسبة للجزء ب ، أنت تشمل 160 وبالتالي ص(X ≤ 160) له تقريب عادي ص(ص ≤ 160.5) = 0.5689.

    عادي cdf (0،160.5،159،8.6447) = 0.5689

    بالنسبة للجزء ج ، أنت استبعاد 155 وبالتالي ص(X & gt 155) له تقريب عادي ص(ذ & GT 155.5) = 0.6572.

    normalcdf (155.5،10 ^ 99،159،8.6447) = 0.6572.

    بالنسبة للجزء د ، أنت استبعاد 147 وبالتالي ص(X & lt 147) له تقريب عاديص(ص & lt 146.5) = 0.0741.

    عادي cdf (0،146.5،159،8.6447) = 0.0741

    بالنسبة للجزء (هـ) ، ص(X = 175) له تقريب عادي ص(174.5 & ال ص & lt 175.5) = 0.0083.

    Normalcdf (174.5،175.5،159،8.6447) = 0.0083

    بسبب الآلات الحاسبة وبرامج الكمبيوتر التي تتيح لك حساب الاحتمالات ذات الحدين للقيم الكبيرة لـ ن بسهولة ، ليس من الضروري استخدام التقريب العادي للتوزيع ذي الحدين ، بشرط أن يكون لديك وصول إلى أدوات التكنولوجيا هذه. تحتوي معظم المعامل المدرسية على Microsoft Excel ، وهو مثال على برامج الكمبيوتر التي تحسب الاحتمالات ذات الحدين. يمكن للعديد من الطلاب الوصول إلى حاسبات سلسلة TI-83 أو 84 ، كما يمكنهم بسهولة حساب الاحتمالات للتوزيع ذي الحدين. إذا قمت بكتابة & # 8220binomial Distribution حسابية & # 8221 في مستعرض الإنترنت ، يمكنك العثور على آلة حاسبة واحدة على الأقل عبر الإنترنت ذات الحدين.

    في المثال 3 ، يتم حساب الاحتمالات باستخدام التوزيع ذي الحدين التالي: ( ن = 300 و ص = 0.53). قارن بين إجابتي التوزيع ذي الحدين والتوزيع العادي.

    ص(X ≥ 150): 1 - ذو الحدين (300،0.53،149) = 0.8641

    ص(X ≤ 160): ذو الحدين (300،0.53،160) = 0.5684

    ص(X & GT 155): 1 - ذي الحدين cdf (300،0.53،155) = 0.6576

    ص(X & LT 147): ذو الحدين (300،0.53،146) = 0.0742

    ص(X = 175): (يمكنك استخدام ملف pdf ذي الحدين.) binomialpdf (300،0.53،175) = 0.0083

    جربها

    في المدينة ، يفضل 46 في المائة من السكان الرئيس الحالي دون مورغان لمنصب رئيس البلدية. يتم أخذ عينة عشوائية بسيطة من 500. باستخدام عامل تصحيح الاستمرارية ، أوجد احتمال أن 250 على الأقل يفضلون دون مورغان لمنصب العمدة.


    5.2: نظرية الحدود المركزية لوسائل العينة

    • بمساهمة ألكسندر هولمز ، باربرا إيلوسكي ، وسوزان دين
    • إحصائيات الأعمال في جامعة أوكلاهوما وكلية أمب دي أنزا
    • مصدره OpenStax

    توزيع العينات هو توزيع نظري. يتم إنشاؤه بأخذ العديد من عينات الحجم (n ) من السكان. ثم يتم التعامل مع كل عينة على أنها ملاحظة واحدة لهذا التوزيع الجديد ، توزيع العينات. إن عبقرية التفكير بهذه الطريقة هي أنه يدرك أنه عندما نقوم بأخذ عينات ، فإننا نخلق ملاحظة وأن هذه الملاحظة يجب أن تأتي من بعض التوزيع المعين. تجيب نظرية الحدود المركزية على السؤال: من أي توزيع جاء متوسط ​​العينة؟ إذا تم اكتشاف هذا ، فيمكننا التعامل مع متوسط ​​العينة تمامًا مثل أي ملاحظة أخرى وحساب الاحتمالات حول القيم التي قد يتخذها. لقد انتقلنا بشكل فعال من عالم الإحصاء حيث نعرف فقط ما لدينا من العينة ، إلى عالم الاحتمالات حيث نعرف التوزيع الذي جاء منه متوسط ​​العينة ومعلمات ذلك التوزيع.

    الأسباب التي تجعل المرء يأخذ عينة من السكان واضحة. قد يتجاوز وقت ومصاريف فحص كل فاتورة لتحديد صلاحيتها أو كل شحنة لمعرفة ما إذا كانت تحتوي على جميع العناصر تكلفة الأخطاء في الفواتير أو الشحن. بالنسبة لبعض المنتجات ، قد يتطلب أخذ العينات تدميرها ، وهو ما يسمى بأخذ العينات المدمرة. أحد الأمثلة على ذلك هو قياس قدرة المعدن على تحمل تآكل المياه المالحة لأجزاء من السفن العابرة للمحيطات.

    وبالتالي ، فإن أخذ العينات يثير سؤالًا مهمًا فقط عن العينة التي تم سحبها. حتى لو تم سحب العينة بشكل عشوائي ، فهناك نظريًا عدد لا حصر له من العينات. مع 100 عنصر فقط ، هناك أكثر من 75 مليون عينة فريدة من الحجم الخامس يمكن استخلاصها. إذا كان هناك ستة في العينة ، فإن عدد العينات الممكنة يزيد إلى أكثر من مليار. من بين 75 مليون عينة ممكنة ، أي واحدة حصلت عليها؟ إذا كان هناك اختلاف في العناصر التي سيتم أخذ عينات منها ، فسيكون هناك اختلاف في العينات. يمكن للمرء أن يسحب عينة & quotunlucky & quot؛ ويوصل إلى استنتاجات خاطئة للغاية فيما يتعلق بالسكان. هذا الإدراك بأن أي عينة نرسمها هي في الحقيقة واحدة فقط من توزيع العينات يزودنا بما قد يكون أهم نظرية هي الإحصائيات: نظرية الحدود المركزية. بدون نظرية الحدود المركزية ، سيكون من المستحيل المضي قدمًا في الإحصاء الاستدلالي من نظرية الاحتمالية البسيطة. في أبسط أشكالها ، تنص نظرية الحدود المركزية على ذلك بغض النظر من دالة الكثافة الاحتمالية الأساسية لبيانات السكان ، سيتم توزيع التوزيع النظري لوسائل العينات المأخوذة من السكان بشكل طبيعي. من حيث الجوهر ، يشير هذا إلى أنه يجب معاملة متوسط ​​العينة كملاحظة مستمدة من التوزيع الطبيعي. لا تنطبق نظرية الحدود المركزية إلا إذا كان حجم العينة & quot؛ كبير بدرجة كافية & quot؛ والذي تبين أنه 30 ملاحظة فقط أو أكثر.

    يعرض الشكل 5.2 بيانياً هذا الاقتراح المهم للغاية.

    شكل 5.2

    لاحظ أن المحور الأفقي في اللوحة العلوية يسمى (X ). هذه هي الملاحظات الفردية للسكان. هذا ال مجهول توزيع قيم السكان. تم رسم الرسم البياني بشكل متعرج بشكل مقصود لإظهار أنه لا يهم فقط مدى غرابة الكرة حقًا. تذكر أننا لن نعرف أبدًا كيف يبدو هذا التوزيع ، أو متوسطه أو انحرافه المعياري لهذه المسألة.

    يسمى المحور الأفقي في اللوحة السفلية ( overline)'س. هذا هو التوزيع النظري الذي يسمى توزيع أخذ العينات للوسائل. كل ملاحظة على هذا التوزيع هي متوسط ​​عينة. تم حساب كل هذه الوسائل من عينات فردية بنفس حجم العينة. يحتوي التوزيع النظري لأخذ العينات على جميع القيم المتوسطة للعينة من جميع العينات الممكنة التي يمكن أن تكون مأخوذة من السكان. بالطبع ، لن يأخذ أي شخص كل هذه العينات ، ولكن إذا فعلوا ذلك ، فهذه هي الطريقة التي ستبدو بها. وتقول نظرية الحدود المركزية أنه سيتم توزيعها بشكل طبيعي.

    تذهب نظرية الحدود المركزية إلى أبعد من ذلك وتخبرنا عن المتوسط ​​والانحراف المعياري لهذا التوزيع النظري.

    الجدول 5.1
    معامل التوزيع السكاني عينة توزيع أخذ العينات من ( overline)'س
    يعني ( مو ) ( overline) ( مو _ < overline> text <و> mathrm يسار ( mu _ < overline> right) = mu )
    الانحراف المعياري (سيجما) (س) ( سيغما _ < overline> = فارك < سيغما> < sqrt>)

    الأهمية العملية لنظرية الحدود المركزية هي أنه يمكننا الآن حساب الاحتمالات لرسم متوسط ​​عينة ، ( overline) ، بالطريقة نفسها التي استخدمناها لرسم ملاحظات محددة ، (X ) ، عندما عرفنا متوسط ​​المحتوى والانحراف المعياري وأن بيانات المحتوى يتم توزيعها بشكل طبيعي .. يجب تعديل الصيغة المعيارية لإدراك أن المتوسط ​​والانحراف المعياري لتوزيع العينات ، الذي يسمى أحيانًا الخطأ المعياري للمتوسط ​​، يختلفان عن التوزيع السكاني ، ولكن بخلاف ذلك لم يتغير شيء. الصيغة المعيارية الجديدة هي

    لاحظ أن ( mu _ < overline> ) في الصيغة الأولى تم تغييره ببساطة إلى ( mu ) في الإصدار الثاني. والسبب هو أنه من الناحية الرياضية يمكن إظهار أن القيمة المتوقعة لـ ( mu _ < overline> ) يساوي ( mu ). جاء ذلك في الجدول 5.1 أعلاه. رياضياً ، يقرأ رمز (E (x) ) & ldquo القيمة المتوقعة لـ (x ) & rdquo. سيتم استخدام هذه الصيغة في الوحدة التالية لتقديم تقديرات لـ مجهول معلمة السكان ( مو ).


    مناقشة

    يسمى الانحراف المعياري لوسائل العينة الخطأ المعياري ، أو الخطأ المعياري للوسائل. لاحظ أن هذا محسوب على أنه s / ن، والتي ستكون دائمًا أصغر من s لأن n دائمًا أكبر من 1. كلما زادت n ، أصبحت s أصغر - وبعبارة أخرى ، يصبح السبريد أقل. ويرجع ذلك إلى "الانحدار إلى المتوسط" حيث يتم إلغاء الدرجات العالية (أو المنخفضة) التي من شأنها أن تسبب انتشارًا أكبر من خلال الدرجات الأخرى ضمن العينة المنخفضة (أو العالية).

    وبالتالي فإن زيادة حجم العينة تقلل بسرعة من خطأ العينة.

    نظرًا لأن منحنى التوزيع الطبيعي مضمون ، فهذا يعني أنه يمكنك استخدام الانحراف المعياري للوسائل لإجراء تقديرات دقيقة لمدى احتمالية وقوع أي نسبة من القياسات في نطاق معين من القياسات.

    بالنسبة لعينة واحدة ، يمكن حساب الخطأ المعياري للمتوسط ​​على أنه الانحراف المعياري للعينة ، مقسومًا على الجذر التربيعي لحجم العينة.


    شاهد الفيديو: اسس الاحصاء درس 40 الفصل الرابع المجتمع يتبع توزيعا طبيعيا مجهول (شهر اكتوبر 2021).