مقالات

12.2: اختبار الاستقلال - الرياضيات


تتضمن اختبارات الاستقلال استخدام ملف طاولة الطوارئ من القيم المرصودة (البيانات).

إحصائية الاختبار لـ اختبار الاستقلال يشبه اختبار جودة الملاءمة:

[ sum _ {(i cdot j)} frac {(O-E) ^ {2}} {E} ]

أين:

  • (O = ) القيم المرصودة
  • (E = ) القيم المتوقعة
  • (i = ) عدد الصفوف في الجدول
  • (j = ) عدد الأعمدة في الجدول

هناك (i cdot j ) مصطلحات من النموذج ( frac {(O-E) ^ {2}} {E} ).

يحدد اختبار الاستقلال ما إذا كان هناك عاملان مستقلان أم لا. لقد واجهت لأول مرة مصطلح الاستقلال في موضوعات الاحتمالية. كمراجعة ، ضع في اعتبارك المثال التالي.

يجب أن تكون القيمة المتوقعة لكل خلية خمسة على الأقل حتى تتمكن من استخدام هذا الاختبار.

مثال 11.4.1

افترض (A = ) مخالفة مسرعة في العام الماضي و (B = ) مستخدم هاتف خلوي أثناء القيادة. إذا كان (A ) و (B ) مستقلين ، فإن (P (A text {AND} B) = P (A) P (B) ). (A text {AND} B ) هو الحدث الذي تعرض فيه السائق لمخالفة السرعة العام الماضي واستخدم أيضًا هاتفًا خلويًا أثناء القيادة. لنفترض ، في دراسة للسائقين الذين تعرضوا لانتهاكات السرعة في العام الماضي ، والذين استخدموا الهاتف الخلوي أثناء القيادة ، أن 755 شخصًا قد تم مسحهم. من أصل 755 ، كان لدى 70 مخالفة سرعة و 685 لم يفعل ذلك ؛ 305 مستخدمين للهواتف المحمولة أثناء القيادة و 450 لم يستخدموا.

دعونا (y = ) العدد المتوقع للسائقين الذين استخدموا الهاتف الخلوي أثناء القيادة وتلقوا مخالفات السرعة.

إذا كان (A ) و (B ) مستقلين ، فإن (P (A text {AND} B) = P (A) P (B) ). عن طريق الاستبدال ،

[ frac {y} {755} = left ( frac {70} {755} right) left ( frac {305} {755} right) ]

حل من أجل (y: y = frac {(70) (305)} {755} = 28.3 )

من المتوقع أن يستخدم حوالي 28 شخصًا من العينة الهواتف المحمولة أثناء القيادة وتلقي مخالفات السرعة.

في اختبار الاستقلال ، نذكر الفرضيات الباطلة والبديلة بالكلمات. بما أن جدول الطوارئ يتكون من عاملين، تنص الفرضية الصفرية على أن العوامل هي لا يعتمد وتنص الفرضية البديلة على أنها كذلك غير مستقل (معال). إذا أجرينا اختبارًا للاستقلالية باستخدام المثال ، فإن الفرضية الصفرية هي:

(H_ {0} ): أن تكون مستخدمًا للهاتف الخلوي أثناء القيادة وتلقي مخالفة السرعة هما حدثان مستقلان.

إذا كانت الفرضية الصفرية صحيحة ، فإننا نتوقع أن يستخدم حوالي 28 شخصًا الهواتف المحمولة أثناء القيادة وأن يتلقوا انتهاكًا للسرعة.

دائمًا ما يكون اختبار الاستقلال هو اختبار الذيل الأيمن بسبب حساب إحصاء الاختبار. إذا لم تكن القيم المتوقعة والملاحظة قريبة من بعضها البعض ، فإن إحصائية الاختبار تكون كبيرة جدًا وتخرج في الذيل الأيمن لمنحنى كاي ، كما هو الحال في ملاءمة الجودة.

عدد درجات الحرية لاختبار الاستقلال هو:

(df = ( text {عدد الأعمدة} - 1) ( text {number of rows} - 1) )

تقوم الصيغة التالية بحساب ملف العدد المتوقع ( (هـ )):

(E = frac { text {(إجمالي الصف) (إجمالي العمود)}} { text {total number surveyed}} )

تمرين 11.4.1

يتم أخذ عينة من 300 طالب. من بين الطلاب الذين شملهم الاستطلاع ، كان 50 من طلاب الموسيقى ، بينما لم يكن 250 طالبًا. سبعة وتسعون كانوا على قائمة الشرف ، بينما لم يكن 203 منهم. إذا افترضنا أن كونك طالب موسيقى وأن التواجد في قائمة الشرف هما حدثان مستقلان ، فما هو العدد المتوقع لطلاب الموسيقى الموجودين أيضًا في قائمة الشرف؟

إجابه

من المتوقع أن يكون حوالي 16 طالبًا من طلاب الموسيقى وعلى قائمة الشرف.

مثال 11.4.2

في مجموعة المتطوعين ، يتطوع البالغون البالغون من العمر 21 عامًا أو أكبر من ساعة إلى تسع ساعات كل أسبوع لقضاء بعض الوقت مع مواطن معاق. يتم تجنيد البرنامج من بين طلاب كليات المجتمع وطلاب الكلية لمدة أربع سنوات وغير الطلاب. في الجدول هو عينة من المتطوعين البالغين وعدد ساعات التطوع في الأسبوع.

عدد ساعات العمل في الأسبوع حسب نوع المتطوع (الملاحظ) يحتوي الجدول لوحظ (س) القيم (البيانات).
نوع المتطوع1-3 ساعات4-6 ساعات7-9 ساعاتإجمالي الصف
طلاب كلية المجتمع1119648255
طلاب الكلية لمدة أربع سنوات9613361290
غير الطلاب9115053294
إجمالي العمود298379162839

هو عدد ساعات التطوع لا يعتمد من نوع المتطوع؟

إجابه

ال الجدول المرصود والسؤال في نهاية المشكلة هل عدد ساعات التطوع مستقل عن نوع المتطوع؟ أقول لك هذا اختبار للاستقلالية. العاملان هما عدد ساعات التطوع و نوع المتطوع. يتم إجراء هذا الاختبار دائمًا على الطرف الأيمن.

(H_ {0} ): عدد ساعات التطوع هو مستقل من نوع المتطوع.

(H_ {a} ): عدد ساعات التطوع هو متكل على نوع المتطوع.

النتيجة المتوقعة في الجدول.

عدد ساعات العمل في الأسبوع حسب نوع المتطوع (متوقع) يحتوي الجدول متوقع( (E )) قيم (بيانات).
نوع المتطوع1-3 ساعات4-6 ساعات7-9 ساعات
طلاب كلية المجتمع90.57115.1949.24
طلاب الكلية لمدة أربع سنوات103.00131.0056.00
غير الطلاب104.42132.8156.77

على سبيل المثال ، حساب التردد المتوقع للخلية اليسرى العلوية هو

[E = frac {( text {row total}) ( text {column total})} { text {total number surveyed}} = frac {(255) (298)} {839} = 90.57 ]

احسب إحصائية الاختبار: ( chi ^ {2} = 12.99 ) (آلة حاسبة أو كمبيوتر)

توزيع الاختبار: ( تشي ^ {2} _ {4} )

(df = (3 نص {أعمدة} - 1) (3 نص {rows} - 1) = (2) (2) = 4 )

رسم بياني:

الشكل 11.4.1.

بيان الاحتمالية: (p text {-value} = P ( chi ^ {2}> 12.99) = 0.0113 )

قارن (ألفا) و ال (p text {-value} ): نظرًا لعدم إعطاء ( alpha ) ، افترض ( alpha = 0.05 ). (p text {-value} = 0.0113 ). ( alpha> p text {-value} ).

اصنع قرار: منذ ( alpha> p text {-value} ) ، ارفض (H_ {0} ). هذا يعني أن العوامل ليست مستقلة.

استنتاج: عند مستوى أهمية بنسبة 5 ٪ ، من البيانات ، هناك أدلة كافية لاستنتاج أن عدد ساعات التطوع ونوع المتطوع يعتمدان على بعضهما البعض.

على سبيل المثال في الجدول ، إذا كان هناك نوع آخر من المتطوعين ، المراهقين ، فما هي درجات الحرية؟

اضغط علىماتركسمفتاح والسهم إلىتعديل. صحافة1: [أ]. صحافة3 ادخل 3 ادخل. أدخل قيم الجدول بالصف من الجدول. صحافةأدخلبعد كل. صحافة2 استقال. صحافةSTATوالسهم إلىالاختبارات. السهم لأسفل إلىC: ( chi ^ {2} ) - اختبار. صحافةأدخل. يجب أن ترىلوحظ: [أ] ومتوقع: [ب]. السهم لأسفل إلىاحسب. إحصائية الاختبار هي 12.9909 و (p text {-value} = 0.0113 ). قم بالإجراء مرة ثانية ، ولكن اسهم لأسفل إلىألفتبدلا مناحسب.

تمرين 11.4.2

يقوم مكتب إحصاءات العمل بجمع بيانات حول التوظيف في الولايات المتحدة. يتم أخذ عينة لحساب عدد المواطنين الأمريكيين العاملين في أحد قطاعات الصناعة المتعددة بمرور الوقت. الجدول يوضح النتائج:

قطاع الصناعة200020102020مجموع
الأجور والمرتبات غير الزراعية13,24313,04415,01841,305
إنتاج السلع ، باستثناء الزراعة2,4571,7711,9506,178
تقديم الخدمات10,78611,27313,06835,127
الزراعة والغابات والصيد والصيد240214201655
عامل مستقل غير زراعي يعمل لحسابه الخاص وعامل أسرة بدون أجر9318949722,797
الوظائف الثانوية للأجور والرواتب في الزراعة والصناعات المنزلية الخاصة14111136
الوظائف الثانوية كعامل مستقل أو عامل أسرة بدون أجر196144152492
مجموع27,86727,35131,37286,590

نريد أن نعرف ما إذا كان التغيير في عدد الوظائف مستقل عن التغيير في السنوات. اذكر الفرضيات الباطلة والبديلة ودرجات الحرية.

إجابه

  • (H_ {0} ): عدد الوظائف مستقل عن العام.
  • (H_ {a} ): يعتمد عدد الوظائف على السنة.

(مدافع = 12 )

الشكل 11.4.2.

اضغط علىماتركسمفتاح والسهم إلىتعديل. أدخل قيم الجدول حسب الصف. إحصائية الاختبار هي 227.73 و (p text {-value} = 5.90E - 42 = 0 ). قم بالإجراء مرة ثانية ولكن اسهم لأسفلألفتبدلا مناحسب.

مثال 11.4.3

تهتم كلية دي عنزا بالعلاقة بين مستوى القلق والحاجة إلى النجاح في المدرسة. أخذت عينة عشوائية من 400 طالب اختبارًا يقيس مستوى القلق ويحتاجون إلى النجاح في المدرسة. يوضح الجدول النتائج. تريد كلية De Anza معرفة ما إذا كان مستوى القلق والحاجة إلى النجاح في المدرسة حدثان مستقلان.

الحاجة إلى النجاح في المدرسة مقابل مستوى القلق
بحاجة إلى النجاح في المدرسةعالي
قلق
متوسط ​​الارتفاع
قلق
متوسط
قلق
متوسط ​​يميل للدنو
قلق
قليل
قلق
إجمالي الصف
حاجة عالية3542531510155
حاجة متوسطة1848633331193
حاجة منخفضة4511151752
إجمالي العمود57951276358400
  1. كم عدد الطلاب ذوي مستوى القلق المرتفع المتوقع أن يكون لديهم حاجة ماسة للنجاح في المدرسة؟
  2. إذا كان المتغيرين مستقلين ، فكم عدد الطلاب الذين تتوقع أن يكون لديهم حاجة منخفضة للنجاح في المدرسة ومستوى منخفض من القلق؟
  3. (E = frac {( text {row total}) ( text {column total})} { text {total surveyed}} = ) ________
  4. العدد المتوقع للطلاب الذين لديهم مستوى قلق متوسط ​​منخفض وحاجة منخفضة للنجاح في المدرسة هو حوالي ________.

حل

أ. إجمالي عمود مستوى القلق المرتفع هو 57. إجمالي الصف للحاجة العالية للنجاح في المدرسة هو 155. حجم العينة أو إجمالي المسح هو 400.

[E = frac {( text {row total}) ( text {column total})} { text {total surveyed}} = frac {155 cdot 57} {400} = 22.09 ]

يبلغ العدد المتوقع للطلاب الذين لديهم مستوى قلق مرتفع وبحاجة عالية للنجاح في المدرسة حوالي 22 طالبًا.

ب. إجمالي العمود لمستوى القلق المتوسط ​​المنخفض هو 63. إجمالي الصف لحاجة منخفضة للنجاح في المدرسة هو 52. حجم العينة أو إجمالي المسح هو 400.

ج. (E = frac {( text {row total}) ( text {column total})} { text {total surveyed}} = 8.19 )

د. 8

تمرين 11.4.3

الرجوع إلى المعلومات الواردة في الملاحظة. كم عدد الخدمات التي توفر الوظائف المتوقع وجودها في عام 2020؟ كم عدد الوظائف غير الزراعية ذات الأجور والمرتبات المتوقعة في عام 2020؟

إجابه

12,727, 14,965

مراجعة الفصل

لتقييم ما إذا كان هناك عاملان مستقلان أم لا ، يمكنك تطبيق اختبار الاستقلال الذي يستخدم توزيع مربع كاي. تنص الفرضية الصفرية لهذا الاختبار على أن العاملين مستقلين. يقارن الاختبار القيم الملاحظة بالقيم المتوقعة. الاختبار ذو الطرف الأيمن. يجب أن تحتوي كل ملاحظة أو فئة خلية على قيمة متوقعة لا تقل عن 5.

مراجعة الصيغة

اختبار الاستقلال

  • عدد درجات الحرية يساوي (( نص {عدد الأعمدة - 1}) ( نص {عدد الصفوف - 1}) ).
  • إحصائية الاختبار هي ( sum _ {(i cdot j)} frac {(OE) ^ {2}} {E} ) حيث (O = ) القيم الملاحظة ، (E = ) القيم المتوقعة ، (i = ) عدد الصفوف في الجدول ، و (j = ) عدد الأعمدة في الجدول.
  • إذا كانت الفرضية الصفرية صحيحة ، فإن العدد المتوقع (E = frac {( text {row total}) ( text {column total})} { text {total surveyed}} ).

حدد الاختبار المناسب لاستخدامه في التدريبات الثلاثة التالية.

تمرين 11.4.4

تهتم شركة أدوية بالعلاقة بين العمر وعرض أعراض عدوى فيروسية شائعة. يتم أخذ عينة عشوائية من 500 شخص مصاب بالعدوى من مختلف الفئات العمرية.

إجابه

اختبار الاستقلال

تمرين 11.4.5

يهتم مالك فريق البيسبول بالعلاقة بين رواتب اللاعب ونسبة فوز الفريق. يأخذ عينة عشوائية من 100 لاعب من منظمات مختلفة.

تمرين 11.4.6

يهتم عداء الماراثون بالعلاقة بين ماركة الأحذية التي يرتديها المتسابقون وأوقات الجري. أخذت عينة عشوائية من 50 عداءًا وتسجل أوقات الجري بالإضافة إلى ماركة الأحذية التي كانوا يرتدونها.

إجابه

اختبار الاستقلال

استخدم المعلومات التالية للإجابة على التمارين السبعة التالية: تهتم Transit Railroads بالعلاقة بين مسافة السفر ودرجة التذكرة المشتراة. يتم أخذ عينة عشوائية من 200 راكب. يوضح الجدول النتائج. تريد شركة السكك الحديدية معرفة ما إذا كان اختيار الراكب في فئة التذكرة مستقلًا عن المسافة التي يجب أن يقطعها.

مسافة السفردرجة ثالثةالصف الثانيالصف الأولمجموع
من 1 إلى 100 ميل2114641
101-200 ميل1816842
201 - 300 ميل16171548
301-400 ميل12142147
401-500 ميل661022
مجموع736760200

تمرين 11.4.7

اذكر الفرضيات.

(ح_ {0} ): _______

(ح_ {أ} ): _______

تمرين 11.4.8

(df = ) _______

إجابه

8

تمرين 11.4.9

كم عدد الركاب المتوقع أن يسافروا بين 201 و 300 ميل وشراء تذاكر الدرجة الثانية؟

تمرين 11.4.10

كم عدد الركاب المتوقع أن يسافروا بين 401 و 500 ميل وشراء تذاكر الدرجة الأولى؟

إجابه

6.6

تمرين 11.4.11

ما هي إحصائية الاختبار؟

تمرين 11.4.12

ما هو (p text {-value} )؟

إجابه

0.0435

تمرين 11.4.13

ما الذي يمكنك استنتاجه عند مستوى الأهمية 5٪؟

استخدم المعلومات التالية للإجابة على التدريبات الثمانية التالية: ناقش مقال في مجلة نيو إنجلاند الطبية دراسة عن المدخنين في كاليفورنيا وهاواي. في جزء واحد من التقرير ، تم إعطاء معلومات عن العرق ومستويات التدخين في اليوم. من بين الأشخاص الذين يدخنون 10 سجائر على الأكثر يوميًا ، كان هناك 9886 أمريكيًا من أصل أفريقي ، و 2745 من سكان هاواي الأصليين ، و 12831 لاتينيًا ، و 8378 أمريكيًا يابانيًا ، و 7650 من البيض. من بين الأشخاص الذين يدخنون 11 إلى 20 سيجارة يوميًا ، كان هناك 6514 أمريكيًا من أصل أفريقي ، و 3062 من سكان هاواي الأصليين ، و 4932 لاتينيًا ، و 10680 أمريكيًا يابانيًا ، و 9877 من البيض. من بين الأشخاص الذين يدخنون 21 إلى 30 سيجارة في اليوم ، كان هناك 1671 أمريكيًا من أصل أفريقي ، و 1419 من سكان هاواي الأصليين ، و 1406 لاتينيًا ، و 4715 أمريكيًا يابانيًا ، و 6062 من البيض. من بين الأشخاص الذين يدخنون ما لا يقل عن 31 سيجارة يوميًا ، كان هناك 759 أمريكيًا من أصل أفريقي ، و 788 من سكان هاواي الأصليين ، و 800 لاتيني ، و 2305 أمريكيًا يابانيًا ، و 3970 من البيض.

تمرين 11.4.14

استكمال الجدول.

مستويات التدخين حسب العرق (تمت ملاحظتها)
مستوى التدخين في اليومالافارقه الامريكانموطن هاوايلاتينيالأمريكيون اليابانيونأبيضالمجاميع
1-10
11-20
21-30
31+
المجاميع

إجابه

مستوى التدخين في اليومالافارقه الامريكانموطن هاوايلاتينيالأمريكيون اليابانيونأبيضالمجاميع
1-109,8862,74512,8318,3787,65041,490
11-206,5143,0624,93210,6809,87735,065
21-301,6711,4191,4064,7156,06215,273
31+7597888002,3053,9708,622
المجاميع18,8308,01419,96926,07827,55910,0450

تمرين 11.4.15

اذكر الفرضيات.

(ح_ {0} ): _______

(ح_ {أ} ): _______

تمرين 11.4.16

أدخل القيم المتوقعة في الجدول. قرّب لأقرب منزلتين عشريتين.

احسب القيم التالية:

إجابه

مستوى التدخين في اليومالافارقه الامريكانموطن هاوايلاتينيالأمريكيون اليابانيونأبيض
1-107777.573310.118248.0210771.2911383.01
11-206573.162797.526970.769103.299620.27
21-302863.021218.493036.203965.054190.23
31+1616.25687.871714.012238.372365.49

تمرين 11.4.17

(df = ) _______

تمرين 11.4.18

( chi ^ {2} text {test statistic} = ) ______

إجابه

10,301.8

تمرين 11.4.19

(p text {-value} = ) ______

تمرين 11.4.20

هل هذا اختبار ذيل أيمن أم أيسر أم ذيلان؟ اشرح السبب.

إجابه

حق

تمرين 11.4.21

رسم بيانيًا للوضع. قم بتسمية وقياس المحور الأفقي. ضع علامة على المتوسط ​​واختبار الإحصاء. الظل في المنطقة المقابلة لـ (p text {-value} ).

الشكل 11.4.3.

اذكر القرار والاستنتاج (في جملة كاملة) للمستويات المسبقة التالية من ( alpha ).

تمرين 11.4.22

( ألفا = 0.05 )

  1. قرار: ___________________
  2. سبب القرار: ___________________
  3. خاتمة (اكتب جملة كاملة): ___________________

إجابه

  1. ارفض فرضية العدم.
  2. (p text {-value} < alpha )
  3. هناك أدلة كافية لاستنتاج أن مستوى التدخين يعتمد على المجموعة العرقية.

تمرين 11.4.23

( ألفا = 0.05 )

  1. قرار: ___________________
  2. سبب القرار: ___________________
  3. خاتمة (اكتب جملة كاملة): ___________________

قائمة المصطلحات

طاولة الطوارئ
جدول يعرض قيم عينة لعاملين مختلفين قد يعتمد أحدهما على الآخر أو يتوقف عليهما ؛ يسهل تحديد الاحتمالات الشرطية.

معاينة المحتوى

في اختبار الدلالة الإحصائية للعلاقة بين متغيرين كميين ، سوف نستخدم إجراء اختبار فرضية الخطوات الخمس:

لاستخدام (r ) بيرسون ، يجب أن يكون كلا المتغيرين كميين ويجب أن تكون العلاقة بين (س ) و (ص ) خطية

سؤال البحث هل الارتباط في المجتمع يختلف عن 0؟ هل الارتباط بين السكان موجب؟ هل الارتباط في المجتمع سالب؟
فرضية فارغة ، (H_ <0> ) ( rho = 0 ) ( rho = 0 ) ( rho = 0 )
الفرضية البديلة (H_ ) ( rho neq 0 ) ( rho & gt 0 ) ( rho & lt 0 )
نوع اختبار الفرضية ثنائي الذيل ، غير اتجاهي الذيل الأيمن ، اتجاهي أيسر الذيل ، اتجاهي

استخدم برنامج Minitab Express للحساب (r )

سيعطيك برنامج Minitab Express القيمة p للاختبار ثنائي الطرف (على سبيل المثال ، (H_a: rho neq 0 )). إذا كنت تجري اختبارًا أحادي الطرف ، فستحتاج إلى قسمة القيمة p في الإخراج على 2.

إذا رفض (p leq alpha ) فرضية العدم ، فهناك دليل على وجود علاقة في المجتمع.

إذا فشل (p & gt alpha ) في رفض فرضية العدم ، فلا يوجد دليل على وجود علاقة في المجتمع.

بناءً على قرارك في الخطوة 4 ، اكتب استنتاجًا من حيث سؤال البحث الأصلي.


تحديد الأعداد المتوقعة

لنفترض أن جنس الطالب وما إذا كان يستمتع بالرياضيات هما أمران مستقلان. ما الترددات التي نتوقعها في هذه الحالة؟ دعنا نفكر مرة أخرى في بيانات الاستطلاع من المثال 2 في القسم 4.4:

في هذا المثال ، تم إجراء استطلاع على 82 طالبًا في دورة الجبر الأساسية في ECC ، مع الردود التالية على العبارة & quot أنا أستمتع بالرياضيات. & quot

ثم أنشأنا ملف التردد النسبي التوزيع الهامشي، والتي تم حسابها بأخذ مجاميع الصف / العمود والقسمة على حجم العينة 82.

SA أ ن د SD مجموع
رجال 9 13 5 2 1 30/82
& asymp 0.37
نساء 12 18 11 6 5 52/82
& asymp 0.63
مجموع 21/82
& asymp 0.26
31/82
& asymp 0.39
16/82
& asymp 0.20
8/82
& asymp 0.10
6/82
= 0.07
1

دعونا نركز على الخلية الأولى - & quotMen & quot و & quotStrongly Agree & quot. من الجدول ، يمكننا أن نرى أن 30/82 أو حوالي 37 ٪ من الطلاب كانوا رجالًا ، و 21/82 أو حوالي 26 ٪ من الطلاب وافقوا بشدة على العبارة "أنا أستمتع بالرياضيات." إذا كانوا مستقلين حقًا ، فيمكننا استخدم قاعدة الضرب للأحداث المستقلة ، حيث P (E و F) = P (E) & bullP (F).

لذلك إذا كانوا مستقلين ، فإن احتمال أن يكون الطالب ذكرًا ويوافق بشدة على ذلك سيكون:

يمكننا بعد ذلك استخدام هذا الاحتمال لتحديد العدد الذي نريده توقع في تلك الخلية ، إذا كان المتغيرين مستقلين بالفعل. نقوم فقط بضرب العدد الإجمالي للأفراد من خلال احتمال أن نكون ذكورًا ونوافق بشدة:

بشكل عام ، يمكننا إيجاد القيم المتوقعة باستخدام هذه الصيغة:

استخدم الجدول المتوفر وابحث عن التردد المتوقع لكل نتيجة.

الآن بعد أن أصبح لدينا الترددات المتوقعة لكل نتيجة ، نحتاج إلى اختبار فرضية جديد لمعرفة ما إذا كانت هذه الأعداد المتوقعة بعيدة بما يكفي عما لاحظناه بالفعل لنقول أن المتغيرات ليست كذلك لا يعتمد.


Minitab Express & ndash Computing Pearson & # 039s r

لقد أنشأنا سابقًا مخططًا مبعثرًا لمتوسطات الاختبار ودرجات الاختبار النهائي ولاحظنا وجود علاقة خطية. هنا ، سوف نحسب الارتباط بين هذين المتغيرين.

  1. افتح مجموعة البيانات:
    • EXAM.MTW
  2. على كمبيوتر: يختار الإحصاء وترابط جي تي وترابط جي تي
    على ماك: يختار الإحصاء والانحدار gt و gt الارتباط
  3. انقر نقرًا مزدوجًا فوق ملف مسابقة متوسط و نهائي في المربع الموجود على اليسار لإدخالها في ملف المتغيرات علبة
  4. انقر نعم

يجب أن ينتج عن هذا الناتج التالي:

علاقه مترابطه
ارتباط بيرسون بين Quiz_Average والنهائي = 0.608630
القيمة الاحتمالية = & lt0.0001

حدد نظام التشغيل الخاص بك أدناه للاطلاع على دليل تفصيلي لهذا المثال.


12.3 تصحيح الاستمرارية

حسنًا ، حان الوقت لبعض الاستطراد. لقد كنت أكذب عليك قليلاً حتى الآن. هناك تغيير طفيف يتعين عليك إجراؤه على حساباتك عندما يكون لديك درجة واحدة فقط من الحرية. يطلق عليه "تصحيح الاستمرارية" ، أو أحيانًا تصحيح ييتس. تذكر ما أشرت إليه سابقًا: يعتمد اختبار ( chi ^ 2 ) على تقريب ، وتحديداً على افتراض أن التوزيع ذي الحدين يبدأ في الظهور كتوزيع عادي لـ (N ) كبير. تتمثل إحدى مشكلات هذا الأمر في أنه غالبًا لا يعمل تمامًا ، خاصةً عندما يكون لديك درجة واحدة فقط من الحرية (على سبيل المثال ، عندما تجري اختبارًا للاستقلالية على جدول طوارئ (2 مرات 2 )) . والسبب الرئيسي لذلك هو أن التوزيع الحقيقي لأخذ العينات للإحصاء (X ^ 2 ) منفصل بالفعل (لأنك تتعامل مع البيانات الفئوية!) ولكن التوزيع ( chi ^ 2 ) مستمر. هذا يمكن أن يؤدي إلى مشاكل منهجية. على وجه التحديد ، عندما يكون (N ) صغيرًا وعندما (df = 1 ) ، فإن جودة إحصاء الملاءمة تميل إلى أن تكون "كبيرة جدًا" ، مما يعني أن لديك بالفعل قيمة ( alpha ) أكبر مما تعتقد (أو بشكل مكافئ ، قيم (p ) صغيرة جدًا). اقترح Yates (1934) إصلاحًا بسيطًا ، حيث تعيد تعريف جودة إحصاء الملاءمة على النحو التالي: [X ^ 2 = sum_ frac <(| E_i - O_i | - 0.5) ^ 2> ] في الأساس ، يطرح 0.5 في كل مكان. بقدر ما أستطيع أن أقول من قراءة ورقة ييتس ، فإن التصحيح هو في الأساس اختراق. إنه غير مشتق من أي نظرية مبدئية: بل يعتمد على فحص سلوك الاختبار ، وملاحظة أن النسخة المصححة تبدو أنها تعمل بشكل أفضل. أشعر بأنني مضطر لشرح ذلك لأنك سترى أحيانًا أن R (أو أي برنامج آخر لهذه المسألة) يقدم هذا التصحيح ، لذلك من المفيد معرفة ما يدور حوله. ستعرف متى يحدث ذلك ، لأن ناتج R سيقول صراحة أنه استخدم "تصحيح الاستمرارية" أو "تصحيح Yates".


الفصل 12: الاستدلال على فئات البيانات

هل تعلم أن حلوى الشوكولاتة بالحليب من M & ampM's & reg من المفترض أن تأتي بالنسب التالية: 24٪ أزرق ، 20٪ برتقالي ، 16٪ أخضر ، 14٪ أصفر ، 13٪ أحمر ، 13٪ بني؟ (ملاحظة: تختلف هذه القيم عن تلك التي كانت متوفرة على موقع M & ampM على الويب ، ولكن تم تأكيدها بواسطة ScientificAmeriken.) هل هي حقًا؟ هل يمكن لمهندس مراقبة الجودة اختبار ذلك؟ إلى أي مدى مقبول من تلك النسب المئوية المتوقعة؟

هذه كلها أسئلة سنجيب عليها في القسم 12.1 ، باستخدام شيء يسمى أ اختبار جودة الملاءمة.

في الفصل الرابع ، درسنا العلاقات بين متغيرين. تعلمنا أنه يمكننا تحديد قوة العلاقة الخطية بين متغيرين كميين مع الارتباط.

ولكن ماذا عن المتغيرات النوعية (الفئوية)؟ على سبيل المثال ، لنفترض أننا أخذنا في الاعتبار استطلاعًا تم إجراؤه على 82 طالبًا في دورة الجبر الأساسية في ECC ، مع الردود التالية على العبارة & quotI استمتع بالرياضيات. & quot

كيف ندرس هذه العلاقة؟ هل هناك طريقة لمعرفة ما إذا كان الجنس وما إذا كان الطالب يستمتع بالرياضيات مرتبطين؟ في القسم 4.4 ، ناقشنا التوزيعات الشرطية للبناء وتحليلها ، لكن هل يمكننا أن نكون أكثر دقة؟ في الواقع ، هناك طريقة وسنقوم بدراستها في الأقسام 12.2.

إذا كنت مستعدًا للبدء ، فما عليك سوى النقر فوق ارتباط "ابدأ" أدناه ، أو أحد ارتباطات القسم الموجودة على اليسار.


11.8 مختبر 2: اختبار كاي سكوير للاستقلال

قد تحتاج إلى الجمع بين فئتين من فئات الطعام بحيث يكون لكل خلية قيمة متوقعة لا تقل عن خمسة.

اختبار الفرضية قم بإجراء اختبار فرضية لتحديد ما إذا كانت العوامل مستقلة:

  1. ح0: ________
  2. حأ: ________
  3. ما التوزيع الذي يجب أن تستخدمه لاختبار الفرضية؟
  4. لماذا اخترت هذا التوزيع؟
  5. احسب إحصائية الاختبار.
  6. أعثر على ص-القيمة.
  7. ارسم رسمًا بيانيًا للوضع. قم بتسمية وتوسيع نطاق x-محور. ظلل المنطقة المقابلة لـ ص-القيمة.

  1. هل خاتمة دراستك هي نفسها أو تختلف عن إجابتك للإجابة على السؤال الثاني ضمن تجميع البيانات؟
  2. لماذا تعتقد أن ذلك حدث؟

بصفتنا مشاركًا في Amazon ، فإننا نكسب من عمليات الشراء المؤهلة.

هل تريد الاستشهاد بهذا الكتاب أو مشاركته أو تعديله؟ هذا الكتاب هو Creative Commons Attribution License 4.0 ويجب أن تنسب OpenStax.

    إذا كنت تعيد توزيع هذا الكتاب كله أو جزء منه بتنسيق طباعة ، فيجب عليك تضمين الإسناد التالي في كل صفحة مادية:

  • استخدم المعلومات أدناه لتوليد اقتباس. نوصي باستخدام أداة استشهاد مثل هذه.
    • المؤلفون: باربرا إيلوسكي ، سوزان دين
    • الناشر / الموقع الإلكتروني: OpenStax
    • عنوان الكتاب: إحصائيات تمهيدية
    • تاريخ النشر: 19 سبتمبر 2013
    • المكان: هيوستن ، تكساس
    • عنوان URL للكتاب: https://openstax.org/books/introductory-statistics/pages/1-introduction
    • عنوان URL للقسم: https://openstax.org/books/introductory-statistics/pages/11-8-lab-2-chi-square-test-of-independence

    © 19 مايو 2021 OpenStax. محتوى الكتاب المدرسي الذي تنتجه OpenStax مرخص بموجب ترخيص Creative Commons Attribution License 4.0. لا يخضع اسم OpenStax وشعار OpenStax وأغلفة كتب OpenStax واسم OpenStax CNX وشعار OpenStax CNX لترخيص المشاع الإبداعي ولا يجوز إعادة إنتاجه دون الحصول على موافقة كتابية مسبقة وصريحة من جامعة رايس.


    تقدير قيمة

    اختبر فرضية

    افحص العلاقة

    تقدير المتوسط

    معامل
    إحصائية
    نوع البيانات
    تحليل
    أمر Minitab

    Stat & gt الإحصائيات الأساسية & gt 1-sample t

    شروط

    بيانات عادية تقريبًا أو

    حجم عينة كبير (ن ≥ 30)

    أمثلة
    • ما هو متوسط ​​وزن الكبار؟
    • ما هو متوسط ​​مستوى الكوليسترول عند الإناث البالغات؟

    اختبار حول المتوسط

    معامل
    إحصائية
    نوع البيانات
    تحليل
    أمر Minitab

    Stat & gt الإحصائيات الأساسية & gt 1-sample t

    شروط

    البيانات طبيعية تقريبًا

    حجم عينة كبير (ن ≥ 30)

    أمثلة
    • هل متوسط ​​المعدل التراكمي للناشئين في ولاية بنسلفانيا أعلى من 3.0؟
    • هل متوسط ​​درجة الحرارة في فصل الشتاء في State College أقل من 42 درجة فهرنهايت؟

    تقدير نسبة

    معامل

    نسبة سكانية واحدة (ع )

    إحصائية
    نوع البيانات
    تحليل
    أمر Minitab

    إحصائيات أساسية و GT. ونسبة عينة واحدة

    الظروف
    أمثلة
    • ما هي نسبة الذكور في العالم؟
    • ما هي نسبة الطلاب الذين يدخنون؟

    اختبار حول نسبة

    معامل

    نسبة سكانية واحدة ، (ع )

    إحصائية
    نوع البيانات
    تحليل
    أمر Minitab

    إحصائيات أساسية و GT. ونسبة عينة واحدة

    شروط
    أمثلة
    • وهل تختلف نسبة الاناث عن 0.5؟
    • هل نسبة الطلاب الراسبين في STAT 500 أقل من 0.1؟

    تقدير الفرق بين وسيلتين *

    معامل

    يعني الفرق في اثنين من السكان ،

    إحصائية

    يعني الفرق في عينتين ،

    نوع البيانات
    تحليل
    أمر Minitab

    Stat & gt الإحصائيات الأساسية & gt 2-sample t

    شروط

    عينات مستقلة من المجموعتين

    البيانات في كل عينة عن عينات عادية أو كبيرة

    أمثلة
    • ما مدى اختلاف متوسط ​​المعدل التراكمي للذكور والإناث؟
    • كم عدد نزلات البرد التي يحصل عليها الأشخاص الذين يتناولون فيتامين سي ، في المتوسط ​​، مقارنة بمن لا يتناولون الفيتامينات؟

    اختبار للمقارنة بين وسيلتين *

    معامل

    يعني الفرق في اثنين من السكان ،

    إحصائية

    يعني الفرق في عينتين ،

    نوع البيانات
    تحليل

    (H_0 القولون mu_1 = mu_2 ) (H_a القولون mu_1 ne mu_2 ) أو

    أمر Minitab

    Stat & gt الإحصائيات الأساسية & gt 2-sample t

    الظروف

    عينات مستقلة من المجموعتين

    البيانات في كل عينة عن عينات عادية أو كبيرة

    أمثلة
    • هل يختلف متوسط ​​معدلات النبض لدى المتمرنين وغير المتمرنين؟
    • هل متوسط ​​درجة EDS للمتسربين أكبر من متوسط ​​درجة EDS للخريجين؟

    * (سيعتمد الخطأ القياسي (SE) على المجمعة مقابل غير المجمعة)

    تقدير المتوسط ​​مع البيانات المقترنة

    معامل

    يعني الاختلاف المزدوج ،

    إحصائية

    متوسط ​​عينة الاختلاف ،

    نوع البيانات
    تحليل
    أمر Minitab

    Stat & gt الإحصائيات الأساسية & gt المقترنة t

    شروط

    اختلافات شبه طبيعية أو

    لديك عدد كبير من الأزواج (ن ≥ 30)

    أمثلة

    اختبار حول المتوسط ​​مع البيانات المقترنة

    معامل

    يعني الاختلاف المزدوج ،

    إحصائية

    متوسط ​​عينة الاختلاف ،

    نوع البيانات
    تحليل
    أمر Minitab

    Stat & gt الإحصائيات الأساسية & gt المقترنة t

    شروط

    اختلافات شبه طبيعية أو

    لديك عدد كبير من الأزواج (ن ≥ 30)

    أمثلة
    • هل الفرق في معدل الذكاء لأزواج التوائم هو صفر؟
    • هل ترتفع معدلات النبض لدى الأشخاص بعد التمرين؟

    تقدير الفرق بين نسبتين

    معامل

    الفرق في نسبتين من السكان ،

    إحصائية

    الفرق في نسبتين للعينة ،

    نوع البيانات
    تحليل
    أمر Minitab

    Stat & gt الإحصائيات الأساسية & gt 2 النسب

    شروط

    عينات مستقلة من المجموعتين

    لديك ما لا يقل عن 5 في كل فئة لكلا المجموعتين

    أمثلة
    • ما مدى اختلاف نسب المدخنين عن الذكور والإناث؟
    • ما مدى اختلاف النسب المئوية للذين يشربون بنهم من الطبقة العليا والدنيا؟

    اختبار للمقارنة بين نسبتين

    معامل

    الفرق في نسبتين من السكان ،

    إحصائية

    الفرق في نسبتين للعينة ،

    نوع البيانات
    تحليل
    أمر Minitab

    Stat & gt الإحصائيات الأساسية & gt 2 النسب

    شروط

    عينات مستقلة من المجموعتين

    لديك 5 على الأقل في كل فئة لكلا المجموعتين

    أمثلة

    هل نسبة الذكور المصابين بسرطان الرئة أعلى من نسبة الإناث المصابات بسرطان الرئة؟


    التردد والاستقلالية المتوقعة

    بدلاً من الاضطرار إلى مقارنة عدة أزواج من النسب ، يمكننا إعادة صياغة سؤالها الأصلي باعتباره سؤالًا يتضمن استقلالية متغيرين. تذكر أنه في الفصل 4 ، نظرنا إلى مفهوم الاستقلال: إذا كان A و B مستقلين ، فعندئذ يكون لدينا P (A) = P (A معطى B). في مثالنا ، إذا كان الجنس والاستخدام مستقلان حقًا ، فعندئذ من بين العملاء الإناث ، ستكون نسبة الذين يستخدمون خدمة السيارة مماثلة تمامًا للنسبة الإجمالية لعملاء السيارات. كما نرى من التكرارات في جدول الطوارئ ، من الواضح أن هذا ليس هو الحال. تتمثل مهمتنا بعد ذلك في استخدام الإحصاء لقياس مدى انحراف الترددات المرصودة لدينا عن الترددات المتوقعة كما لو كان الجنس والاستخدام مستقلين.

    تذكر أنه في الدرس الأخير ، رأينا أن ذلك يأتي من الصيغة التالية:

    لذا فإن القضية الرئيسية في التطبيق هي حساب E ، الترددات المتوقعة. دعنا نتصفح المثال السابق. أولاً ، سوف تحتاج إلى تقييم ما يسمى & quotrow sum & quot و & quotcolumn sum & quot ، والتي لا تعدو أن تكون إضافة كل صف وعمود على حدة. بمجرد إضافة الصفوف والأعمدة ، ستقوم أيضًا بتقييم & quotgrand total & quot ، وهو 193 عميلًا في حالتنا.


    TIPS4RM & # 8211 وحدات الرياضيات المجانية للصفوف من السابع إلى الثاني عشر


    تبحث عن وحدات الرياضيات المجانية؟ طورت حكومة أونتاريو قبل بضع سنوات هذا المورد الرائع حقًا المسمى & # 8220 دعم التنفيذ والتخطيط المستهدف للرياضيات المنقحة (TIPS4RM) & # 8221

    في الحياة اليومية من يمكنه تذكر هذا الاسم الطويل؟ لذلك تطورت إلى أن يطلق عليها & # 8220 تلميحات & # 8221 رابط أو وحدات. تعتمد هذه الوحدات على منهج الرياضيات في أونتاريو ، لكن المفاهيم عالمية.

    لم تكتمل الوحدات بنسبة 100٪ ، لذا ستحتاج إلى استكمالها من كتابك المدرسي / كتابك التدريبي المعتاد ، ومع ذلك توفر الدروس فرصًا تجريبية / عملية تعلم رائعة للطلاب.

    تأتي الوحدة الكاملة مع نظرة عامة على الوحدة ، بالإضافة إلى تقسيم كل درس إضافي إلى Minds On (الخطاف) ، والعمل (ما سيفعله الطلاب) ، والدمج (كيف سيمارسون ما تعلموه). يكمل هذا المورد تصميم الدرس المكون من ثلاثة أجزاء والذي أصبح شائعًا للغاية.

    إذا كنت تقوم بتدريس أي دورة رياضيات في المدرسة الإعدادية أو الثانوية ، فإن هذا المورد يستحق البحث.

    لا تنسَ الاطلاع على إستراتيجية الإعداد لاختبار الرياضيات المجانية


    شاهد الفيديو: اختبار ك مربع للاستقلالية (شهر اكتوبر 2021).