مقالات

1.6.6.1: ما هو الاختبار الإحصائي؟


افترض أننا قارنا مجموعتين من الأرقام ، القياسات التي جاءت من عينتين. من المقارنة ، وجدنا أنها مختلفة. ولكن كيف تعرف أن هذا الاختلاف لم ينشأ عن طريق الصدفة؟ بمعنى آخر ، كيف نقرر أن عينتينا مختلفتين حقًا ، أي لم تأتوا من مجموعة واحدة؟

يمكن أن تكون هذه العينات ، على سبيل المثال ، قياسات ضغط الدم الانقباضي. إذا درسنا العقار الذي يحتمل أن يخفض ضغط الدم ، فمن المنطقي مزجه عشوائيًا مع دواء وهمي ، ثم نطلب من أعضاء المجموعة الإبلاغ عن ضغط الدم لديهم في اليوم الأول من التجربة ، والقول ، في اليوم العاشر. بعد ذلك ، سيسمح الفرق بين قياسين بتحديد ما إذا كان هناك أي تأثير:

الرمز ( PageIndex {1} ) (R):

الآن ، هناك تأثير واعد ، فرق كافٍ بين فروق ضغط الدم مع الدواء ومع الدواء الوهمي. هذا واضح أيضًا مع boxplots (التحقق من بنفسك). كيف تختبرها؟ نحن نعلم بالفعل كيفية استخدام القيمة p ، لكنها نهاية السلسلة المنطقية. دعونا نبدأ من البداية.

الفرضيات الإحصائية

افترض الفلاسفة أن العلم لا يمكنه أبدًا إثبات نظرية ، ولكن فقط دحض هو - هي. إذا جمعنا 1000 حقيقة تدعم نظرية ما ، فهذا لا يعني أننا أثبتناها - فمن المحتمل أن الدليل 1001 سوف يدحضها. هذا هو السبب في أننا نستخدم عادة فرضيتين في الاختبار الإحصائي. الذي نحاول إثباته يسمى الفرضية البديلة ( (H_1 )). الآخر ، الافتراضي ، يسمى فرضية العدم ( (H_0 )). الفرضية الصفرية هي اقتراح بغياب شيء ما (على سبيل المثال ، الاختلاف بين عينتين أو العلاقة بين متغيرين). لا يمكننا إثبات الفرضية البديلة ، لكن يمكننا رفض الفرضية الصفرية وبالتالي التحول إلى البديل. إذا لم نتمكن من رفض الفرضية الصفرية ، فيجب أن نبقى معها.

أخطاء إحصائية

مع فرضيتين ، هناك أربع نتائج محتملة (Table ( PageIndex {1} )).

النتائج الأولى (أ) والأخيرة (د) هما حالتان مثاليتان: إما أن نقبل الفرضية الصفرية الصحيحة للمجتمع المدروس ، أو نرفض (H_0 ) عندما تكون خاطئة.

إذا قبلنا الفرضية البديلة ، فعندما تكون غير صحيحة ، نكون قد التزمنا بـ اكتب أنا خطأ إحصائي—لقد وجدنا نمطًا غير موجود. يُطلق على هذا الموقف غالبًا "إيجابية كاذبة" أو "إنذار كاذب". يرتبط احتمال ارتكاب خطأ من النوع الأول بقيمة p والتي يتم الإبلاغ عنها دائمًا كإحدى نتائج الاختبار الإحصائي. حقيقة، قيمة p هي احتمال أن يكون لها نفس التأثير أو تأثير أكبر إذا كانت الفرضية الصفرية صحيحة.

تخيل ضابط أمن في الخدمة الليلية يسمع شيئًا غريبًا. هناك خياران: القفز وتحقق مما إذا كانت هذه الضوضاء تشير إلى شيء مهم ، أو استمر في الاسترخاء. إذا كانت الضوضاء بالخارج غير مهمة أو حتى غير حقيقية ولكن الضابط قفز ، فهذا هو الخطأ من النوع الأول. احتمالية سماع الضوضاء المشبوهة عندما لا يحدث شيء في الواقع بقيمة p.

عينة السكانNull هو الصحيحالبديل صحيح
قبول لاغية
تقبل البديل

جدول ( PageIndex {1} ) الفرضيات الإحصائية ، بما في ذلك الرسوم التوضيحية (ب) النوع الأول و (ج) النوع الثاني من الأخطاء. النقاط الأكبر عبارة عن عينات ، وكل النقاط عبارة عن مجموعة (مجموعات).

بالنسبة لضابط الأمن ، من الأفضل ارتكاب خطأ من النوع الأول بدلاً من تخطي شيء مهم. ومع ذلك ، في العلم ، يكون الوضع معاكسًا: نبقى دائمًا مع (H_0 ) عندما يكون احتمال ارتكاب خطأ من النوع الأول هو مرتفع جدا. من الناحية الفلسفية ، هذا هو البديل من الحلاقة أوكام: يفضل العلماء دائمًا عدم إدخال أي شيء (أي التبديل إلى البديل) دون ضرورة.

الرجل الذي أنقذ العالم بمفرده من حرب نووية

يمكن العثور على هذا النهج أيضًا في مجالات أخرى من حياتنا. اقرأ مقالة ويكيبيديا حول ستانيسلاف بيتروف (https://en.Wikipedia.org/wiki/Stanislav_Petrov) ؛ هذا مثال آخر عندما يكون الإنذار الخاطئ مكلفًا للغاية.

السؤال الواضح هو ما هو الاحتمال "مرتفع جدا"؟ تضع الإجابة التقليدية هذه العتبة عند 0.05 — يتم قبول الفرضية البديلة إذا كانت القيمة الاحتمالية أقل من 5٪ (أكثر من 95٪ مستوى ثقة). في الطب ، مع اعتبار الأرواح البشرية هي الرهان ، يتم تحديد العتبات بشكل أكثر صرامة ، عند 1٪ أو حتى 0.1٪. على النقيض من ذلك ، في العلوم الاجتماعية ، من الشائع قبول 10 ٪ كعتبة. أيًا كان ما تم اختياره كعتبة ، يجب تعيينه بداهة، قبل أي اختبار. لا يجوز تعديل العتبة لإيجاد عذر للقرار الإحصائي.

الشكل ( PageIndex {1} ) مخطط القرار الإحصائي (للاختبار أحادي الطرف). ( alpha ) هو احتمال حدوث خطأ من النوع الأول ، ( beta ) - لخطأ من النوع الثاني. قبل الاختبار ، يجب أن نضبط ( alpha ) ، عادةً على 0.05. ثم نستخدم البيانات الأصلية لحساب الإحصاء (تخمين موقع الخط العمودي الأسود). بعد ذلك ، نستخدم الإحصاء لحساب القيمة الاحتمالية. أخيرًا ، إذا كانت قيمة p أقل من ( alpha ) ، فإننا نرفض فرضية العدم.

اقبل الفرضية الصفرية عندما يكون البديل في الحقيقة هو أ النوع الثاني خطأ إحصائي—الفشل في اكتشاف نمط موجود بالفعل. وهذا ما يسمى "السلبية الزائفة" ، "الإهمال". إذا لم يقفز ضابط الأمن المهمل عندما تكون الضوضاء بالخارج مهمة حقًا ، فهذا مهم خطأ من النوع الثاني. يتم التعبير عن احتمال ارتكاب خطأ من النوع الثاني كـ قوة من الاختبار الإحصائي (الشكل ( PageIndex {1} )). كلما كان هذا الاحتمال أصغر ، كلما كان الاختبار أقوى.


شاهد الفيديو: اختبار الفرضيات الاحصائية اختبار T, اختبار Z (شهر اكتوبر 2021).