مقالات

2.3: البيانات وأخذ العينات والتباين في البيانات وأخذ العينات - الرياضيات


قد تأتي البيانات من مجتمع أو من عينة. تستخدم الأحرف الصغيرة مثل (س ) أو (ص ) بشكل عام لتمثيل قيم البيانات. يمكن وضع معظم البيانات في الفئات التالية:

  • نوعي
  • كمي

البيانات النوعية هي نتيجة لتصنيف أو وصف سمات السكان. يعد لون الشعر ، وفصيلة الدم ، والمجموعة العرقية ، والسيارة التي يقودها الشخص ، والشارع الذي يعيش فيه الشخص أمثلة على البيانات النوعية. يتم وصف البيانات النوعية بشكل عام بالكلمات أو الحروف. على سبيل المثال ، قد يكون لون الشعر أسود أو بني داكن أو بني فاتح أو أشقر أو رمادي أو أحمر. قد تكون فصيلة الدم AB + أو O- أو B +. غالبًا ما يفضل الباحثون استخدام البيانات الكمية على البيانات النوعية لأنها تفسح المجال للتحليل الرياضي بسهولة أكبر. على سبيل المثال ، ليس من المنطقي العثور على متوسط ​​لون الشعر أو فصيلة الدم.

البيانات الكمية هي دائما أرقام. البيانات الكمية هي نتيجة عد أو قياس سمات السكان. يعد مقدار المال ومعدل النبض والوزن وعدد الأشخاص الذين يعيشون في بلدتك وعدد الطلاب الذين يأخذون الإحصائيات أمثلة على البيانات الكمية. قد تكون البيانات الكمية إما منفصلة أو مستمر.

يتم استدعاء جميع البيانات الناتجة عن العد البيانات المنفصلة الكمية. تأخذ هذه البيانات قيمًا رقمية معينة فقط. إذا قمت بحساب عدد المكالمات الهاتفية التي تتلقاها لكل يوم من أيام الأسبوع ، فقد تحصل على قيم مثل صفر أو واحد أو اثنين أو ثلاثة.

جميع البيانات التي هي نتيجة القياس هي البيانات الكمية المستمرة على افتراض أنه يمكننا القياس بدقة. قد ينتج عن قياس الزوايا بالراديان أرقام مثل ( frac { pi} {6} ) ، ( frac { pi} {3} ) ، ( frac { pi} {2} ) ، ( pi ) ، ( frac {3 pi} {4} ) ، وهكذا. إذا كنت تحمل أنت وأصدقاؤك حقائب ظهر بها كتب إلى المدرسة ، فإن عدد الكتب الموجودة في حقائب الظهر عبارة عن بيانات منفصلة وأوزان حقائب الظهر هي بيانات مستمرة.

عينة من البيانات الكمية المنفصلة

البيانات هي عدد الكتب التي يحملها الطلاب في حقائب الظهر الخاصة بهم. يمكنك أخذ عينة من خمسة طلاب. طالبان يحملان ثلاثة كتب وطالب يحمل أربعة كتب وطالب يحمل كتابين وطالب يحمل كتابًا واحدًا. عدد الكتب (ثلاثة ، أربعة ، اثنان ، واحد) هي البيانات المنفصلة الكمية.

تمرين ( PageIndex {1} )

البيانات هي عدد الأجهزة الموجودة في صالة الألعاب الرياضية. يمكنك أخذ عينة من خمس صالات رياضية. صالة رياضية واحدة بها 12 جهاز ، صالة رياضية واحدة بها 15 جهاز ، صالة رياضية واحدة بها 10 أجهزة ، صالة رياضية واحدة بها 22 جهاز ، وصالة رياضية أخرى بها 20 جهاز. ما نوع هذه البيانات؟

إجابه

البيانات المنفصلة الكمية

عينة من البيانات الكمية المستمرة

البيانات هي أوزان حقائب الظهر التي تحتوي على كتب. يمكنك أخذ عينة من نفس الطلاب الخمسة. الأوزان (بالجنيه) لحقائب الظهر هي 6.2 ، 7 ، 6.8 ، 9.1 ، 4.3. لاحظ أن حقائب الظهر التي تحمل ثلاثة كتب يمكن أن يكون لها أوزان مختلفة. الأوزان البيانات الكمية المستمرة لأن الأوزان تقاس.

تمرين ( PageIndex {2} )

البيانات هي مساحات المروج بالأقدام المربعة. يمكنك أخذ عينة من خمسة منازل. تبلغ مساحة المروج 144 قدمًا مربعًا و 160 قدمًا مربعًا و 190 قدمًا مربعًا و 180 قدمًا مربعًا و 210 قدمًا مربعًا. ما نوع هذه البيانات؟

إجابه

البيانات الكمية المستمرة

تمرين ( PageIndex {3} )

تذهب إلى السوبر ماركت وتشتري ثلاث علب شوربة (19 أونصة) طماطم بيسك ، 14.1 أونصة عدس ، و 19 أونصة زفاف إيطالي) ، عبوتين من المكسرات (الجوز والفول السوداني) ، أربعة أنواع مختلفة من الخضار (القرنبيط ، القرنبيط ، السبانخ ، والجزر) ، واثنين من الحلويات (16 أوقية من الآيس كريم الكرز Garcia و 2 رطل (32 أوقية من كعك رقائق الشوكولاتة).

اسم مجموعات البيانات الكمية المنفصلة والكمية المستمرة والنوعية.

المحلول

حل واحد ممكن:

  • علب الحساء الثلاث ، وعبوتان من المكسرات ، وأربعة أنواع من الخضار ، واثنان من الحلويات هي بيانات كمية منفصلة لأنك تحسبها.
  • تعتبر أوزان الحساء (19 أوقية ، 14.1 أوقية ، 19 أوقية) بيانات كمية مستمرة لأنك تقيس الأوزان بأكبر قدر ممكن من الدقة.
  • أنواع الحساء والمكسرات والخضروات والحلويات هي بيانات نوعية لأنها قاطعة.

حاول تحديد مجموعات البيانات الإضافية في هذا المثال.

عينة من البيانات النوعية

البيانات هي ألوان حقائب الظهر. مرة أخرى ، قمت بأخذ عينة من نفس الطلاب الخمسة. طالب واحد لديه حقيبة ظهر حمراء ، وطالبان بحقيبة ظهر سوداء ، وطالب لديه حقيبة ظهر خضراء ، وطالب آخر لديه حقيبة ظهر رمادية. الألوان الأحمر والأسود والأسود والأخضر والرمادي هي البيانات النوعية.

تمرين ( PageIndex {4} )

البيانات هي ألوان المنازل. ألوان المنازل هي الأبيض والأصفر والأبيض والأحمر والأبيض. ما نوع هذه البيانات؟

إجابه

البيانات النوعية

تمرين تعاوني ( PageIndex {1} )

العمل بشكل تعاوني لتحديد نوع البيانات الصحيح (الكمية أو النوعية). وضّح ما إذا كانت البيانات الكمية مستمرة أم منفصلة. تلميح: غالبًا ما تبدأ البيانات المنفصلة بالكلمات "عدد."

  1. عدد أزواج الأحذية التي تمتلكها
  2. نوع السيارة التي تقودها
  3. إلى أين تذهب في إجازة
  4. المسافة من منزلك إلى أقرب محل بقالة
  5. عدد الفصول الدراسية التي تأخذها في العام الدراسي.
  6. الرسوم الدراسية لفصولك
  7. نوع الآلة الحاسبة التي تستخدمها
  8. تقييمات الفيلم
  9. تفضيلات الأحزاب السياسية
  10. أوزان مصارعى السومو
  11. ربح مبلغ من المال (بالدولار) في لعب البوكر
  12. عدد الإجابات الصحيحة في الاختبار
  13. مواقف الناس تجاه الحكومة
  14. درجات معدل الذكاء (قد يسبب هذا بعض النقاش.)

إجابه

العناصر a و e و f و k و l منفصلة كميًا ؛ العناصر d و j و n كمية مستمرة ؛ العناصر b و c و g و h و i و m نوعية.

تمرين ( PageIndex {5} )

تحديد نوع البيانات الصحيحة (الكمية أو النوعية) لعدد السيارات في ساحة انتظار. وضّح ما إذا كانت البيانات الكمية مستمرة أم منفصلة.

إجابه

منفصل كمي

تمرين ( PageIndex {6} )

تجمع أستاذة الإحصاء معلومات حول تصنيف طلابها كطلاب مبتدئين أو طلاب السنة الثانية أو المبتدئين أو كبار السن. يتم تلخيص البيانات التي تجمعها في شكل الرسم البياني الدائري ( PageIndex {1} ). ما نوع البيانات التي يعرضها هذا الرسم البياني؟

الشكل ( PageIndex {1} )

إجابه

يوضح هذا المخطط الدائري الطلاب في كل عام ، وهو البيانات النوعية.

تمرين ( PageIndex {7} )

يحتفظ المسجل في State University بسجلات لعدد الساعات المعتمدة التي يكملها الطلاب في كل فصل دراسي. البيانات التي يجمعها ملخصة في الرسم البياني. تكون حدود الفصل من 10 إلى أقل من 13 ، ومن 13 إلى أقل من 16 ، ومن 16 إلى أقل من 19 ، ومن 19 إلى أقل من 22 ، ومن 22 إلى أقل من 25.

الشكل ( PageIndex {2} )

ما نوع البيانات التي يعرضها هذا الرسم البياني؟

إجابه

يستخدم الرسم البياني لعرض البيانات الكمية: عدد الساعات المعتمدة المكتملة. نظرًا لأن الطلاب يمكنهم إكمال عدد كامل فقط من الساعات (لا يُسمح بأجزاء من الساعات) ، فإن هذه البيانات منفصلة كميًا.

مناقشة البيانات النوعية

فيما يلي جداول تقارن عدد الطلاب غير المتفرغين والطلاب بدوام كامل في كلية De Anza وكلية Foothill المسجلين في ربع ربيع 2010. تعرض الجداول الأعداد (التكرارات) والنسب المئوية أو النسب (الترددات النسبية). تسهل أعمدة النسبة المئوية مقارنة نفس الفئات في الكليات. غالبًا ما يكون عرض النسب المئوية جنبًا إلى جنب مع الأرقام مفيدًا ، ولكنه مهم بشكل خاص عند مقارنة مجموعات البيانات التي لا تحتوي على نفس الإجماليات ، مثل إجمالي التسجيلات لكلا الكليات في هذا المثال. لاحظ مقدار النسبة المئوية للطلاب غير المتفرغين في Foothill College مقارنة بكلية De Anza.

كلية دي عنزةكلية فوتهيل
الجدول ( PageIndex {1} ): فصل الخريف 2007 (يوم التعداد)
عددنسبه مئويهعددنسبه مئويه
وقت كامل9,20040.9%وقت كامل4,05928.6%
دوام جزئى13,29659.1%دوام جزئى10,12471.4%
مجموع22,496100%مجموع14,183100%

تعد الجداول طريقة جيدة لتنظيم البيانات وعرضها. لكن الرسوم البيانية يمكن أن تكون أكثر فائدة في فهم البيانات. لا توجد قواعد صارمة بخصوص الرسوم البيانية التي يجب استخدامها. هناك رسمان بيانيان يتم استخدامهما لعرض البيانات النوعية هما المخططات الدائرية والرسوم البيانية الشريطية.

  • في مخطط دائري، يتم تمثيل فئات البيانات بواسطة أسافين في دائرة وتتناسب في الحجم مع النسبة المئوية للأفراد في كل فئة.
  • في شريط الرسم البياني، يتناسب طول الشريط لكل فئة مع عدد أو نسبة الأفراد في كل فئة. قد تكون القضبان عمودية أو أفقية.
  • أ مخطط باريتو يتكون من أشرطة مرتبة حسب حجم الفئة (من الأكبر إلى الأصغر).

انظر إلى الأشكال ( PageIndex {3} ) و ( PageIndex {4} ) وحدد الرسم البياني (الدائري أو الشريط) الذي تعتقد أنه يعرض المقارنات بشكل أفضل.

الشكل ( PageIndex {3} ): المخططات الدائرية

من الجيد إلقاء نظرة على مجموعة متنوعة من الرسوم البيانية لمعرفة أيها أكثر فائدة في عرض البيانات. قد نقوم باختيارات مختلفة لما نعتقد أنه الرسم البياني "الأفضل" اعتمادًا على البيانات والسياق. يعتمد اختيارنا أيضًا على ما نستخدم البيانات من أجله.

الشكل ( PageIndex {4} ): مخطط شريطي

النسب المئوية التي تضيف إلى أكثر (أو أقل) من 100٪

في بعض الأحيان يصل مجموع النسب المئوية إلى أكثر من 100٪ (أو أقل من 100٪). في الرسم البياني ، تزيد النسب المئوية عن 100٪ لأن الطلاب يمكن أن يكونوا في أكثر من فئة واحدة. الرسم البياني الشريطي مناسب لمقارنة الحجم النسبي للفئات. لا يمكن استخدام المخطط الدائري. كما لا يمكن استخدامه إذا كانت النسب المئوية مضافة إلى أقل من 100٪.

الصفة / الفئةنسبه مئويه
الجدول ( PageIndex {2} ): كلية دي عنزا ربيع 2010
طلاب بدوام كامل40.9%
الطلاب الذين يعتزمون الانتقال إلى مؤسسة تعليمية مدتها 4 سنوات48.6%
الطلاب الذين تقل أعمارهم عن 25 عامًا61.0%
مجموع150.5%

الشكل ( PageIndex {2} ): مخطط البيانات الشريطي في Table ( PageIndex {2} ).

حذف الفئات / البيانات المفقودة

يعرض الجدول إثنية الطلاب ولكنه يفتقد إلى فئة "أخرى / غير معروفة". تحتوي هذه الفئة على الأشخاص الذين لم يشعروا بأنهم ينتمون إلى أي من الفئات العرقية أو رفضوا الرد. لاحظ أن الترددات لا تساوي العدد الإجمالي للطلاب. في هذه الحالة ، قم بإنشاء رسم بياني شريطي وليس مخطط دائري.

الجدول ( PageIndex {2} ): إثنية الطلاب في فصل الخريف في كلية دي أنزا للفصل الدراسي 2007 (يوم التعداد)
تكرارنسبه مئويه
آسيا8,79436.1%
أسود1,4125.8%
الفلبينية1,2985.3%
أصل اسباني4,18017.1%
أمريكي أصلي1460.6%
جزر المحيط الهادئ2361.0%
أبيض5,97824.5%
مجموع22،044 من 24،38290.4٪ من 100٪

الشكل ( PageIndex {3} ): التسجيل في كلية دي عنزا (ربيع 2010)

الرسم البياني التالي هو نفسه الرسم البياني السابق ولكن تم تضمين النسبة المئوية "أخرى / غير معروف" (9.6٪). تعتبر فئة "أخرى / غير معروفة" كبيرة مقارنة ببعض الفئات الأخرى (أمريكي أصلي ، 0.6٪ ، جزر المحيط الهادئ 1.0٪). من المهم معرفة ذلك عندما نفكر في ما تخبرنا به البيانات.

قد يكون من الصعب فهم هذا الرسم البياني الشريطي المحدد في الشكل ( PageIndex {4} ) بصريًا. الرسم البياني في الشكل ( PageIndex {5} ) هو ملف مخطط باريتو. يحتوي مخطط باريتو على الأشرطة المصنفة من الأكبر إلى الأصغر ويسهل قراءتها وتفسيرها.

الشكل ( PageIndex {4} ): رسم بياني شريطي بفئة أخرى / غير معروفة

الشكل ( PageIndex {5} ): مخطط باريتو بأشرطة مرتبة حسب الحجم

المخططات الدائرية: لا توجد بيانات مفقودة

تشتمل المخططات الدائرية التالية على فئة "غير ذلك / غير معروف" (حيث يجب إضافة النسب المئوية إلى 100٪). تم تنظيم المخطط في الشكل ( PageIndex {6} ) حسب حجم كل إسفين ، مما يجعله رسمًا بيانيًا إعلاميًا أكثر من الرسم البياني الأبجدي غير الفرز في الشكل ( PageIndex {6} ).

الشكل ( PageIndex {6} ).

أخذ العينات

غالبًا ما يكلف جمع المعلومات عن مجموعة سكانية بأكملها الكثير أو يكاد يكون مستحيلاً. بدلاً من ذلك ، نستخدم عينة من السكان. يجب أن يكون للعينة نفس خصائص المجتمع الذي تمثله. يستخدم معظم الإحصائيين طرقًا مختلفة لأخذ العينات العشوائية في محاولة لتحقيق هذا الهدف. سيصف هذا القسم بعض الطرق الأكثر شيوعًا. هناك عدة طرق مختلفة لـ أخذ العينات العشوائية. في كل شكل من أشكال أخذ العينات العشوائية ، يتمتع كل فرد من السكان بفرصة متساوية لاختيار العينة. كل طريقة لها إيجابيات وسلبيات. أسهل طريقة لوصفها تسمى عينة عشوائية بسيطة. أي مجموعة من ن من المرجح أن يتم اختيار الأفراد من قبل أي مجموعة أخرى من ن الأفراد إذا تم استخدام تقنية أخذ العينات العشوائية البسيطة. بمعنى آخر ، كل عينة من نفس الحجم لها فرصة متساوية في الاختيار. على سبيل المثال ، افترض أن ليزا تريد تشكيل مجموعة دراسة من أربعة أشخاص (هي نفسها وثلاثة أشخاص آخرين) من فصل ما قبل حساب التفاضل والتكامل ، والذي يضم 31 عضوًا ليس من بينهم ليزا. لاختيار عينة عشوائية بسيطة من الحجم الثالث من الأعضاء الآخرين في فصلها ، كان بإمكان ليزا وضع جميع الأسماء البالغ عددها 31 في قبعة ، وهز القبعة ، وإغلاق عينيها ، واختيار ثلاثة أسماء. هناك طريقة أكثر تقنية هي أن تقوم ليزا أولاً بإدراج الأسماء الأخيرة لأعضاء فصلها مع عدد مكون من رقمين ، كما هو الحال في Table ( PageIndex {2} ):

الجدول ( PageIndex {3} ): قائمة الفصل الدراسي
بطاقة تعريفاسمبطاقة تعريفاسمبطاقة تعريفاسم
00أنسيلمو11ملك21روكيرو
01باوتيستا12ليجيني22روث
02بياني13لوندكويست23رويل
03تشنغ14ماسييرز24سالانجسانغ
04كواريزمو15موتوجاوا25سليد
05كونينجهام16اوكيموتو26ستراتشر
06فونتيشا17باتل27تلاي
07هونغ18السعر28تران
08هوبلر19كويزون29واي
09جياو20رييس30خشب
10خان

يمكن أن تستخدم ليزا جدول أرقام عشوائية (موجود في العديد من كتب الإحصاء وكتيبات الرياضيات) ، أو آلة حاسبة ، أو جهاز كمبيوتر لتوليد أرقام عشوائية. في هذا المثال ، افترض أن ليزا اختارت إنشاء أرقام عشوائية من الآلة الحاسبة. الأرقام التي تم إنشاؤها هي كما يلي:

0.94360; 0.99832; 0.14669; 0.51470; 0.40581; 0.73381; 0.04399

تقرأ ليزا المجموعات المكونة من رقمين حتى تختار ثلاثة أعضاء في الفصل (أي أنها تقرأ 0.94360 على أنها المجموعات 94 ، 43 ، 36 ، 60). قد يساهم كل رقم عشوائي فقط عضو واحد في الفصل. إذا احتاجت إلى ذلك ، كان بإمكان ليزا إنشاء المزيد من الأرقام العشوائية.

الأرقام العشوائية 0.94360 و 0.99832 لا تحتوي على رقمين مناسبين. لكن الرقم العشوائي الثالث ، 0.14669 ، يحتوي على 14 (الرقم العشوائي الرابع يحتوي أيضًا على 14) ، والرقم العشوائي الخامس يحتوي على 05 ، والرقم العشوائي السابع يحتوي على 04. الرقم المكون من رقمين 14 يتوافق مع Macierz ، 05 يتوافق مع Cuningham ، و 04 يتوافق مع Cuarismo. إلى جانب نفسها ، ستتألف مجموعة ليزا من Marcierz و Cuningham و Cuarismo.

لتوليد أرقام عشوائية:

  • اضغط على MATH.
  • السهم إلى PRB.
  • اضغط 5: randInt (. أدخل 0 ، 30).
  • اضغط على ENTER لأول رقم عشوائي.
  • اضغط على ENTER مرتين أخريين للرقمين العشوائيين الآخرين. إذا كان هناك تكرار ، فاضغط على ENTER مرة أخرى.

ملحوظة: randInt (0، 30، 3) سيولد 3 أرقام عشوائية.

الشكل ( PageIndex {7} )

إلى جانب أخذ العينات العشوائية البسيطة ، هناك أشكال أخرى لأخذ العينات تتضمن عملية فرصة للحصول على العينة. طرق أخذ العينات العشوائية المعروفة الأخرى هي العينة الطبقية والعينة العنقودية والعينة المنهجية.

لاختيار أ عينة طبقية، قسّم السكان إلى مجموعات تسمى طبقات ثم خذ متناسب عدد من كل طبقة. على سبيل المثال ، يمكنك تقسيم (تجميع) طلاب كليتك حسب القسم ثم اختيار عينة عشوائية بسيطة ومتناسبة من كل طبقة (كل قسم) للحصول على عينة عشوائية طبقية. لاختيار عينة عشوائية بسيطة من كل قسم ، قم بترقيم كل عضو في القسم الأول ، ورقم كل عضو في القسم الثاني ، وفعل الشيء نفسه بالنسبة للأقسام المتبقية. ثم استخدم عينة عشوائية بسيطة لاختيار أرقام متناسبة من القسم الأول وافعل الشيء نفسه لكل قسم من الأقسام المتبقية. هذه الأرقام المنتقاة من القسم الأول ، والمختارة من القسم الثاني ، وهكذا تمثل الأعضاء الذين يشكلون العينة الطبقية.

لاختيار أ عينة عنقودية، قسّم السكان إلى مجموعات (مجموعات) ثم اختر عشوائيًا بعض المجموعات. جميع أعضاء هذه المجموعات موجودون في العينة العنقودية. على سبيل المثال ، إذا قمت بأخذ عينات عشوائية من أربعة أقسام من طلاب كليتك ، فإن الأقسام الأربعة تشكل العينة العنقودية. قسّم أعضاء هيئة التدريس في كليتك حسب القسم. الأقسام هي الكتل. قم بترقيم كل قسم ، ثم اختر أربعة أرقام مختلفة باستخدام عينة عشوائية بسيطة. جميع أعضاء الأقسام الأربعة بهذه الأرقام هم عينة الكتلة.

لاختيار أ عينة منهجية، حدد نقطة البداية بشكل عشوائي وأخذ كل منها نذ قطعة من البيانات من قائمة السكان. على سبيل المثال ، افترض أن عليك إجراء مسح عبر الهاتف. يحتوي دفتر الهاتف الخاص بك على 20،000 قائمة إقامة. يجب عليك اختيار 400 اسم للعينة. قم بترقيم السكان من 1 إلى 20000 ثم استخدم عينة عشوائية بسيطة لاختيار رقم يمثل الاسم الأول في العينة. ثم اختر كل خمسين اسمًا بعد ذلك حتى تحصل على إجمالي 400 اسم (قد تضطر إلى العودة إلى بداية قائمة هاتفك). كثيرًا ما يتم اختيار أخذ العينات بشكل منهجي لأنه طريقة بسيطة.

نوع من أخذ العينات غير العشوائي هو أخذ العينات الملائمة. أخذ العينات الملائمة يتضمن استخدام النتائج المتاحة بسهولة. على سبيل المثال ، يقوم متجر برامج الكمبيوتر بإجراء دراسة تسويقية عن طريق إجراء مقابلات مع العملاء المحتملين الذين يتواجدون في المتجر ويتصفحون البرامج المتاحة. قد تكون نتائج أخذ العينات الملائمة جيدة جدًا في بعض الحالات ومتحيزة للغاية (تفضل نتائج معينة) في حالات أخرى.

يجب أن يتم أخذ العينات بعناية فائقة. يمكن أن يؤدي جمع البيانات بلا مبالاة إلى نتائج مدمرة. قد تكون الاستطلاعات التي يتم إرسالها بالبريد إلى الأسر ثم إعادتها متحيزة للغاية (قد تفضل مجموعة معينة). من الأفضل للشخص الذي يجري الاستطلاع أن يختار عينة المستجيبين.

يتم أخذ العينات العشوائية الحقيقية مع الاستبدال. أي بمجرد اختيار العضو ، يعود ذلك العضو إلى المجتمع وبالتالي يمكن اختياره أكثر من مرة. ومع ذلك ، لأسباب عملية ، في معظم السكان ، يتم أخذ عينات عشوائية بسيطة من دون بديل. عادة ما يتم إجراء الاستطلاعات بدون استبدال. أي ، يمكن اختيار عضو من السكان مرة واحدة فقط. يتم أخذ معظم العينات من مجموعات سكانية كبيرة وتميل العينة إلى أن تكون صغيرة مقارنةً بالسكان. نظرًا لأن هذه هي الحالة ، فإن أخذ العينات بدون استبدال هو تقريبًا نفس أخذ العينات مع الاستبدال لأن فرصة انتقاء نفس الفرد أكثر من مرة مع الاستبدال منخفضة للغاية.

في الكلية التي يبلغ عدد سكانها 10000 شخص ، افترض أنك تريد اختيار عينة من 1000 بشكل عشوائي لإجراء مسح. لأية عينة معينة من 1000، إذا كنت تقوم بأخذ العينات مع الاستبدال,

  • فرصة اختيار الشخص الأول هي 1،000 من 10،000 (0.1000) ؛
  • فرصة اختيار شخص آخر لهذه العينة هي 999 من 10000 (0.0999) ؛
  • فرصة اختيار نفس الشخص مرة أخرى هي 1 من 10000 (منخفضة جدًا).

إذا كنت تقوم بأخذ العينات من دون بديل,

  • فرصة اختيار الشخص الأول لأي عينة معينة هي 1000 من 10000 (0.1000) ؛
  • فرصة اختيار شخص ثانٍ مختلف هي 999 من 9،999 (0.0999) ؛
  • لا تستبدل الشخص الأول قبل اختيار الشخص التالي.

قارن الكسور 999/10000 و 999/9999. من أجل الدقة ، احمل الإجابات العشرية إلى أربعة منازل عشرية. تعادل هذه الأرقام لأربعة منازل عشرية (0.0999).

يصبح أخذ العينات بدون استبدال بدلاً من أخذ العينات بالاستبدال مشكلة رياضية فقط عندما يكون عدد السكان صغيرًا. على سبيل المثال ، إذا كان عدد السكان 25 شخصًا ، فإن العينة هي عشرة ، وأنت تقوم بأخذ عينات مع استبدال أي عينة معينة، فإن فرصة اختيار الشخص الأول هي عشرة من 25 ، وفرصة اختيار شخص آخر مختلف هي تسعة من 25 (تستبدل الشخص الأول).

إذا كنت عينة من دون بديل، فإن فرصة اختيار الشخص الأول هي عشرة من 25 ، ثم فرصة اختيار الشخص الثاني (الذي يختلف) هي تسعة من أصل 24 (لا تستبدل الشخص الأول).

قارن الكسور 9/25 و 9/24. لأربعة منازل عشرية ، 9/25 = 0.3600 و 9/24 = 0.3750. لأربعة منازل عشرية ، هذه الأرقام ليست مكافئة.

عند تحليل البيانات ، من المهم أن تكون على دراية بها أخطاء أخذ العينات وأخطاء عدم أخذ العينات. تتسبب العملية الفعلية لأخذ العينات في حدوث أخطاء في أخذ العينات. على سبيل المثال ، قد لا تكون العينة كبيرة بما يكفي. العوامل التي لا تتعلق بعملية أخذ العينات أخطاء غير أخذ العينات. يمكن أن يتسبب جهاز العد المعيب في حدوث خطأ غير أخذ العينات.

في الواقع ، لن تكون العينة ممثلة تمامًا للسكان ، لذلك سيكون هناك دائمًا بعض الأخطاء في أخذ العينات. كقاعدة عامة ، كلما كبرت العينة ، قل خطأ أخذ العينة.

في الإحصاء ، تحيز أخذ العينات يتم إنشاؤه عندما يتم جمع عينة من السكان وبعض أفراد المجتمع ليس من المرجح أن يتم اختيارهم مثل الآخرين (تذكر ، يجب أن يكون لكل فرد من السكان فرصة متساوية في الاختيار). عندما يحدث تحيز في العينة ، يمكن أن تكون هناك استنتاجات غير صحيحة حول السكان قيد الدراسة.

تمرين ( PageIndex {8} )

يتم إجراء دراسة لتحديد متوسط ​​الرسوم الدراسية التي يدفعها طلاب جامعة ولاية سان خوسيه لكل فصل دراسي. يُسأل كل طالب في العينات التالية عن مقدار الرسوم الدراسية التي دفعها لفصل الخريف. ما هو نوع أخذ العينات في كل حالة؟

  1. يتم أخذ عينة من 100 طالب جامعي في ولاية سان خوسيه من خلال تنظيم أسماء الطلاب حسب التصنيف (طالب جديد أو طالب في السنة الثانية أو مبتدئ أو كبير) ، ثم اختيار 25 طالبًا من كل منهم.
  2. يتم استخدام مولد الأرقام العشوائية لاختيار طالب من القائمة الأبجدية لجميع طلاب المرحلة الجامعية الأولى في فصل الخريف. بدءًا من ذلك الطالب ، يتم اختيار كل 50 طالبًا حتى يتم تضمين 75 طالبًا في العينة.
  3. يتم استخدام طريقة عشوائية تمامًا لاختيار 75 طالبًا. يتمتع كل طالب جامعي في فصل الخريف بنفس احتمالية اختياره في أي مرحلة من مراحل عملية أخذ العينات.
  4. السنوات الأولى والثانية والصغرى والكبرى مرقمة رقم واحد وثاني وثلاثة وأربعة على التوالي. يتم استخدام مولد الأرقام العشوائية لاختيار سنتين من تلك السنوات. جميع الطلاب في هذين العامين هم في العينة.
  5. يُطلب من مساعد إداري الوقوف أمام المكتبة يوم الأربعاء ويسأل أول 100 طالب جامعي يقابلهم عما دفعوه مقابل الرسوم الدراسية في فصل الخريف. هؤلاء الطلاب المائة هم العينة.

إجابه

أ. طبقية. ب. منهجي؛ ج. عشوائي بسيط د. العنقودية؛ ه. السهولة أو الراحة

مثال ( PageIndex {9} ): الآلة الحاسبة

ستستخدم منشئ الأرقام العشوائية لتوليد أنواع مختلفة من العينات من البيانات. يعرض هذا الجدول ست مجموعات من درجات الاختبار (كل اختبار يحسب 10 نقاط) لفئة إحصائية أولية.

#1#2#3#4#5#6
5710983
1059876
9108679
91010989
789574
9991087
7710988
8891088
978778
8810987

تعليمات: استخدم منشئ الأرقام العشوائية لاختيار العينات.

  1. قم بإنشاء عينة طبقية حسب العمود. اختر ثلاث درجات اختبار عشوائيًا من كل عمود.
    • قم بترقيم كل صف من واحد إلى عشرة.
    • على الآلة الحاسبة الخاصة بك ، اضغط على الرياضيات واسهم إلى PRB.
    • للعمود 1 ، اضغط 5: randInt (وأدخل 1،10). اضغط دخول. سجل الرقم. اضغط على ENTER مرتين أخريين (حتى التكرارات). سجل هذه الأرقام. سجل درجات الاختبار الثلاثة في العمود الأول التي تتوافق مع هذه الأرقام الثلاثة.
    • كرر للأعمدة من الثاني إلى السادس.
    • درجات الاختبار الـ 18 هذه عبارة عن عينة طبقية.
  2. قم بإنشاء عينة عنقودية عن طريق اختيار عمودين. استخدم أرقام الأعمدة: من واحد إلى ستة.
    • اضغط على MATH والسهم إلى PRB.
    • اضغط 5: randInt (وأدخل 1،6). اضغط على ENTER وقم بتسجيل هذا الرقم.
    • الرقمان لعمودين.
    • درجات الاختبار (20 منهم) في هذين العمودين هي عينة الكتلة.
  3. قم بإنشاء عينة عشوائية بسيطة من 15 درجة اختبار.
    • استخدم الترقيم من واحد إلى 60.
    • اضغط على MATH. السهم إلى PRB. اضغط 5: randInt (وأدخل 1 ، 60).
    • اضغط على ENTER 15 مرة وقم بتسجيل الأرقام.
    • سجل درجات الاختبار التي تتوافق مع هذه الأرقام.
    • هذه الدرجات الـ 15 هي عينة منهجية.
  4. قم بإنشاء عينة منهجية من 12 درجة اختبار.
    • استخدم الترقيم من واحد إلى 60.
    • اضغط على MATH. اضغط 5: randInt (وأدخل 1 ، 60).
    • اضغط دخول. سجل الرقم ودرجة الاختبار الأولى. من هذا الرقم ، احسب عشر درجات للاختبار وسجل هذه النتيجة. استمر في عد عشر درجات للاختبار وتسجيل درجة الاختبار حتى تحصل على عينة من 12 درجة اختبار. يمكنك الالتفاف (العودة إلى البداية).

مثال ( PageIndex {10} )

تحديد نوع العينة المستخدمة (عشوائية بسيطة ، طبقية ، منهجية ، عنقودية ، أو ملائمة).

  1. يختار مدرب كرة القدم ستة لاعبين من مجموعة من الأولاد تتراوح أعمارهم بين ثمانية وعشرة أعوام ، وسبعة لاعبين من مجموعة من الأولاد تتراوح أعمارهم بين 11 و 12 عامًا ، وثلاثة لاعبين من مجموعة من الأولاد تتراوح أعمارهم بين 13 و 14 عامًا لتشكيل فريق كرة قدم ترفيهي.
  2. أجرى أحد الاستطلاعات مقابلات مع جميع موظفي الموارد البشرية في خمس شركات مختلفة للتكنولوجيا الفائقة.
  3. أجرى باحث تربوي في المدرسة الثانوية مقابلات مع 50 معلمة في المدرسة الثانوية و 50 مدرسًا من الذكور في المدارس الثانوية.
  4. باحث طبي يقابل كل مريض سرطان ثالث من قائمة مرضى السرطان في مستشفى محلي.
  5. يستخدم مستشار المدرسة الثانوية جهاز كمبيوتر لإنشاء 50 رقمًا عشوائيًا ثم يختار الطلاب الذين تتوافق أسماؤهم مع الأرقام.
  6. يقوم الطالب بإجراء مقابلات مع زملائه في فصل الجبر لتحديد عدد أزواج الجينز التي يمتلكها الطالب ، في المتوسط.

إجابه

أ. العنقودية؛ ج. طبقية. د. منهجي؛ ه. عشوائي بسيط و. الراحة

تمرين ( PageIndex {11} )

تحديد نوع العينة المستخدمة (عشوائية بسيطة ، طبقية ، منهجية ، عنقودية ، أو ملائمة).

يقوم مدير مدرسة ثانوية باستطلاع آراء 50 طالبًا جديدًا و 50 طالبًا في السنة الثانية و 50 صغارًا و 50 من كبار السن فيما يتعلق بتغييرات السياسة لأنشطة ما بعد المدرسة.

إجابه

طبقية

إذا قمنا بفحص عينتين تمثلان نفس السكان ، حتى لو استخدمنا طرق أخذ العينات العشوائية للعينات ، فلن تكون متطابقة تمامًا. مثلما يوجد اختلاف في البيانات ، هناك تباين في العينات. عندما تعتاد على أخذ العينات ، سيبدأ التباين في الظهور بشكل طبيعي.

مثال ( PageIndex {12} ): أخذ العينات

لنفترض أن كلية ABC بها 10000 طالب بدوام جزئي (السكان). نحن مهتمون بمتوسط ​​المبلغ الذي ينفقه الطالب بدوام جزئي على الكتب في فصل الخريف. إن طلب جميع الطلاب البالغ عددهم 10000 هو مهمة شبه مستحيلة. لنفترض أننا أخذنا عينتين مختلفتين.

أولاً ، نستخدم أخذ العينات المريحة واستقصاء عشرة طلاب من فصل الكيمياء العضوية في الفصل الدراسي الأول. يأخذ العديد من هؤلاء الطلاب حساب التفاضل والتكامل في الفصل الدراسي الأول بالإضافة إلى فصل الكيمياء العضوية. مبلغ المال الذي ينفقونه على الكتب هو كما يلي:

$128; $87; $173; $116; $130; $204; $147; $189; $93; $153

يتم أخذ العينة الثانية باستخدام قائمة كبار السن الذين يأخذون P.E. الصفوف مع أخذ كل خامس من كبار السن على القائمة ، ليصبح المجموع عشرة من كبار السن. يقضون:

$50; $40; $36; $15; $50; $100; $40; $53; $22; $22

أ. هل تعتقد أن أيًا من هذه العينات يمثل (أو يمثل سمة من سمات) مجموع الطلاب الذين يعملون بدوام جزئي البالغ عددهم 10000 طالب؟

إجابه

أ. لا ، ربما تتكون العينة الأولى من طلاب ذوي توجه علمي. إلى جانب دورة الكيمياء ، يأخذ بعضهم أيضًا حساب التفاضل والتكامل في الفصل الدراسي الأول. تميل كتب هذه الفئات إلى أن تكون باهظة الثمن. يدفع معظم هؤلاء الطلاب ، على الأرجح ، أكثر من متوسط ​​الطالب بدوام جزئي مقابل كتبهم. العينة الثانية عبارة عن مجموعة من كبار السن الذين ، على الأرجح ، يأخذون دورات للصحة والاهتمام. ربما يكون مبلغ المال الذي ينفقونه على الكتب أقل بكثير من متوسط ​​الطالب بدوام جزئي. كلتا العينات متحيزة. أيضًا ، في كلتا الحالتين ، ليس كل الطلاب لديهم فرصة ليكونوا في أي من العينة.

ب. نظرًا لأن هذه العينات لا تمثل المجتمع بأكمله ، فهل من الحكمة استخدام النتائج لوصف المجتمع بأكمله؟

إجابه

ب. بالنسبة لهذه العينات ، لم يكن لدى كل فرد من السكان فرصة متساوية في الاختيار.

الآن ، لنفترض أننا أخذنا عينة ثالثة. نختار عشرة طلاب مختلفين بدوام جزئي من تخصصات الكيمياء والرياضيات واللغة الإنجليزية وعلم النفس وعلم الاجتماع والتاريخ والتمريض والتربية البدنية والفن وتنمية الطفولة المبكرة. (نفترض أن هذه هي التخصصات الوحيدة التي يلتحق بها طلاب بدوام جزئي في ABC College وأن عددًا متساويًا من الطلاب غير المتفرغين مسجلين في كل من التخصصات.) يتم اختيار كل طالب باستخدام عينات عشوائية بسيطة. باستخدام الآلة الحاسبة ، يتم إنشاء أرقام عشوائية ويتم اختيار طالب من تخصص معين إذا كان لديه رقم مطابق. يصرف الطلاب المبالغ التالية:

$180; $50; $150; $85; $260; $75; $180; $200; $200; $150

ج. هل العينة متحيزة؟

إجابه

يسأل الطلاب غالبًا ما إذا كان من "الجيد بدرجة كافية" أخذ عينة ، بدلاً من مسح السكان بالكامل. إذا تم إجراء المسح بشكل جيد ، فالجواب هو نعم.

تمرين ( PageIndex {12} )

يوجد بمحطة إذاعية محلية قاعدة جماهيرية تضم 20000 مستمع. تريد المحطة معرفة ما إذا كان جمهورها يفضل المزيد من الموسيقى أو المزيد من البرامج الحوارية. إن مطالبة جميع المستمعين البالغ عددهم 20 ألف مهمة شبه مستحيلة.

تستخدم المحطة أخذ العينات الملائمة واستطلاعات الرأي لأول 200 شخص يلتقون بهم في أحد أحداث الحفل الموسيقي للمحطة. قال 24 شخصًا إنهم يفضلون المزيد من البرامج الحوارية ، وقال 176 شخصًا إنهم يفضلون المزيد من الموسيقى.

هل تعتقد أن هذه العينة تمثل (أو هي سمة من سمات) مجموع المستمعين البالغ عددهم 20 ألفًا؟

إجابه

تتكون العينة على الأرجح من الأشخاص الذين يفضلون الموسيقى لأنها حفل موسيقي. كما أن العينة تمثل فقط أولئك الذين حضروا الحدث قبل الأغلبية. ربما لا يمثل النموذج قاعدة المعجبين بأكملها وربما يكون منحازًا للأشخاص الذين يفضلون الموسيقى.

تمرين تعاوني ( PageIndex {8} )

كفئة ، حدد ما إذا كانت العينات التالية تمثيلية أم لا. إذا لم تكن كذلك ، ناقش الأسباب.

  1. للعثور على متوسط ​​المعدل التراكمي لجميع الطلاب في إحدى الجامعات ، استخدم جميع الطلاب المتفوقين في الجامعة كعينة.
  2. لمعرفة الحبوب الأكثر شعبية بين الشباب دون سن العاشرة ، قف خارج سوبر ماركت كبير لمدة ثلاث ساعات وتحدث إلى كل طفل في العشرين من عمره دون سن العاشرة يدخل السوبر ماركت.
  3. للعثور على متوسط ​​الدخل السنوي لجميع البالغين في الولايات المتحدة ، خذ عينة من أعضاء الكونجرس الأمريكي. قم بإنشاء عينة عنقودية من خلال اعتبار كل ولاية على أنها طبقة (مجموعة). باستخدام أخذ عينات عشوائية بسيطة ، حدد الدول لتكون جزءًا من الكتلة. ثم قم بمسح كل عضو في الكونغرس الأمريكي في الكتلة.
  4. لتحديد نسبة الأشخاص الذين يستخدمون وسائل النقل العام في العمل ، قم باستطلاع آراء 20 شخصًا في مدينة نيويورك. قم بإجراء المسح من خلال الجلوس في سنترال بارك على مقعد وإجراء مقابلة مع كل شخص يجلس بجانبك.
  5. لتحديد متوسط ​​تكلفة الإقامة لمدة يومين في مستشفى في ماساتشوستس ، قم بمسح 100 مستشفى في جميع أنحاء الولاية باستخدام عينات عشوائية بسيطة.

التباين في البيانات

تفاوت موجود في أي مجموعة من البيانات. على سبيل المثال ، قد تحتوي علب المشروبات سعة 16 أونصة على أكثر أو أقل من 16 أونصة من السائل. في إحدى الدراسات ، تم قياس ثماني علب سعة 16 أونصة وإنتاج الكمية التالية (بالأوقية) من المشروبات:

15.8; 16.1; 15.2; 14.8; 15.8; 15.9; 16.0; 15.5

قد تختلف قياسات كمية المشروب في 16 أونصة لأن الأشخاص المختلفين يقومون بالقياسات أو لأن الكمية الدقيقة ، 16 أونصة من السائل ، لم يتم وضعها في العلب. يقوم المصنعون بإجراء اختبارات بانتظام لتحديد ما إذا كانت كمية المشروبات في 16 أونصة يمكن أن تقع ضمن النطاق المطلوب.

اعلم أنه أثناء قيامك بأخذ البيانات ، قد تختلف بياناتك إلى حد ما عن البيانات التي يأخذها شخص آخر لنفس الغرض. هذا طبيعي تمامًا. ومع ذلك ، إذا كان اثنان أو أكثر منكم يأخذون نفس البيانات وحصلوا على نتائج مختلفة تمامًا ، فقد حان الوقت لك وللآخرين لإعادة تقييم طرق أخذ البيانات ودقتها.

الاختلاف في العينات

لقد ذُكر سابقًا أن عينتين أو أكثر من نفس السكان ، مأخوذة عشوائيًا ، ولديهم نفس خصائص السكان من المحتمل أن تكون مختلفة عن بعضها البعض. لنفترض أن دورين وجونغ قررا دراسة متوسط ​​الوقت الذي ينام فيه الطلاب في كليتهم كل ليلة. أخذ كل من دورين وجونغ عينات من 500 طالب. يستخدم دورين أخذ العينات بشكل منهجي ويستخدم جونغ أخذ العينات العنقودية. ستكون عينة دورين مختلفة عن عينة جونغ. حتى لو استخدم دورين وجونغ نفس طريقة أخذ العينات ، فمن المرجح أن تكون عيناتهم مختلفة. ومع ذلك ، لن يكون أي منهما مخطئًا.

فكر في ما يساهم في جعل عينات Doreen و Jung مختلفة.

إذا أخذ دورين وجونغ عينات أكبر (أي زيادة عدد قيم البيانات) ، فقد تكون نتائج عيناتهم (متوسط ​​الوقت الذي ينام فيه الطالب) أقرب إلى متوسط ​​عدد السكان الفعلي. لكن مع ذلك ، ستكون عيناتهم ، في جميع الاحتمالات ، مختلفة عن بعضها البعض. هذه التباين في العينات لا يمكن التشديد بما فيه الكفاية.

حجم العينة

حجم العينة (غالبًا ما يسمى عدد الملاحظات) مهم. الأمثلة التي رأيتها في هذا الكتاب حتى الآن صغيرة. تكفي عينات من بضع مئات من الملاحظات فقط ، أو حتى أصغر منها ، للعديد من الأغراض. في الاستطلاع ، تعتبر العينات التي تتراوح من 1200 إلى 1500 ملاحظة كبيرة بما يكفي وجيدة بما يكفي إذا كان المسح عشوائيًا وتم إجراؤه بشكل جيد. سوف تتعلم لماذا عندما تدرس فترات الثقة.

اعلم أن العديد من العينات الكبيرة متحيزة. على سبيل المثال ، تكون استطلاعات الاتصال منحازة دائمًا ، لأن الأشخاص يختارون الاستجابة أم لا.

تمرين تعاوني ( PageIndex {8} )

قسّم إلى مجموعات من اثنين أو ثلاثة أو أربعة. سيعطي مدرسك لكل مجموعة نردًا واحدًا سداسي الجوانب. جرب هذه التجربة مرتين. رمي نردًا واحدًا عادلًا (سداسي الجوانب) 20 مرة. سجل عدد الآحاد ، والثاني ، والثالث ، والرباعي ، والخمسي ، والسادس التي تحصل عليها في الجدول التالي ("التكرار" هو عدد المرات التي يحدث فيها وجه معين للنرد):

التجربة الأولى (20 لفة)التجربة الثانية (20 لفة)
وجه على يموتتكراروجه على يموتتكرار
1
2
3
4
5
6

هل كانت للتجربتين نفس النتائج؟ على الاغلب لا. إذا أجريت التجربة للمرة الثالثة ، فهل تتوقع أن تكون النتائج مطابقة للتجربة الأولى أو الثانية؟ لما و لما لا؟

أي تجربة كانت لها النتائج الصحيحة؟ كلاهما فعل. تتمثل مهمة الإحصائي في رؤية التباين واستخلاص النتائج المناسبة.

تقييم نقدي

نحتاج إلى تقييم الدراسات الإحصائية التي قرأنا عنها بشكل نقدي وتحليلها قبل قبول نتائج الدراسات. تشمل المشاكل الشائعة التي يجب أن تكون على دراية بها

  • مشاكل العينات: يجب أن تكون العينة ممثلة للسكان. العينة التي لا تمثل السكان متحيزة. العينات المتحيزة التي لا تمثل السكان تعطي نتائج غير دقيقة وغير صحيحة.
  • العينات المختارة ذاتيًا: غالبًا ما تكون الردود من قِبل الأشخاص الذين يختارون الرد ، مثل استطلاعات الاتصال ، غير موثوقة.
  • مشاكل حجم العينة: قد تكون العينات الصغيرة جدًا غير موثوقة. العينات الأكبر أفضل ، إن أمكن. في بعض الحالات ، لا مفر من الحصول على عينات صغيرة ولا يزال من الممكن استخدامها لاستخلاص النتائج. أمثلة: سيارات اختبار التصادم أو الاختبارات الطبية للحالات النادرة
  • التأثير غير المبرر: جمع البيانات أو طرح الأسئلة بطريقة تؤثر على الاستجابة
  • عدم استجابة أو رفض موضوع المشاركة: قد لا تكون الردود المجمعة ممثلة للسكان. في كثير من الأحيان ، قد يجيب الأشخاص ذوو الآراء الإيجابية أو السلبية القوية على الاستطلاعات ، مما قد يؤثر على النتائج.
  • السببية: العلاقة بين متغيرين لا تعني أن أحدهما يتسبب في حدوث الآخر. قد تكون مرتبطة (مرتبطة) بسبب علاقتها من خلال متغير مختلف.
  • الدراسات الممولة ذاتيًا أو دراسات المصلحة الذاتية: دراسة يقوم بها شخص أو منظمة لدعم مطالبهم. هل الدراسة نزيهة؟ اقرأ الدراسة بعناية لتقييم العمل. لا تفترض تلقائيًا أن الدراسة جيدة ، ولكن لا تفترض تلقائيًا أن الدراسة سيئة أيضًا. قم بتقييمها على أساس مزاياها والعمل المنجز.
  • الاستخدام المضلل للبيانات: الرسوم البيانية المعروضة بشكل غير صحيح ، أو البيانات غير المكتملة ، أو عدم وجود سياق
  • الإرباك: عندما لا يمكن فصل تأثيرات العوامل المتعددة على الاستجابة. الارتباك يجعل من الصعب أو المستحيل استخلاص استنتاجات صحيحة حول تأثير كل عامل.

مراجع

  1. مؤشر Gallup-Healthways Well-Being. http://www.well-beingindex.com/default.asp (تمت الزيارة في 1 مايو 2013).
  2. مؤشر Gallup-Healthways Well-Being. http://www.well-beingindex.com/methodology.asp (تمت الزيارة في 1 مايو 2013).
  3. مؤشر Gallup-Healthways Well-Being. http://www.gallup.com/poll/146822/ga...questions.aspx (تمت الزيارة في 1 مايو 2013).
  4. البيانات مأخوذة من www.bookofodds.com/Relationsh...-the-President
  5. دومينيك لوزينشي ، "الرئيس" لاندون واستطلاع الملخص الأدبي لعام 1936: هل يقع اللوم على مالكي السيارات والهواتف؟ " تاريخ العلوم الاجتماعية 36 ، لا. 1: 23-54 (2012) ، ssh.dukejournals.org/content/36/1/23.abstract (تمت الزيارة في 1 مايو 2013).
  6. "The Literary Digest Poll ،" Virtual Laboratories in Probability and Statistics http://www.math.uah.edu/stat/data/LiteraryDigest.html (تمت الزيارة في 1 مايو 2013).
  7. "اتجاهات الانتخابات الرئاسية لمجلة غالوب ، 1936-2008" ، Gallup Politics http://www.gallup.com/poll/110548/ga...9362004.aspx#4 (تمت الزيارة في 1 مايو / أيار 2013).
  8. مكتبة البيانات والقصة ، lib.stat.cmu.edu/DASL/Datafiles/USCrime.html (تم الوصول إليه في 1 مايو 2013).
  9. بيانات برنامج التعلم عن بعد LBCC (DL) في 2010-2011 ، http://de.lbcc.edu/reports/2010-11/f...hts.html#focus (تمت الزيارة في 1 مايو 2013).
  10. البيانات من سان خوسيه ميركوري نيوز

إعادة النظر

البيانات هي عناصر فردية من المعلومات تأتي من مجتمع أو عينة. يمكن تصنيف البيانات على أنها نوعية أو كمية مستمرة أو كمية منفصلة.

نظرًا لأنه ليس من العملي قياس السكان بالكامل في دراسة ما ، يستخدم الباحثون عينات لتمثيل السكان. العينة العشوائية هي مجموعة تمثيلية من السكان المختارين باستخدام طريقة تمنح كل فرد في المجتمع فرصة متساوية للتضمين في العينة.تشمل طرق أخذ العينات العشوائية أخذ عينات عشوائية بسيطة ، وأخذ عينات طبقية ، وأخذ عينات عنقودية ، وأخذ عينات منهجية. أخذ العينات الملائمة هو طريقة غير عشوائية لاختيار عينة تنتج غالبًا بيانات متحيزة.

العينات التي تحتوي على أفراد مختلفين تؤدي إلى بيانات مختلفة. هذا صحيح حتى عندما يتم اختيار العينات بشكل جيد وتمثيل السكان. عند اختيارها بشكل صحيح ، فإن العينات الأكبر تمثل السكان بشكل أقرب من العينات الأصغر. هناك العديد من المشاكل المحتملة المختلفة التي يمكن أن تؤثر على موثوقية العينة. تحتاج البيانات الإحصائية إلى تحليل نقدي ، وليس مجرد قبولها.

  1. lastbaldeagle. 2013. في يوم الضرائب ، منزل يدعو إلى إقالة العمال الفيدراليين الذين يتحملون الضرائب. تم نشر استطلاع رأي على الإنترنت على: www.youpolls.com/details.aspx؟id=12328 (تمت الزيارة في 1 مايو / أيار 2013).
  2. Scott Keeter et al. ، "قياس تأثير تزايد عدم الاستجابة على التقديرات من مسح هاتفي وطني RDD ،" الرأي العام ربع السنوي 70 رقم. 5 (2006) ، http://poq.oxfordjournals.org/content/70/5/759.full (تمت الزيارة في 1 مايو / أيار 2013).
  3. الأسئلة المتداولة ، مركز أبحاث بيو للناس والصحافة ، www.people-press.org/methodol...wer-your-polls (تمت الزيارة في 1 مايو / أيار 2013).

قائمة المصطلحات

أخذ العينات العنقودية
طريقة لاختيار عينة عشوائية وتقسيم السكان إلى مجموعات (عناقيد) ؛ استخدام عينات عشوائية بسيطة لتحديد مجموعة من العناقيد. يتم تضمين كل فرد في المجموعات المختارة في العينة.
متغير عشوائي مستمر
متغير عشوائي (RV) تُقاس نتائجه ؛ ارتفاع الأشجار في الغابة هو عربة سكن متنقلة مستمرة.
أخذ العينات الملائمة
طريقة غير عشوائية لاختيار عينة ؛ تحدد هذه الطريقة الأفراد الذين يمكن الوصول إليهم بسهولة وقد ينتج عنها بيانات متحيزة.
المتغير العشوائي المنفصل
متغير عشوائي (RV) تحسب نتائجه
خطأ غير أخذ العينات
قضية تؤثر على موثوقية بيانات أخذ العينات بخلاف التباين الطبيعي ؛ يتضمن مجموعة متنوعة من الأخطاء البشرية بما في ذلك التصميم السيئ للدراسة ، وطرق أخذ العينات المتحيزة ، والمعلومات غير الدقيقة المقدمة من قبل المشاركين في الدراسة ، وأخطاء إدخال البيانات ، والتحليل السيئ.
البيانات النوعية
انظر البيانات.
البيانات الكمية
انظر البيانات.
أخذ العينات العشوائية
طريقة لاختيار عينة تمنح كل فرد من السكان فرصة متساوية للاختيار.
أخذ العينات التحيز
ليس من المرجح أن يتم اختيار جميع أفراد المجتمع بشكل متساوٍ
خطأ المعاينه
الاختلاف الطبيعي الناتج عن اختيار عينة لتمثيل عدد أكبر من السكان ؛ يتناقص هذا الاختلاف مع زيادة حجم العينة ، لذا فإن اختيار عينات أكبر يقلل من خطأ أخذ العينات.
أخذ العينات مع الاستبدال
بمجرد اختيار أحد أفراد المجتمع لإدراجه في عينة ، يتم إرجاع هذا العضو إلى المجتمع لاختيار الفرد التالي.
أخذ العينات بدون استبدال
يمكن اختيار فرد من السكان لإدراجه في عينة مرة واحدة فقط. إذا تم اختياره ، فلن يتم إرجاع العضو إلى المجتمع قبل الاختيار التالي.
عينة عشوائية بسيطة
طريقة مباشرة لاختيار عينة عشوائية ؛ أعط كل فرد من السكان رقمًا. استخدم منشئ الأرقام العشوائية لتحديد مجموعة من الملصقات. تحدد هذه التسميات المختارة عشوائيًا أعضاء عينتك.
اخذ العينات الطبقية
طريقة لاختيار عينة عشوائية تستخدم لضمان تمثيل المجموعات الفرعية من السكان بشكل مناسب ؛ تقسيم السكان إلى مجموعات (طبقات). استخدم أخذ عينات عشوائي بسيط لتحديد عدد متناسب من الأفراد من كل طبقة.
أخذ العينات بشكل منهجي
طريقة لاختيار عينة عشوائية ؛ قائمة بأعضاء السكان. استخدم أخذ العينات العشوائي البسيط لتحديد نقطة البداية في المجتمع. لنفترض أن k = (عدد الأفراد في المجتمع) / (عدد الأفراد المطلوبين في العينة). اختر كل kth في القائمة بدءًا من الشخص الذي تم اختياره عشوائيًا. إذا لزم الأمر ، عد إلى بداية قائمة السكان لإكمال العينة.

مقاييس التباين

تم النشر في ٧ سبتمبر ٢٠٢٠ بواسطة Pritha Bhandari. تمت المراجعة في 26 أكتوبر 2020.

تقلب يصف مدى تباعد نقاط البيانات عن بعضها وعن مركز التوزيع. إلى جانب مقاييس الاتجاه المركزي ، تمنحك مقاييس التباين إحصائيات وصفية تلخص بياناتك.

يشار إلى التقلب أيضًا بالانتشار أو الانتثار أو التشتت. يتم قياسه بشكل شائع بما يلي:

  • نطاق: الفرق بين القيمتين الأعلى والأدنى
  • النطاق الربيعي: نطاق النصف الأوسط من التوزيع
  • الانحراف المعياري: متوسط ​​المسافة من المتوسط
  • فرق: متوسط ​​المسافات المربعة من المتوسط

طرق أخذ العينات والتحيز

اختيار السكان

لنفترض أن أحد السياسيين وظفنا لتحديد مقدار الدعم الذي يتمتع به بين الناخبين إذا قرر الترشح لولاية أخرى. ما هو عدد السكان الذي يجب أن ندرسه؟ كل شخص في الحي؟ ليس كل شخص مؤهلًا للتصويت ، وبغض النظر عن مدى إعجاب شخص ما بالمرشح أو عدم إعجابه به ، فليس لديهم علاقة كبيرة بإعادة انتخابه إذا لم يكونوا قادرين على التصويت.

ماذا عن الناخبين المؤهلين في الدائرة؟ قد يكون ذلك أفضل ، ولكن إذا كان شخص ما مؤهلاً للتصويت ولكنه لم يسجل بحلول الموعد النهائي ، فسيكون له رأي في الانتخابات أيضًا. ماذا عن الناخبين المسجلين؟ تم تسجيل العديد من الأشخاص ولكنهم اختاروا عدم التصويت. ماذا عن & # 8220 الناخبين المحتملين؟ & # 8221

هذه هي المعايير المستخدمة في الكثير من الاستطلاعات السياسية ، ولكن من الصعب أحيانًا تحديد & # 8220 ناخب محتمل. & # 8221 هل هو شخص صوت في الانتخابات الأخيرة؟ في الانتخابات العامة الماضية؟ في الانتخابات الرئاسية الماضية؟ هل يجب أن نعتبر شخصًا بلغ 18 عامًا للتو & # 8220 ناخبًا محتملًا؟ & # 8221 لم يكن مؤهلًا للتصويت في الماضي ، فكيف نحكم على احتمال تصويتهم في الانتخابات القادمة؟

في نوفمبر 1998 ، تم انتخاب المصارع المحترف السابق جيسي & # 8220 The Body & # 8221 Ventura حاكمًا لمينيسوتا. حتى ما قبل الانتخابات مباشرة ، أظهرت معظم استطلاعات الرأي أن فرصة فوزه ضئيلة. كانت هناك العديد من العوامل المساهمة في استطلاعات الرأي التي لا تعكس النية الفعلية للناخبين:

  • كان فينتورا يخوض الانتخابات على تذكرة طرف ثالث وكانت معظم طرق الاقتراع أكثر ملاءمة لسباق ثنائي المرشحين.
  • قد يكون العديد من المشاركين في استطلاعات الرأي محرجين من إخبار منظمي الاستطلاعات أنهم كانوا يخططون للتصويت لمصارع محترف.
  • إن مجرد حقيقة أن استطلاعات الرأي أظهرت أن فرصة فنتورا للفوز ضئيلة ، ربما دفعت بعض الناس إلى التصويت لصالحه احتجاجًا على إرسال رسالة إلى مرشحي الأحزاب الرئيسية.

لكن أحد العوامل الرئيسية المساهمة هو أن فنتورا جند قدرًا كبيرًا من الدعم من الشباب ، وخاصة طلاب الجامعات ، الذين لم يصوتوا من قبل والذين سجلوا على وجه التحديد للتصويت في انتخابات حاكم الولاية. لم تعتبر استطلاعات الرأي أن هؤلاء الشباب من المرجح أن يكونوا ناخبين (لأنه في معظم الحالات يكون لدى الشباب معدل تسجيل أقل للناخبين ومعدل إقبال على الانتخابات) ولذا كانت عينات الاقتراع خاضعة أخذ العينات التحيز: حذفوا جزءًا من الناخبين كان مرجحًا لصالح المرشح الفائز.

أخذ العينات التحيز

تكون طريقة أخذ العينات متحيزة إذا لم يكن لدى كل فرد من السكان احتمالية متساوية لوجوده في العينة.

لذا ، حتى تحديد السكان يمكن أن يكون مهمة صعبة ، ولكن بمجرد تحديد السكان ، كيف نختار عينة مناسبة؟ تذكر ، على الرغم من أننا نفضل إجراء مسح لجميع أفراد المجتمع ، فإن هذا عادة ما يكون غير عملي ما لم يكن عدد السكان صغيرًا جدًا ، لذلك نختار عينة. هناك العديد من الطرق لأخذ عينة من السكان ، ولكن هناك هدف واحد يجب أن نضعه في الاعتبار: نود أن تكون العينة ممثل السكان.

بالعودة إلى وظيفتنا الافتراضية كمستشار سياسي ، لن نتوقع نتائج دقيقة للغاية إذا قمنا بسحب جميع عيناتنا من بين العملاء في ستاربكس ، ولا نتوقع أن عينة مأخوذة بالكامل من قائمة عضوية نادي Elks المحلي سيوفر صورة مفيدة للدعم على مستوى المنطقة لمرشحنا.

إحدى الطرق للتأكد من أن العينة لديها فرصة معقولة لعكس السكان هي التوظيف العشوائية. الطريقة العشوائية الأساسية هي أخذ العينات العشوائية البسيطة.

عينة عشوائية بسيطة

أ عينة عشوائية هو واحد يكون فيه كل فرد من السكان لديه احتمالية متساوية للاختيار. أ عينة عشوائية بسيطة هو واحد يكون فيه كل فرد من السكان وأي مجموعة من الأعضاء لديهم احتمالية متساوية للاختيار.

مثال

إذا تمكنا بطريقة ما من تحديد جميع الناخبين المحتملين في الولاية ، ووضع كل من أسمائهم على قطعة من الورق ، وإلقاء القصاصات في قبعة (كبيرة جدًا) ورسم 1000 زلة من القبعة ، فسنحصل على عينة عشوائية بسيطة.

من الناحية العملية ، تعد أجهزة الكمبيوتر مناسبة بشكل أفضل لهذا النوع من المساعي من ملايين القصاصات الورقية وأغطية الرأس الكبيرة للغاية.

ومع ذلك ، فمن الممكن دائمًا أنه حتى العينة العشوائية قد لا تكون ممثلة تمامًا للسكان. إذا أخذنا عينات من 1000 شخص مرارًا وتكرارًا من بين سكان الناخبين المحتملين في ولاية واشنطن ، فقد تميل بعض هذه العينات إلى الحصول على نسبة مئوية أعلى قليلاً من الديمقراطيين (أو الجمهوريين) مقارنة بعامة السكان ، وقد تتضمن بعض العينات عددًا أكبر من كبار السن. الأشخاص وبعض العينات قد تشمل المزيد من الأشخاص الأصغر سنًا وما إلى ذلك في معظم الحالات ، هذا تقلب العينات ليس كبيرا.

تقلب العينات

يسمى الاختلاف الطبيعي للعينات تقلب العينات.

هذا أمر لا مفر منه ومتوقع في أخذ العينات العشوائية ، وفي معظم الحالات لا يمثل مشكلة.

للمساعدة في حساب التباين ، قد يستخدم منظمو الاستطلاعات بدلاً من ذلك ملف عينة طبقية.

اخذ العينات الطبقية

في اخذ العينات الطبقية، يتم تقسيم السكان إلى عدد من المجموعات الفرعية (أو الطبقات). ثم يتم أخذ عينات عشوائية من كل مجموعة فرعية بأحجام عينة تتناسب مع حجم المجموعة الفرعية في المجتمع.

مثال

لنفترض في ولاية معينة أن البيانات السابقة أشارت إلى أن الناخبين كانوا يتألفون من 39٪ ديموقراطيين و 37٪ جمهوريين و 24٪ مستقلين. في عينة من 1000 شخص ، كانوا يتوقعون الحصول على حوالي 390 ديمقراطيًا و 370 جمهوريًا و 240 مستقلاً. ولتحقيق ذلك ، يمكنهم اختيار 390 شخصًا بشكل عشوائي من بين الناخبين المعروفين عنهم من الديمقراطيين ، و 370 من أولئك المعروفين عن الجمهوريين ، و 240 من أولئك الذين ليس لديهم انتماء حزبي.

يمكن أيضًا استخدام أخذ العينات الطبقية لاختيار عينة مع أشخاص في الفئات العمرية المرغوبة ، ونسبة مزيج محددة من الذكور والإناث ، وما إلى ذلك. يسمى الاختلاف في هذه التقنية أخذ العينات الحصص.

أخذ العينات الحصص

أخذ العينات الحصص هو تباين في أخذ العينات الطبقية ، حيث يتم جمع العينات في كل مجموعة فرعية حتى يتم استيفاء الحصة المرغوبة.

مثال

لنفترض أن منظمي استطلاعات الرأي يتصلون بالناس بشكل عشوائي ، ولكن بمجرد أن يحققوا حصتهم من 390 ديمقراطيًا ، فإنهم يجمعون فقط الأشخاص الذين لا يعرفون أنفسهم على أنهم ديمقراطيون.

ربما تكون قد مررت بتجربة استدعائك من قبل خبير استطلاعي عبر الهاتف بدأ بسؤالك عن عمرك ودخلك وما إلى ذلك ، ثم شكرك على وقتك وأغلق الهاتف قبل طرح أي سؤال & # 8220real & # 8221. على الأرجح ، لقد اتصلوا بالفعل بعدد كافٍ من الأشخاص في مجموعتك الديموغرافية وكانوا يبحثون عن الأشخاص الأكبر سنًا أو الأصغر ، أو الأغنياء أو الأفقر ، وما إلى ذلك. عادةً ما يكون أخذ عينات الحصص أسهل قليلاً من أخذ العينات الطبقية ، ولكنه أيضًا لا يضمن نفس المستوى من العشوائية.

طريقة أخرى لأخذ العينات أخذ العينات العنقودية، حيث يتم تقسيم السكان إلى مجموعات ، ويتم اختيار مجموعة واحدة أو أكثر بشكل عشوائي لتكون في العينة.

أخذ العينات العنقودية

في أخذ العينات العنقودية، يتم تقسيم السكان إلى مجموعات فرعية (مجموعات) ، ويتم اختيار مجموعة من المجموعات الفرعية لتكون في العينة.

مثال

إذا أرادت الكلية إجراء مسح للطلاب ، نظرًا لأن الطلاب مقسمون بالفعل إلى فصول ، فيمكنهم اختيار 10 فصول بشكل عشوائي وتقديم الاستبيان لجميع الطلاب في تلك الفصول. سيكون هذا أخذ العينات العنقودية.

تشمل طرق أخذ العينات الأخرى أخذ العينات بشكل منهجي.

أخذ العينات بشكل منهجي

في أخذ العينات بشكل منهجي، كل ن ال تم اختيار فرد من السكان ليكونوا في العينة.

مثال

لتحديد عينة باستخدام أخذ العينات بشكل منهجي ، يقوم أحد استطلاع الرأي بالاتصال بكل اسم 100 في دليل الهاتف.

أخذ العينات بشكل منهجي ليس عشوائيًا مثل عينة عشوائية بسيطة (إذا كان اسمك هو ألبرت خردفارك وأختك أليكسيس أاردفارك بعدك مباشرة في دفتر الهاتف ، فلا توجد طريقة يمكن أن ينتهي بهما الأمر في العينة) ولكن يمكن أن تسفر عن قبول عينات.

أسوأ طريقة لأخذ عينات

ربما تكون أسوأ أنواع طرق أخذ العينات عينات ملائمة و عينات الاستجابة الطوعية.

أخذ العينات الملائمة وأخذ عينات الاستجابة الطوعية

أخذ العينات الملائمة هي ممارسة العينات المختارة عن طريق اختيار من هو مناسب.

أخذ عينات الاستجابة الطوعية يسمح للعينة بالتطوع.

مثال

يقف أحد استطلاعات الرأي على زاوية شارع ويقابل أول 100 شخص وافقوا على التحدث إليه. ما هي طريقة أخذ العينات التي يمثلها هذا السيناريو؟

يحتوي موقع الويب على استبيان يطلب من القراء إبداء رأيهم في اقتراح ضريبي. ما هي طريقة أخذ العينات الممثلة؟

هذه عينة مختارة ذاتيًا ، أو عينة استجابة تطوعية ، يتطوع فيها المستجيبون للمشاركة.

عادةً ما تميل عينات الاستجابة الطوعية نحو الأشخاص الذين لديهم رأي قوي بشكل خاص حول موضوع الاستطلاع أو الذين لديهم الكثير من الوقت في أيديهم ويستمتعون بإجراء الاستطلاعات.

شاهد الفيديو التالي للحصول على نظرة عامة على جميع طرق أخذ العينات التي تمت مناقشتها حتى الآن.

جربه الآن

في كل حالة ، حدد طريقة أخذ العينات التي تم استخدامها

أ. تم اختيار كل رابع شخص في الفصل

ب. تم اختيار عينة تضم 25 رجلاً و 35 امرأة

ج. يُطلب من مشاهدي برنامج جديد التصويت على الموقع الإلكتروني للبرنامج

د. يختار موقع الويب بشكل عشوائي 50 من عملائه لإرسال استطلاع رضا إليهم

ه. لاستطلاع آراء الناخبين في إحدى المدن ، تختار شركة الاستطلاعات بشكل عشوائي 10 مجمعات سكنية ، وتجري مقابلات مع كل من يعيش في تلك الكتل.

أخذ العينات والمسح الإشكالي

هناك عدد من الطرق التي يمكن من خلالها إتلاف الدراسة قبل أن تبدأ في جمع البيانات. أول ما اكتشفناه بالفعل - أخذ العينات أو التحيز في الاختيار، وهو عندما لا تكون العينة ممثلة للسكان. أحد الأمثلة على ذلك تحيز الاستجابة الطوعية، وهو تحيز يتم تقديمه من خلال جمع البيانات فقط من المتطوعين للمشاركة. ليس هذا هو المصدر الوحيد المحتمل للتحيز.

مصادر التحيز

  • أخذ العينات التحيز - عندما لا تكون العينة ممثلة للسكان
  • تحيز الاستجابة الطوعية - التحيز في أخذ العينات الذي يحدث غالبًا عندما تكون العينة متطوعة
  • دراسة المصلحة الذاتية - التحيز الذي يمكن أن يحدث عندما يهتم الباحثون بالنتيجة
  • تحيز الاستجابة - عندما يعطي المستجيب ردودًا غير دقيقة لأي سبب من الأسباب
  • عدم تصور عدم الكشف عن هويته - عندما يخشى المستجيب من أن إعطاء إجابة صادقة قد يؤثر سلبًا عليه
  • الأسئلة المحملة - عندما تؤثر صياغة السؤال على الإجابات
  • تحيز عدم الاستجابة - عندما يرفض الأشخاص المشاركة في الدراسة يمكن أن يؤثر على صحة النتيجة

أمثلة

ضع في اعتبارك دراسة حديثة وجدت أن مضغ العلكة قد يرفع درجات الرياضيات لدى المراهقين [1]. تم إجراء هذه الدراسة من قبل معهد ريجلي للعلوم ، وهو فرع من شركة ريجلي للعلكة. حدد نوع التحيز في أخذ العينات الموجود في هذا المثال.

يسأل استطلاع للرأي الناس "متى كانت آخر مرة زرت فيها طبيبك؟" ما نوع التحيز في أخذ العينات الذي قد يؤدي إليه هذا؟

هذا قد يعاني من تحيز الاستجابة، نظرًا لأن العديد من الأشخاص قد لا يتذكرون بالضبط آخر مرة زاروا فيها الطبيب ويعطون ردودًا غير دقيقة.

قد تكون مصادر تحيز الاستجابة بريئة ، مثل الذاكرة السيئة ، أو متعمدة مثل الضغط من قبل القائم بالاستطلاع. ضع في اعتبارك ، على سبيل المثال ، عدد عرائض مبادرة التصويت التي يوقعها الأشخاص دون قراءتها.

يطرح استطلاع على المشاركين سؤالاً حول تفاعلاتهم مع أعضاء من أعراق أخرى. ما هو التحيز في أخذ العينات الذي قد يحدث لاستراتيجية المسح هذه؟

يقوم صاحب العمل بإجراء مسح يسأل موظفيهم عما إذا كان لديهم مشكلة تعاطي المخدرات ويحتاجون إلى مساعدة العلاج. ما هو التحيز في أخذ العينات الذي قد يحدث في هذا السيناريو؟

يسأل استطلاع "هل تدعم تمويل البحث عن مصادر الطاقة البديلة لتقليل اعتمادنا على الوقود الأحفوري عالي التلوث؟" ما هو التحيز في أخذ العينات الذي قد ينتج عن هذا المسح؟

هذا مثال على أ محمل أو السؤال الرئيسي - الأسئلة التي تؤدي صياغتها إلى إجابة المجيب.

يمكن أن تحدث الأسئلة المحملة عمدًا من قبل منظمي الاستطلاعات الذين لديهم جدول أعمال ، أو بطريق الخطأ من خلال صياغة أسئلة سيئة. أيضا مصدر قلق ترتيب السؤال، حيث يؤدي ترتيب الأسئلة إلى تغيير النتائج. يقدم باحث علم النفس مثالاً [2]:

"النتيجة المفضلة لدي هي: أجرينا دراسة حيث سألنا الطلاب ، & # 8216 ما مدى رضاك ​​عن حياتك؟ كم مرة لديك موعد؟ & # 8217 لم تكن الإجابات مرتبطة إحصائيًا & # 8211 ستستنتج أنه لا توجد علاقة بين تكرار المواعدة والرضا عن الحياة. ولكن عندما عكسنا الترتيب وسألنا ، & # 8216 كم مرة لديك موعد؟ ما مدى رضاك ​​عن حياتك؟ & # 8217 كانت العلاقة الإحصائية قوية. ستستنتج الآن أنه لا يوجد شيء مهم في حياة الطالب مثل تكرار المواعدة ".

طرح استطلاع عبر الهاتف السؤال "هل لديك وقت في كثير من الأحيان للاسترخاء وقراءة كتاب؟" ، ورفض 50٪ من الأشخاص الذين تم الاتصال بهم الإجابة على الاستبيان. ما هو تحيز أخذ العينات الذي يمثله هذا المسح؟

تتم مناقشة هذه السيناريوهات الإشكالية الخاصة بجمع الإحصائيات بمزيد من التفصيل في الفيديو التالي.

جربه الآن

في كل حالة ، حدد مصدرًا محتملاً للانحياز

أ. يسأل الاستطلاع عن عدد الشركاء الجنسيين لشخص ما في العام الماضي

ب. تطلب محطة إذاعية من القراء الاتصال بالهاتف من اختيارهم في استطلاع يومي.

ج. يريد مدرس بديل معرفة أداء الطلاب في الفصل في الاختبار الأخير. يطلب المعلم من الطلاب العشرة الجالسين في الصف الأمامي أن يذكروا درجاتهم الأخيرة في الاختبار.

د. يُسأل طلاب المدارس الثانوية عما إذا كانوا قد تناولوا الكحول في الأسبوعين الماضيين.

ه. أصدر مجلس اللحم البقري دراسة تفيد بأن تناول اللحوم الحمراء لا يشكل خطورة كبيرة على القلب والأوعية الدموية.

F. يسأل استطلاع للرأي "هل تؤيد ضريبة نقل جديدة ، أم تفضل رؤية نظام النقل العام لدينا ينهار؟"


NORC & # x27s 1990 تصميم أخذ العينات

ملخص

كان إطار أخذ العينات الوطني لعام 1990 لدراسات احتمالية المنطقة ، كما هو موضح في هذه المقالة ، عبارة عن تصميم عنقودي متعدد المراحل مع أخذ عينات منهجية من المناطق الجغرافية والوحدات السكنية. يتم تلخيص مراحل أخذ العينات في الشكل 4. تم اختيار وحدات المعاينة الجغرافية في المرحلتين الأوليين باحتمالية تتناسب مع عدد الوحدات السكنية.تم جمع قوائم العناوين لأصغر وحدات المعاينة الجغرافية. تتألف قوائم العناوين من إطار العينات التمثيلية على المستوى الوطني للوحدات السكنية التي تتطلب مقابلة وجهًا لوجه. عندما تم اختيار وحدات المعالجة ، تم تخصيص العينة للمناطق الجغرافية بحيث يكون لجميع وحدات البحث احتمالية متساوية في الاختيار. كان إطار أخذ العينات الوطني هو الأساس لعدد من الدراسات البارزة على مدار العقد الماضي.

الشكل 4. ملخص لتصميم العينة متعدد المراحل في NORC & # x27s 1990 إطار أخذ العينات الوطني.

في حين أن المبادئ الأساسية لتصميمات احتمالات المنطقة قد تغيرت قليلاً على مر السنين ، فإن التطورات التكنولوجية تجعل التنفيذ أسرع وأرخص. يمكن للمنظمات مثل NORC الاستفادة من هذه التطورات لتقليل التكاليف وزيادة الكفاءة الإحصائية للتصميمات الأساسية.


البيانات وأخذ العينات والتباين في البيانات وأخذ العينات

قد تأتي البيانات من مجتمع أو من عينة. أحرف صغيرة مثل أو بشكل عام تستخدم لتمثيل قيم البيانات. يمكن وضع معظم البيانات في الفئات التالية:

البيانات النوعية هي نتيجة تصنيف أو وصف سمات السكان. غالبًا ما تسمى البيانات النوعية أيضًا البيانات الفئوية. يعد لون الشعر ، وفصيلة الدم ، والمجموعة العرقية ، والسيارة التي يقودها الشخص ، والشارع الذي يعيش فيه الشخص أمثلة على البيانات النوعية. يتم وصف البيانات النوعية بشكل عام بالكلمات أو الحروف. على سبيل المثال ، قد يكون لون الشعر أسود أو بني داكن أو بني فاتح أو أشقر أو رمادي أو أحمر. قد تكون فصيلة الدم AB + أو O- أو B +. غالبًا ما يفضل الباحثون استخدام البيانات الكمية على البيانات النوعية لأنها تفسح المجال للتحليل الرياضي بسهولة أكبر. على سبيل المثال ، ليس من المنطقي العثور على متوسط ​​لون الشعر أو فصيلة الدم.

البيانات الكمية هي دائما أرقام. البيانات الكمية هي نتيجة عد أو قياس سمات السكان. يعد مقدار المال ومعدل النبض والوزن وعدد الأشخاص الذين يعيشون في بلدتك وعدد الطلاب الذين يأخذون الإحصائيات أمثلة على البيانات الكمية. قد تكون البيانات الكمية إما منفصلة أو مستمرة.

تسمى جميع البيانات الناتجة عن العد بالبيانات الكمية المنفصلة. تأخذ هذه البيانات قيمًا رقمية معينة فقط. إذا قمت بحساب عدد المكالمات الهاتفية التي تتلقاها لكل يوم من أيام الأسبوع ، فقد تحصل على قيم مثل صفر أو واحد أو اثنين أو ثلاثة.

البيانات التي لا تتكون فقط من أرقام العد ، ولكن التي قد تتضمن كسورًا أو كسورًا عشرية أو أرقامًا غير منطقية ، تسمى البيانات الكمية المستمرة. غالبًا ما تكون البيانات المستمرة هي نتائج القياسات مثل الأطوال أو الأوزان أو الأوقات. قائمة بالأطوال بالدقائق لجميع المكالمات الهاتفية التي تجريها في أسبوع ، بأرقام مثل 2.4 أو 7.5 أو 11.0 ، ستكون بيانات كمية مستمرة.

البيانات هي عدد الكتب التي يحملها الطلاب في حقائب الظهر الخاصة بهم. يمكنك أخذ عينة من خمسة طلاب. طالبان يحملان ثلاثة كتب وطالب يحمل أربعة كتب وطالب يحمل كتابين وطالب يحمل كتابًا واحدًا. عدد الكتب (ثلاثة وأربعة واثنان وواحد) هي البيانات الكمية المنفصلة.

البيانات هي عدد الأجهزة الموجودة في صالة الألعاب الرياضية. يمكنك أخذ عينة من خمس صالات رياضية. صالة رياضية واحدة بها 12 جهازًا ، وصالة رياضية واحدة بها 15 جهازًا ، وصالة رياضية واحدة بها 10 أجهزة ، وصالة رياضية واحدة بها 22 جهازًا ، وصالة رياضية أخرى بها 20 جهازًا. ما نوع هذه البيانات؟

البيانات هي أوزان حقائب الظهر التي تحتوي على كتب. يمكنك أخذ عينة من نفس الطلاب الخمسة. الأوزان (بالجنيه) لحقائب الظهر هي 6.2 ، 7 ، 6.8 ، 9.1 ، 4.3. لاحظ أن حقائب الظهر التي تحمل ثلاثة كتب يمكن أن يكون لها أوزان مختلفة. الأوزان هي بيانات كمية مستمرة.

البيانات هي مساحات المروج بالأقدام المربعة. يمكنك أخذ عينة من خمسة منازل. تبلغ مساحة المروج 144 قدمًا مربعًا و 160 قدمًا مربعًا و 190 قدمًا مربعًا و 180 قدمًا مربعًا و 210 قدمًا مربعًا. ما نوع هذه البيانات؟

تذهب إلى السوبر ماركت وتشتري ثلاث علب شوربة (19 أوقية طماطم بيسك ، 14.1 أوقية عدس ، 19 أوقية زفاف إيطالي) ، عبوتين من المكسرات (الجوز والفول السوداني) ، أربعة أنواع مختلفة من الخضار (القرنبيط ، القرنبيط ، السبانخ ، والجزر) ، واثنين من الحلويات (16 أوقية آيس كريم بالفستق و 32 أوقية كوكيز برقائق الشوكولاتة).

اسم مجموعات البيانات الكمية المنفصلة والكمية المستمرة والنوعية.

  • علب الحساء الثلاث ، وعبوتان من المكسرات ، وأربعة أنواع من الخضار ، واثنان من الحلويات هي بيانات كمية منفصلة لأنك تحسبها.
  • تعتبر أوزان الحساء (19 أوقية ، 14.1 أوقية ، 19 أوقية) بيانات كمية مستمرة لأنك تقيس الأوزان بأكبر قدر ممكن من الدقة.
  • أنواع الحساء والمكسرات والخضروات والحلويات هي بيانات نوعية لأنها قاطعة.

حاول تحديد مجموعات البيانات الإضافية في هذا المثال.

البيانات هي ألوان حقائب الظهر. مرة أخرى ، قمت بأخذ عينة من نفس الطلاب الخمسة. طالب واحد لديه حقيبة ظهر حمراء وطالبان بحقيبة ظهر سوداء وطالب واحد لديه حقيبة ظهر خضراء وطالب آخر لديه حقيبة ظهر رمادية. تعد الألوان الأحمر والأسود والأسود والأخضر والرمادي بيانات نوعية.

البيانات هي ألوان المنازل. يمكنك أخذ عينة من خمسة منازل. ألوان المنازل هي الأبيض والأصفر والأبيض والأحمر والأبيض. ما نوع هذه البيانات؟

يمكنك جمع البيانات كأرقام والإبلاغ عنها بشكل قاطع. على سبيل المثال ، يتم تسجيل درجات الاختبار لكل طالب طوال الفصل الدراسي. في نهاية الفصل الدراسي ، يتم الإبلاغ عن درجات الاختبار على أنها A أو B أو C أو D أو F.

العمل بشكل تعاوني لتحديد نوع البيانات الصحيح (الكمية أو النوعية). وضّح ما إذا كانت البيانات الكمية مستمرة أم منفصلة. تلميح: غالبًا ما تبدأ البيانات المنفصلة بالكلمات & # 8220 عدد. & # 8221

  1. عدد أزواج الأحذية التي تمتلكها
  2. نوع السيارة التي تقودها
  3. المسافة من منزلك إلى أقرب محل بقالة
  4. عدد الفصول الدراسية التي تأخذها في العام الدراسي.
  5. نوع الآلة الحاسبة التي تستخدمها
  6. أوزان مصارعى السومو
  7. عدد الإجابات الصحيحة في الاختبار
  8. درجات معدل الذكاء (قد يسبب هذا بعض النقاش.)

العناصر a و d و g هي عناصر كمية منفصلة c و f و h هي عناصر كمية مستمرة b و e نوعية أو فئوية.

تحديد نوع البيانات الصحيحة (الكمية أو النوعية) لعدد السيارات في الموقف. وضّح ما إذا كانت البيانات الكمية مستمرة أم منفصلة.

تجمع أستاذة الإحصاء معلومات حول تصنيف طلابها كطلاب مبتدئين أو طلاب السنة الثانية أو المبتدئين أو كبار السن. يتم تلخيص البيانات التي تجمعها في المخطط الدائري (الشكل). ما نوع البيانات التي يعرضها هذا الرسم البياني؟

يوضح هذا المخطط الدائري الطلاب في كل عام ، وهو البيانات النوعية (أو الفئوية).

يحتفظ المسجل في State University بسجلات لعدد الساعات المعتمدة التي يكملها الطلاب في كل فصل دراسي. البيانات التي يجمعها ملخصة في الرسم البياني. تكون حدود الفصل من 10 إلى أقل من 13 ، ومن 13 إلى أقل من 16 ، ومن 16 إلى أقل من 19 ، ومن 19 إلى أقل من 22 ، ومن 22 إلى أقل من 25.


ما نوع البيانات التي يعرضها هذا الرسم البياني؟

مناقشة البيانات النوعية

فيما يلي جداول تقارن عدد الطلاب بدوام جزئي ودوام كامل في كلية De Anza وكلية Foothill المسجلين في ربع ربيع 2010. تعرض الجداول الأعداد (التكرارات) والنسب المئوية أو النسب (الترددات النسبية). تسهل أعمدة النسبة المئوية مقارنة نفس الفئات في الكليات. غالبًا ما يكون عرض النسب المئوية جنبًا إلى جنب مع الأرقام مفيدًا ، ولكنه مهم بشكل خاص عند مقارنة مجموعات البيانات التي لا تحتوي على نفس الإجماليات ، مثل إجمالي التسجيلات لكلا الكليتين في هذا المثال. لاحظ مقدار النسبة المئوية للطلاب غير المتفرغين في Foothill College مقارنة بكلية De Anza.

فصل الخريف 2007 (يوم التعداد)
كلية دي عنزة كلية فوتهيل
عدد نسبه مئويه عدد نسبه مئويه
وقت كامل 9,200 40.9% وقت كامل 4,059 28.6%
دوام جزئى 13,296 59.1% دوام جزئى 10,124 71.4%
مجموع 22,496 100% مجموع 14,183 100%

تعد الجداول طريقة جيدة لتنظيم البيانات وعرضها. لكن الرسوم البيانية يمكن أن تكون أكثر فائدة في فهم البيانات. لا توجد قواعد صارمة بخصوص الرسوم البيانية التي يجب استخدامها. هناك رسمان بيانيان يتم استخدامهما لعرض البيانات النوعية هما المخططات الدائرية والرسوم البيانية الشريطية.

في المخطط الدائري ، يتم تمثيل فئات البيانات بواسطة أسافين في دائرة وتكون متناسبة في الحجم مع النسبة المئوية للأفراد في كل فئة.

في الرسم البياني الشريطي ، يتناسب طول الشريط لكل فئة مع العدد أو النسبة المئوية للأفراد في كل فئة. قد تكون القضبان عمودية أو أفقية.

يتكون مخطط باريتو من أشرطة مرتبة حسب حجم الفئة (الأكبر إلى الأصغر).

انظر إلى (الشكل) و (الشكل) وحدد الرسم البياني (الدائري أو الشريط) الذي تعتقد أنه يعرض المقارنات بشكل أفضل.

من الجيد إلقاء نظرة على مجموعة متنوعة من الرسوم البيانية لمعرفة أيها أكثر فائدة في عرض البيانات. قد نقوم باختيارات مختلفة لما نعتقد أنه الرسم البياني "الأفضل" اعتمادًا على البيانات والسياق. يعتمد اختيارنا أيضًا على ما نستخدم البيانات من أجله.

النسب المئوية التي تضيف إلى أكثر (أو أقل) من 100٪

في بعض الأحيان يصل مجموع النسب المئوية إلى أكثر من 100٪ (أو أقل من 100٪). في الرسم البياني ، تزيد النسب المئوية عن 100٪ لأن الطلاب يمكن أن يكونوا في أكثر من فئة واحدة. الرسم البياني الشريطي مناسب لمقارنة الحجم النسبي للفئات. لا يمكن استخدام المخطط الدائري. كما لا يمكن استخدامه إذا كانت النسب المئوية مضافة إلى أقل من 100٪.

كلية دي عنزة ربيع 2010
الصفة / الفئة نسبه مئويه
طلاب بدوام كامل 40.9%
الطلاب الذين يعتزمون الانتقال إلى مؤسسة تعليمية مدتها 4 سنوات 48.6%
الطلاب الذين تقل أعمارهم عن 25 عامًا 61.0%
مجموع 150.5%

حذف الفئات / البيانات المفقودة

يعرض الجدول عرق الطلاب ولكنه يفتقد فئة & # 8220Other / Unknown & # 8221. تحتوي هذه الفئة على الأشخاص الذين لم يشعروا بأنهم ينتمون إلى أي من الفئات العرقية أو رفضوا الرد. لاحظ أن الترددات لا تساوي العدد الإجمالي للطلاب. في هذه الحالة ، قم بإنشاء رسم بياني شريطي وليس مخطط دائري.

عرق الطلاب في كلية دي عنزا خريف 2007 (يوم التعداد)
تكرار نسبه مئويه
آسيا 8,794 36.1%
أسود 1,412 5.8%
الفلبينية 1,298 5.3%
أصل اسباني 4,180 17.1%
أمريكي أصلي 146 0.6%
جزر المحيط الهادئ 236 1.0%
أبيض 5,978 24.5%
مجموع 22،044 من 24،382 90.4٪ من 100٪

الرسم البياني التالي هو نفسه الرسم البياني السابق ولكن تم تضمين النسبة المئوية "أخرى / غير معروف" (9.6٪). تعتبر فئة "أخرى / غير معروفة" كبيرة مقارنة ببعض الفئات الأخرى (أمريكي أصلي ، 0.6٪ ، جزر المحيط الهادئ 1.0٪). من المهم معرفة ذلك عندما نفكر في ما تخبرنا به البيانات.

قد يكون من الصعب فهم هذا الرسم البياني الشريطي المحدد في (الشكل) بصريًا. الرسم البياني في (الشكل) هو مخطط باريتو. يحتوي مخطط باريتو على الأشرطة المصنفة من الأكبر إلى الأصغر ويسهل قراءتها وتفسيرها.

المخططات الدائرية: لا توجد بيانات مفقودة

تشتمل المخططات الدائرية التالية على فئة "أخرى / غير معروفة" (حيث يجب أن تضاف النسب المئوية إلى 100٪). يتم تنظيم المخطط في (الشكل) حسب حجم كل إسفين ، مما يجعله رسمًا بيانيًا إعلاميًا أكثر من الرسم البياني الأبجدي غير المصنف في (الشكل).

أخذ العينات

غالبًا ما يكلف جمع المعلومات حول مجموعة سكانية بأكملها الكثير أو يكاد يكون مستحيلاً. بدلاً من ذلك ، نستخدم عينة من السكان. يجب أن يكون للعينة نفس خصائص المجتمع الذي تمثله. يستخدم معظم الإحصائيين طرقًا مختلفة لأخذ العينات العشوائية في محاولة لتحقيق هذا الهدف. سيصف هذا القسم بعض الطرق الأكثر شيوعًا. هناك عدة طرق مختلفة لـ أخذ العينات العشوائية. في كل شكل من أشكال أخذ العينات العشوائية ، يتمتع كل فرد من السكان بفرصة متساوية لاختيار العينة. كل طريقة لها إيجابيات وسلبيات. أسهل طريقة لوصفها تسمى عينة عشوائية بسيطة. أي مجموعة من ن من المرجح أن يتم اختيار الأفراد على قدم المساواة مع أي مجموعة أخرى ن الأفراد إذا تم استخدام تقنية أخذ العينات العشوائية البسيطة. بمعنى آخر ، كل عينة من نفس الحجم لها فرصة متساوية في الاختيار. على سبيل المثال ، لنفترض أن ليزا تريد تشكيل مجموعة دراسة من أربعة أشخاص (هي نفسها وثلاثة أشخاص آخرين) من فصل ما قبل حساب التفاضل والتكامل ، والذي يضم 31 عضوًا ليس من بينهم ليزا. لاختيار عينة عشوائية بسيطة من الحجم الثالث من الأعضاء الآخرين في فصلها ، كان بإمكان ليزا وضع جميع الأسماء الـ 31 في قبعة ، وهز القبعة ، وإغلاق عينيها ، واختيار ثلاثة أسماء. هناك طريقة أكثر تقنية هي أن تقوم ليزا أولاً بإدراج الأسماء الأخيرة لأعضاء فصلها مع رقم مكون من رقمين ، كما في (الشكل):

قائمة الفئات
بطاقة تعريف اسم بطاقة تعريف اسم بطاقة تعريف اسم
00 أنسيلمو 11 ملك 21 روكيرو
01 باوتيستا 12 ليجيني 22 روث
02 بياني 13 لوندكويست 23 رويل
03 تشنغ 14 ماسييرز 24 سالانجسانغ
04 كواريزمو 15 موتوجاوا 25 سليد
05 كونينجهام 16 اوكيموتو 26 ستراتشر
06 فونتيشا 17 باتل 27 تلاي
07 هونغ 18 السعر 28 تران
08 هوبلر 19 كويزون 29 واي
09 جياو 20 رييس 30 خشب
10 خان

يمكن أن تستخدم ليزا جدول أرقام عشوائية (موجود في العديد من كتب الإحصاء وكتيبات الرياضيات) ، أو آلة حاسبة ، أو جهاز كمبيوتر لتوليد أرقام عشوائية. في هذا المثال ، افترض أن ليزا اختارت إنشاء أرقام عشوائية من الآلة الحاسبة. الأرقام التي تم إنشاؤها هي كما يلي:

0.94360 0.99832 0.14669 0.51470 0.40581 0.73381 0.04399

تقرأ ليزا المجموعات المكونة من رقمين حتى تختار ثلاثة أعضاء في الفصل (أي أنها تقرأ 0.94360 على أنها المجموعات 94 ، 43 ، 36 ، 60). قد يساهم كل رقم عشوائي فقط عضو واحد في الفصل. إذا احتاجت إلى ذلك ، كان بإمكان ليزا إنشاء المزيد من الأرقام العشوائية.

الأرقام العشوائية 0.94360 و 0.99832 لا تحتوي على رقمين مناسبين. لكن الرقم العشوائي الثالث ، 0.14669 ، يحتوي على 14 (الرقم العشوائي الرابع يحتوي أيضًا على 14) ، والرقم العشوائي الخامس يحتوي على 05 ، والرقم العشوائي السابع يحتوي على 04. الرقم المكون من رقمين 14 يتوافق مع Macierz ، 05 يتوافق مع Cuningham ، و 04 يتوافق مع Cuarismo. إلى جانب نفسها ، ستتألف مجموعة ليزا من Marcierz و Cuningham و Cuarismo.

لتوليد أرقام عشوائية:

  • اضغط على MATH.
  • السهم إلى PRB.
  • اضغط 5: randInt (. أدخل 0 ، 30).
  • اضغط على ENTER لأول رقم عشوائي.
  • اضغط على ENTER مرتين أخريين للرقمين العشوائيين الآخرين. إذا كان هناك تكرار ، فاضغط على ENTER مرة أخرى.

ملحوظة: randInt (0، 30، 3) سيولد 3 أرقام عشوائية.

إلى جانب أخذ العينات العشوائية البسيطة ، هناك أشكال أخرى لأخذ العينات تتضمن عملية فرصة للحصول على العينة. طرق أخذ العينات العشوائية المعروفة الأخرى هي العينة الطبقية والعينة العنقودية والعينة المنهجية.

لاختيار أ عينة طبقية، قسّم السكان إلى مجموعات تسمى طبقات ثم خذ متناسب عدد من كل طبقة. على سبيل المثال ، يمكنك تقسيم (تجميع) طلاب كليتك حسب القسم ثم اختيار عينة عشوائية بسيطة ومتناسبة من كل طبقة (كل قسم) للحصول على عينة عشوائية طبقية. لاختيار عينة عشوائية بسيطة من كل قسم ، قم بترقيم كل عضو في القسم الأول ، ورقم كل عضو في القسم الثاني ، وفعل الشيء نفسه بالنسبة للأقسام المتبقية. ثم استخدم عينة عشوائية بسيطة لاختيار أرقام متناسبة من القسم الأول وافعل الشيء نفسه لكل قسم من الأقسام المتبقية. هذه الأرقام المنتقاة من القسم الأول ، والمختارة من القسم الثاني ، وهكذا تمثل الأعضاء الذين يشكلون العينة الطبقية.

لاختيار أ عينة عنقودية، قسّم السكان إلى مجموعات (مجموعات) ثم اختر عشوائيًا بعض المجموعات. جميع أعضاء هذه المجموعات موجودون في العينة العنقودية. على سبيل المثال ، إذا قمت بأخذ عينات عشوائية من أربعة أقسام من طلاب كليتك ، فإن الأقسام الأربعة تشكل العينة العنقودية. قسّم أعضاء هيئة التدريس في كليتك حسب القسم. الأقسام هي الكتل. قم بترقيم كل قسم ، ثم اختر أربعة أرقام مختلفة باستخدام عينة عشوائية بسيطة. جميع أعضاء الأقسام الأربعة بهذه الأرقام هم عينة الكتلة.

لاختيار أ عينة منهجية، حدد نقطة البداية بشكل عشوائي وأخذ كل منها ن قطعة البيانات من قائمة السكان. على سبيل المثال ، افترض أن عليك إجراء مسح عبر الهاتف. يحتوي دفتر الهاتف الخاص بك على 20000 قائمة إقامة. يجب عليك اختيار 400 اسم للعينة. قم بترقيم السكان من 1 إلى 20000 ثم استخدم عينة عشوائية بسيطة لاختيار رقم يمثل الاسم الأول في العينة. ثم اختر كل خمسين اسمًا بعد ذلك حتى تحصل على إجمالي 400 اسم (قد تضطر إلى العودة إلى بداية قائمة هاتفك). كثيرًا ما يتم اختيار أخذ العينات بشكل منهجي لأنه طريقة بسيطة.

نوع من أخذ العينات غير العشوائي هو أخذ العينات الملائمة. أخذ العينات الملائمة يتضمن استخدام النتائج المتاحة بسهولة. على سبيل المثال ، يُجري متجر برامج الكمبيوتر دراسة تسويقية عن طريق إجراء مقابلات مع العملاء المحتملين الذين يتواجدون في المتجر ويتصفحون البرامج المتاحة. قد تكون نتائج أخذ العينات الملائمة جيدة جدًا في بعض الحالات ومتحيزة للغاية (تفضل نتائج معينة) في حالات أخرى.

يجب أن يتم أخذ العينات بعناية فائقة. يمكن أن يؤدي جمع البيانات بلا مبالاة إلى نتائج مدمرة. قد تكون الاستطلاعات التي يتم إرسالها بالبريد إلى الأسر ثم إعادتها متحيزة للغاية (قد تفضل مجموعة معينة). من الأفضل للشخص الذي يجري الاستطلاع أن يختار عينة المستجيبين.

يتم أخذ العينات العشوائية الحقيقية مع الاستبدال. أي بمجرد اختيار العضو ، يعود ذلك العضو إلى المجتمع وبالتالي يمكن اختياره أكثر من مرة. ومع ذلك ، لأسباب عملية ، في معظم السكان ، يتم أخذ عينات عشوائية بسيطة من دون بديل. عادة ما يتم إجراء الاستطلاعات بدون استبدال. أي ، يمكن اختيار عضو من السكان مرة واحدة فقط. يتم أخذ معظم العينات من مجموعات سكانية كبيرة وتميل العينة إلى أن تكون صغيرة مقارنةً بالسكان. نظرًا لأن هذه هي الحالة ، فإن أخذ العينات بدون استبدال هو تقريبًا نفس أخذ العينات مع الاستبدال لأن فرصة انتقاء نفس الفرد أكثر من مرة مع الاستبدال منخفضة للغاية.

في الكلية التي يبلغ عدد سكانها 10000 شخص ، افترض أنك تريد اختيار عينة من 1000 بشكل عشوائي لإجراء مسح. لأية عينة معينة من 1000، إذا كنت تقوم بأخذ العينات مع الاستبدال,

  • فرصة اختيار الشخص الأول هي 1،000 من 10،000 (0.1000)
  • فرصة اختيار شخص آخر لهذه العينة هي 999 من 10000 (0.0999)
  • فرصة اختيار نفس الشخص مرة أخرى هي 1 من 10000 (منخفضة جدًا).

إذا كنت تقوم بأخذ العينات من دون بديل,

  • فرصة اختيار الشخص الأول لأي عينة معينة هي 1000 من 10000 (0.1000)
  • فرصة اختيار شخص آخر مختلف هي 999 من 9،999 (0.0999)
  • لا تستبدل الشخص الأول قبل اختيار الشخص التالي.

قارن الكسور 999/10000 و 999/9999. من أجل الدقة ، احمل الإجابات العشرية لأربع منازل عشرية تعادل هذه الأرقام لأربعة منازل عشرية (0.0999).

يصبح أخذ العينات بدون استبدال بدلاً من أخذ العينات بالاستبدال مشكلة رياضية فقط عندما يكون عدد السكان صغيرًا. على سبيل المثال ، إذا كان عدد السكان 25 شخصًا ، فإن العينة هي عشرة ، وأنت تقوم بأخذ عينات مع استبدال أي عينة معينة، فإن فرصة اختيار الشخص الأول هي عشرة من 25 ، وفرصة اختيار شخص آخر مختلف هي تسعة من 25 (تستبدل الشخص الأول).

إذا كنت عينة من دون بديل، فإن فرصة اختيار الشخص الأول هي عشرة من 25 ، ثم فرصة اختيار الشخص الثاني (الذي يختلف) هي تسعة من أصل 24 (لا تستبدل الشخص الأول).

قارن الكسور 9/25 و 9/24. لأربعة منازل عشرية ، 9/25 = 0.3600 و 9/24 = 0.3750. لأربعة منازل عشرية ، هذه الأرقام ليست مكافئة.

عند تحليل البيانات ، من المهم أن تكون على دراية بها أخطاء أخذ العينات وأخطاء عدم أخذ العينات. تتسبب العملية الفعلية لأخذ العينات في حدوث أخطاء في أخذ العينات. على سبيل المثال ، قد لا تكون العينة كبيرة بما يكفي. العوامل التي لا تتعلق بعملية أخذ العينات أخطاء غير أخذ العينات. يمكن أن يتسبب جهاز العد المعيب في حدوث خطأ غير أخذ العينات.

في الواقع ، لن تكون العينة ممثلة تمامًا للسكان ، لذلك سيكون هناك دائمًا بعض الأخطاء في أخذ العينات. كقاعدة عامة ، كلما كبرت العينة ، قل خطأ أخذ العينة.

في الإحصاء ، تحيز أخذ العينات يتم إنشاؤه عندما يتم جمع عينة من السكان ولا يُحتمل أن يتم اختيار بعض أفراد المجتمع مثل الآخرين (تذكر ، يجب أن يكون لكل فرد من السكان فرصة متساوية في الاختيار). عندما يحدث تحيز في العينة ، يمكن أن تكون هناك استنتاجات غير صحيحة حول السكان قيد الدراسة.

تقييم نقدي

نحتاج إلى تقييم الدراسات الإحصائية التي قرأنا عنها بشكل نقدي وتحليلها قبل قبول نتائج الدراسات. تشمل المشاكل الشائعة التي يجب أن تكون على دراية بها

  • مشاكل العينات: يجب أن تكون العينة ممثلة للسكان. العينة التي لا تمثل السكان متحيزة. العينات المتحيزة التي لا تمثل السكان تعطي نتائج غير دقيقة وغير صحيحة.
  • العينات المختارة ذاتيًا: غالبًا ما تكون الردود من قبل الأشخاص الذين يختارون الرد ، مثل استطلاعات الاتصال ، غير موثوقة.
  • مشاكل حجم العينة: قد تكون العينات الصغيرة جدًا غير موثوقة. العينات الأكبر أفضل ، إن أمكن. في بعض الحالات ، لا مفر من الحصول على عينات صغيرة ولا يزال من الممكن استخدامها لاستخلاص النتائج. أمثلة: سيارات اختبار التصادم أو الاختبارات الطبية للحالات النادرة
  • التأثير غير المبرر: جمع البيانات أو طرح الأسئلة بطريقة تؤثر على الاستجابة
  • عدم استجابة أو رفض موضوع المشاركة: قد لا تكون الردود المجمعة ممثلة للسكان. في كثير من الأحيان ، قد يجيب الأشخاص ذوو الآراء الإيجابية أو السلبية القوية على الاستطلاعات ، مما قد يؤثر على النتائج.
  • السببية: العلاقة بين متغيرين لا تعني أن أحدهما يتسبب في حدوث الآخر. قد تكون مرتبطة (مرتبطة) بسبب علاقتها من خلال متغير مختلف.
  • الدراسات الممولة ذاتيًا أو دراسات المصلحة الذاتية: دراسة يقوم بها شخص أو منظمة لدعم مطالبهم. هل الدراسة نزيهة؟ اقرأ الدراسة بعناية لتقييم العمل. لا تفترض تلقائيًا أن الدراسة جيدة ، ولكن لا تفترض تلقائيًا أن الدراسة سيئة أيضًا. قم بتقييمها على أساس مزاياها والعمل المنجز.
  • الاستخدام المضلل للبيانات: الرسوم البيانية المعروضة بشكل غير صحيح ، أو البيانات غير المكتملة ، أو عدم وجود سياق
  • الإرباك: عندما لا يمكن فصل تأثيرات العوامل المتعددة على الاستجابة. الارتباك يجعل من الصعب أو المستحيل استخلاص استنتاجات صحيحة حول تأثير كل عامل.

كفئة ، حدد ما إذا كانت العينات التالية تمثيلية أم لا. إذا لم تكن كذلك ، ناقش الأسباب.

  1. للعثور على متوسط ​​المعدل التراكمي لجميع الطلاب في إحدى الجامعات ، استخدم جميع الطلاب المتفوقين في الجامعة كعينة.
  2. لمعرفة الحبوب الأكثر شعبية بين الشباب دون سن العاشرة ، قف خارج سوبر ماركت كبير لمدة ثلاث ساعات وتحدث إلى كل طفل في العشرين من عمره دون سن العاشرة يدخل السوبر ماركت.
  3. للعثور على متوسط ​​الدخل السنوي لجميع البالغين في الولايات المتحدة ، خذ عينة من أعضاء الكونجرس الأمريكي. قم بإنشاء عينة عنقودية من خلال اعتبار كل ولاية على أنها طبقة (مجموعة). باستخدام أخذ عينات عشوائية بسيطة ، حدد الدول لتكون جزءًا من الكتلة. ثم قم بإجراء مسح لكل عضو في الكونغرس الأمريكي في الكتلة.
  4. لتحديد نسبة الأشخاص الذين يستخدمون وسائل النقل العام إلى العمل ، قم بإجراء مسح على 20 شخصًا في مدينة نيويورك. قم بإجراء المسح من خلال الجلوس في سنترال بارك على مقعد وإجراء مقابلة مع كل شخص يجلس بجانبك.
  5. لتحديد متوسط ​​تكلفة الإقامة لمدة يومين في مستشفى في ماساتشوستس ، قم بمسح 100 مستشفى في جميع أنحاء الولاية باستخدام عينات عشوائية بسيطة.

يتم إجراء دراسة لتحديد متوسط ​​الرسوم الدراسية التي يدفعها طلاب جامعة ولاية سان خوسيه لكل فصل دراسي. يُسأل كل طالب في العينات التالية عن مقدار الرسوم الدراسية التي دفعها لفصل الخريف. ما هو نوع أخذ العينات في كل حالة؟

  1. يتم أخذ عينة من 100 طالب جامعي في ولاية سان خوسيه من خلال تنظيم أسماء الطلاب حسب التصنيف (طالب جديد أو طالب في السنة الثانية أو مبتدئ أو متقدم) ، ثم اختيار 25 طالبًا من كل منهم.
  2. يتم استخدام مولد الأرقام العشوائية لاختيار طالب من القائمة الأبجدية لجميع طلاب المرحلة الجامعية الأولى في فصل الخريف. بدءًا من ذلك الطالب ، يتم اختيار كل 50 طالبًا حتى يتم تضمين 75 طالبًا في العينة.
  3. يتم استخدام طريقة عشوائية تمامًا لاختيار 75 طالبًا. يتمتع كل طالب جامعي في فصل الخريف بنفس احتمالية اختياره في أي مرحلة من مراحل عملية أخذ العينات.
  4. السنوات الأولى والثانية والصغرى والكبرى مرقمة رقم واحد وثاني وثلاثة وأربعة على التوالي. يتم استخدام مولد الأرقام العشوائية لاختيار سنتين من تلك السنوات. جميع الطلاب في هذين العامين هم في العينة.
  5. يُطلب من مساعد إداري الوقوف أمام المكتبة يوم الأربعاء ويسأل أول 100 طالب جامعي يقابلهم ما دفعوه مقابل الرسوم الدراسية لفصل الخريف. هؤلاء الطلاب المائة هم العينة.

أ. طبقية ب. ج منهجي. عشوائية بسيطة د. الكتلة ه. السهولة أو الراحة

ستستخدم منشئ الأرقام العشوائية لتوليد أنواع مختلفة من العينات من البيانات.

يعرض هذا الجدول ست مجموعات من درجات الاختبار (كل اختبار يحسب 10 نقاط) لفئة إحصائية أولية.

#1 #2 #3 #4 #5 #6
5 7 10 9 8 3
10 5 9 8 7 6
9 10 8 6 7 9
9 10 10 9 8 9
7 8 9 5 7 4
9 9 9 10 8 7
7 7 10 9 8 8
8 8 9 10 8 8
9 7 8 7 7 8
8 8 10 9 8 7

تعليمات: استخدم منشئ الأرقام العشوائية لاختيار العينات.

  1. قم بإنشاء عينة طبقية حسب العمود. اختر ثلاث درجات اختبار عشوائيًا من كل عمود.
    • قم بترقيم كل صف من واحد إلى عشرة.
    • على الآلة الحاسبة الخاصة بك ، اضغط على الرياضيات واسهم إلى PRB.
    • للعمود 1 ، اضغط 5: randInt (وأدخل 1،10). اضغط دخول. سجل الرقم. اضغط على ENTER مرتين أخريين (حتى التكرارات). سجل هذه الأرقام. سجل درجات الاختبار الثلاثة في العمود الأول التي تتوافق مع هذه الأرقام الثلاثة.
    • كرر للأعمدة من الثاني إلى السادس.
    • درجات الاختبار الـ 18 هذه عبارة عن عينة طبقية.
  2. قم بإنشاء عينة عنقودية عن طريق اختيار عمودين. استخدم أرقام الأعمدة: من واحد إلى ستة.
    • اضغط على MATH والسهم إلى PRB.
    • اضغط 5: randInt (وأدخل 1،6). اضغط دخول. سجل الرقم. اضغط على ENTER وقم بتسجيل هذا الرقم.
    • الرقمان لعمودين.
    • درجات الاختبار (20 منهم) في هذين العمودين هي عينة الكتلة.
  3. قم بإنشاء عينة عشوائية بسيطة من 15 درجة اختبار.
    • استخدم الترقيم من واحد إلى 60.
    • اضغط على MATH. السهم إلى PRB. اضغط 5: randInt (وأدخل 1 ، 60).
    • اضغط على ENTER 15 مرة وقم بتسجيل الأرقام.
    • سجل درجات الاختبار التي تتوافق مع هذه الأرقام.
    • هذه الدرجات الـ 15 هي عينة منهجية.
  4. قم بإنشاء عينة منهجية من 12 درجة اختبار.
    • استخدم الترقيم من واحد إلى 60.
    • اضغط على MATH. السهم إلى PRB. اضغط 5: randInt (وأدخل 1 ، 60).
    • اضغط دخول. سجل الرقم ودرجة الاختبار الأولى. من هذا الرقم ، احسب عشر درجات للاختبار وسجل هذه النتيجة. استمر في عد عشر درجات للاختبار وتسجيل درجة الاختبار حتى تحصل على عينة مكونة من 12 درجة اختبار. يمكنك الالتفاف (العودة إلى البداية).

تحديد نوع العينة المستخدمة (عشوائية بسيطة ، طبقية ، منهجية ، عنقودية ، أو ملائمة).

  1. يختار مدرب كرة القدم ستة لاعبين من مجموعة من الأولاد تتراوح أعمارهم بين ثمانية وعشرة أعوام ، وسبعة لاعبين من مجموعة من الأولاد تتراوح أعمارهم بين 11 و 12 عامًا ، وثلاثة لاعبين من مجموعة من الأولاد تتراوح أعمارهم بين 13 و 14 عامًا لتشكيل فريق كرة قدم ترفيهي.
  2. أجرى أحد الاستطلاعات مقابلات مع جميع موظفي الموارد البشرية في خمس شركات مختلفة للتكنولوجيا الفائقة.
  3. أجرى باحث تربوي من المدرسة الثانوية مقابلات مع 50 معلمة في المدرسة الثانوية و 50 مدرسًا من الذكور في المدارس الثانوية.
  4. باحث طبي يقابل كل مريض سرطان ثالث من قائمة مرضى السرطان في مستشفى محلي.
  5. يستخدم مستشار المدرسة الثانوية جهاز كمبيوتر لإنشاء 50 رقمًا عشوائيًا ثم يختار الطلاب الذين تتوافق أسماؤهم مع الأرقام.
  6. يقوم الطالب بإجراء مقابلات مع زملائه في فصل الجبر لتحديد عدد أزواج الجينز التي يمتلكها الطالب ، في المتوسط.

أ. طبقية ب. الكتلة ج. طبقية د. منهجي ه. راحة عشوائية بسيطة

تحديد نوع العينة المستخدمة (عشوائية بسيطة ، طبقية ، منهجية ، عنقودية ، أو ملائمة).

يقوم مدير مدرسة ثانوية باستطلاع آراء 50 طالبًا جديدًا و 50 طالبًا في السنة الثانية و 50 صغارًا و 50 من كبار السن فيما يتعلق بتغييرات السياسة لأنشطة ما بعد المدرسة.

إذا قمنا بفحص عينتين تمثلان نفس السكان ، حتى لو استخدمنا طرق أخذ العينات العشوائية للعينات ، فلن تكون متطابقة تمامًا. مثلما يوجد تباين في البيانات ، هناك تباين في العينات. عندما تعتاد على أخذ العينات ، سيبدأ التباين في الظهور بشكل طبيعي.

لنفترض أن كلية ABC بها 10000 طالب بدوام جزئي (السكان). نحن مهتمون بمتوسط ​​المبلغ الذي ينفقه الطالب بدوام جزئي على الكتب في فصل الخريف. إن طلب جميع الطلاب البالغ عددهم 10000 هو مهمة شبه مستحيلة.

لنفترض أننا أخذنا عينتين مختلفتين.

أولاً ، نستخدم أخذ العينات المريحة واستقصاء عشرة طلاب من فصل الكيمياء العضوية في الفصل الدراسي الأول. يأخذ العديد من هؤلاء الطلاب حساب التفاضل والتكامل في الفصل الدراسي الأول بالإضافة إلى فصل الكيمياء العضوية. مبلغ المال الذي ينفقونه على الكتب هو كما يلي:

?128 ?87 ?173 ?116 ?130 ?204 ?147 ?189 ?93 ?153

يتم أخذ العينة الثانية باستخدام قائمة كبار السن الذين يأخذون P.E. الصفوف مع أخذ كل خامس من كبار السن على القائمة ، ليصبح المجموع عشرة من كبار السن. يقضون:

?50 ?40 ?36 ?15 ?50 ?100 ?40 ?53 ?22 ?22

من غير المحتمل أن يكون أي طالب في كلتا العينتين.

أ. هل تعتقد أن أيًا من هذه العينات يمثل (أو سمة مميزة) لمجموعة الطلاب الذين يعملون بدوام جزئي البالغ عددهم 10000 طالب؟

أ. لا ، ربما تتكون العينة الأولى من طلاب ذوي توجه علمي. إلى جانب دورة الكيمياء ، يأخذ بعضهم أيضًا حساب التفاضل والتكامل في الفصل الدراسي الأول. تميل كتب هذه الفئات إلى أن تكون باهظة الثمن. يدفع معظم هؤلاء الطلاب ، على الأرجح ، أكثر من متوسط ​​الطالب بدوام جزئي مقابل كتبهم. العينة الثانية عبارة عن مجموعة من كبار السن الذين ، على الأرجح ، يأخذون دورات للصحة والاهتمام. ربما يكون مبلغ المال الذي ينفقونه على الكتب أقل بكثير من متوسط ​​الطالب بدوام جزئي. كلتا العينات متحيزة. أيضًا ، في كلتا الحالتين ، لا يحظى جميع الطلاب بفرصة أن يكونوا في أي من العينة.

ب. نظرًا لأن هذه العينات لا تمثل المجتمع بأكمله ، فهل من الحكمة استخدام النتائج لوصف المجتمع بأكمله؟

ب. لا ، بالنسبة لهذه العينات ، لم يكن لدى كل فرد من السكان فرصة متساوية في الاختيار.

الآن ، لنفترض أننا أخذنا عينة ثالثة. نختار عشرة طلاب مختلفين بدوام جزئي من تخصصات الكيمياء والرياضيات واللغة الإنجليزية وعلم النفس وعلم الاجتماع والتاريخ والتمريض والتربية البدنية والفن وتنمية الطفولة المبكرة. (نفترض أن هذه هي التخصصات الوحيدة التي يلتحق بها طلاب بدوام جزئي في ABC College وأن عددًا متساويًا من الطلاب غير المتفرغين مسجلين في كل من التخصصات.) يتم اختيار كل طالب باستخدام عينات عشوائية بسيطة. باستخدام الآلة الحاسبة ، يتم إنشاء أرقام عشوائية ويتم اختيار طالب من تخصص معين إذا كان لديه رقم مطابق. يصرف الطلاب المبالغ التالية:

?180 ?50 ?150 ?85 ?260 ?75 ?180 ?200 ?200 ?150

ج. العينة غير متحيزة ، ولكن يوصى بعينة أكبر لزيادة احتمالية أن تكون العينة قريبة من تمثيل السكان. ومع ذلك ، بالنسبة لتقنية أخذ العينات المتحيزة ، حتى العينة الكبيرة تتعرض لخطر عدم تمثيل السكان.

يسأل الطلاب غالبًا ما إذا كان & # 8220 جيدًا بما يكفي & # 8221 لأخذ عينة ، بدلاً من مسح السكان بالكامل. إذا تم إجراء المسح بشكل جيد ، فالجواب هو نعم.

يوجد بمحطة إذاعية محلية قاعدة جماهيرية تضم 20000 مستمع. تريد المحطة معرفة ما إذا كان جمهورها يفضل المزيد من الموسيقى أو المزيد من البرامج الحوارية. إن مطالبة جميع المستمعين البالغ عددهم 20 ألف مهمة شبه مستحيلة.

تستخدم المحطة أخذ العينات الملائمة واستطلاعات الرأي لأول 200 شخص يلتقون بهم في أحد أحداث الحفل الموسيقي للمحطة. قال 24 شخصًا إنهم يفضلون المزيد من البرامج الحوارية ، وقال 176 شخصًا إنهم يفضلون المزيد من الموسيقى.

هل تعتقد أن هذه العينة تمثل (أو هي سمة من سمات) مجموع المستمعين البالغ عددهم 20 ألفًا؟

التباين في البيانات

الاختلاف موجود في أي مجموعة من البيانات. على سبيل المثال ، قد تحتوي علب المشروبات سعة 16 أونصة على أكثر أو أقل من 16 أونصة من السائل. في إحدى الدراسات ، تم قياس ثماني علب سعة 16 أونصة وإنتاج الكمية التالية (بالأوقية) من المشروبات:

15.8 16.1 15.2 14.8 15.8 15.9 16.0 15.5

قد تختلف قياسات كمية المشروب في 16 أونصة لأن الأشخاص المختلفين يقومون بالقياسات أو لأن الكمية الدقيقة ، 16 أونصة من السائل ، لم يتم وضعها في العلب. يقوم المصنعون بإجراء اختبارات بانتظام لتحديد ما إذا كانت كمية المشروبات في 16 أونصة يمكن أن تقع ضمن النطاق المطلوب.

اعلم أنه أثناء قيامك بأخذ البيانات ، قد تختلف بياناتك إلى حد ما عن البيانات التي يأخذها شخص آخر لنفس الغرض. هذا طبيعي تمامًا. ومع ذلك ، إذا كان اثنان أو أكثر منكم يأخذون نفس البيانات وحصلوا على نتائج مختلفة تمامًا ، فقد حان الوقت لك وللآخرين لإعادة تقييم طرق أخذ البيانات الخاصة بك ودقتك.

الاختلاف في العينات

لقد ذكرنا سابقًا أن عينتين أو أكثر من نفس السكان ، مأخوذة عشوائيًا ، ولديهم نفس خصائص السكان من المحتمل أن تكون مختلفة عن بعضها البعض. لنفترض أن دورين وجونغ قررا دراسة متوسط ​​الوقت الذي ينام فيه الطلاب في كليتهم كل ليلة. أخذ كل من دورين وجونغ عينات من 500 طالب. يستخدم دورين أخذ العينات بشكل منهجي ويستخدم جونغ أخذ العينات العنقودية. ستكون عينة Doreen & # 8217s مختلفة عن عينة Jung & # 8217s. حتى لو استخدم دورين وجونغ نفس طريقة أخذ العينات ، فمن المرجح أن تكون عيناتهم مختلفة. ومع ذلك ، لن يكون أي منهما مخطئًا.

فكر في ما يساهم في جعل عينات Doreen و Jung مختلفة.

إذا أخذ دورين وجونغ عينات أكبر (أي زيادة عدد قيم البيانات) ، فقد تكون نتائج عيناتهم (متوسط ​​الوقت الذي ينام فيه الطالب) أقرب إلى متوسط ​​عدد السكان الفعلي. لكن مع ذلك ، ستكون عيناتهم ، في جميع الاحتمالات ، مختلفة عن بعضها البعض. هذه التباين في العينات لا يمكن التشديد بما فيه الكفاية.

حجم العينة

حجم العينة (غالبًا ما يسمى عدد الملاحظات) مهم. الأمثلة التي رأيتها في هذا الكتاب حتى الآن كانت صغيرة. تكفي عينات من بضع مئات من الملاحظات فقط ، أو حتى أصغر منها ، للعديد من الأغراض. في الاستطلاع ، تعتبر العينات التي تتراوح من 1200 إلى 1500 ملاحظة كبيرة بما يكفي وجيدة بما يكفي إذا كان المسح عشوائيًا وتم إجراؤه بشكل جيد. سوف تتعلم لماذا عندما تدرس فترات الثقة.

اعلم أن العديد من العينات الكبيرة متحيزة. على سبيل المثال ، تكون استطلاعات الاتصال منحازة دائمًا ، لأن الأشخاص يختارون الاستجابة أم لا.

قسّم إلى مجموعات من اثنين أو ثلاثة أو أربعة. سيعطي مدرسك لكل مجموعة نردًا واحدًا من ستة جوانب. جرب هذه التجربة مرتين. رمي نردًا واحدًا عادلًا (سداسي الجوانب) 20 مرة. سجل عدد الآحاد ، والثاني ، والثالث ، والرباعي ، والخمسي ، والسادس التي تحصل عليها في (الشكل) و (الشكل) ("التكرار" هو عدد المرات التي يحدث فيها وجه معين للنرد):

التجربة الأولى (20 لفة)
وجه على يموت تكرار
1
2
3
4
5
6
التجربة الثانية (20 لفة)
وجه على يموت تكرار
1
2
3
4
5
6

هل كانت للتجربتين نفس النتائج؟ على الاغلب لا. إذا أجريت التجربة للمرة الثالثة ، فهل تتوقع أن تكون النتائج مطابقة للتجربة الأولى أو الثانية؟ لما و لما لا؟

أي تجربة كانت لها النتائج الصحيحة؟ كلاهما فعل. تتمثل مهمة الإحصائي في رؤية التباين واستخلاص النتائج المناسبة.

مراجع

مؤشر Gallup-Healthways Well-Being. http://www.well-beingindex.com/default.asp (تمت الزيارة في 1 مايو 2013).

مؤشر Gallup-Healthways Well-Being. http://www.well-beingindex.com/methodology.asp (تمت الزيارة في 1 مايو 2013).

مؤشر Gallup-Healthways Well-Being. http://www.gallup.com/poll/146822/gallup-healthways-index-questions.aspx (تمت الزيارة في 1 مايو 2013).

بيانات من http://www.bookofodds.com/Relationships-Society/Articles/A0374-How-George-Gallup-Picked-the-President

دومينيك لوزينشي ، "الرئيس" لاندون و 1936 الملخص الأدبي استطلاع: هل يقع اللوم على مالكي السيارات والهواتف؟ " تاريخ العلوم الاجتماعية 36 ، لا. 1: 23-54 (2012) ، http://ssh.dukejournals.org/content/36/1/23.abstract (تمت الزيارة في 1 مايو 2013).

"The Literary Digest Poll ،" Virtual Laboratories in Probability and Statistics http://www.math.uah.edu/stat/data/LiteraryDigest.html (تمت الزيارة في 1 مايو 2013).

"اتجاهات الانتخابات الرئاسية لمجلة غالوب ، 1936-2008" ، Gallup Politics http://www.gallup.com/poll/110548/gallup-presidential-election-trialheat-trends-19362004.aspx#4 (تمت الزيارة في 1 مايو / أيار ، 2013).

مكتبة البيانات والقصة ، http://lib.stat.cmu.edu/DASL/Datafiles/USCrime.html (تم الوصول إليه في 1 مايو 2013).

بيانات برنامج التعلم عن بعد LBCC (DL) في 2010-2011 ، http://de.lbcc.edu/reports/2010-11/future/highlights.html#focus (تمت الزيارة في 1 مايو 2013).

البيانات من سان خوسيه ميركوري نيوز

مراجعة الفصل

البيانات هي عناصر فردية من المعلومات تأتي من مجتمع أو عينة. يمكن تصنيف البيانات على أنها نوعية (فئوية) أو كمية مستمرة أو كمية منفصلة.

نظرًا لأنه ليس من العملي قياس السكان بالكامل في دراسة ما ، يستخدم الباحثون عينات لتمثيل السكان. العينة العشوائية هي مجموعة تمثيلية من السكان المختارين باستخدام طريقة تمنح كل فرد في المجتمع فرصة متساوية للتضمين في العينة. تشمل طرق أخذ العينات العشوائية أخذ العينات العشوائية البسيطة ، والعينة الطبقية ، والعينة العنقودية ، والمعاينة المنتظمة. أخذ العينات الملائمة هو طريقة غير عشوائية لاختيار عينة غالبًا ما تنتج بيانات متحيزة.

العينات التي تحتوي على أفراد مختلفين تؤدي إلى بيانات مختلفة. هذا صحيح حتى عندما يتم اختيار العينات بشكل جيد وتمثيل السكان. عند اختيارها بشكل صحيح ، فإن العينات الأكبر تمثل السكان بشكل أقرب من العينات الأصغر. هناك العديد من المشاكل المحتملة المختلفة التي يمكن أن تؤثر على موثوقية العينة. تحتاج البيانات الإحصائية إلى تحليل نقدي ، وليس مجرد قبولها.

ممارسة

"عدد مرات في الأسبوع" ما هو نوع البيانات؟

أ. النوعي (القاطع) ب. منفصلة الكمي ج. الكمي المستمر

استخدم المعلومات التالية للإجابة على التمارين الأربعة التالية: تم إجراء دراسة لتحديد العمر وعدد المرات في الأسبوع والمدة (مقدار الوقت) للمقيمين الذين يستخدمون حديقة محلية في سان أنطونيو ، تكساس.تم اختيار المنزل الأول في الحي المحيط بالمنتزه بشكل عشوائي ، ثم تمت مقابلة ساكن كل ثمانية منازل في الحي المحيط بالمنتزه.

أ. عشوائية بسيطة ب. ج منهجي. طبقية د. العنقودية

"المدة (مقدار الوقت)" ما هو نوع البيانات؟

أ. النوعي (القاطع) ب. منفصلة الكمي ج. الكمي المستمر

الوان البيوت حول المنتزه ما نوع البيانات؟

أ. النوعي (القاطع) ب. منفصلة الكمي ج. الكمي المستمر

التعداد السكاني هو ______________________

(الشكل) يحتوي على العدد الإجمالي للوفيات في جميع أنحاء العالم نتيجة للزلازل من 2000 إلى 2012.

عام العدد الإجمالي للوفيات
2000 231
2001 21,357
2002 11,685
2003 33,819
2004 228,802
2005 88,003
2006 6,605
2007 712
2008 88,011
2009 1,790
2010 320,120
2011 21,953
2012 768
مجموع 823,856

استخدم (الشكل) للإجابة على الأسئلة التالية.

  1. ما هي نسبة الوفيات بين عامي 2007 و 2012؟
  2. ما هي نسبة الوفيات التي حدثت قبل عام 2001؟
  3. ما هي نسبة الوفيات التي حدثت عام 2003 أو بعد 2010؟
  4. ما هي نسبة الوفيات التي حدثت قبل عام 2012؟
  5. أي نوع من البيانات هو عدد الوفيات؟
  6. يتم قياس الزلازل وفقًا لكمية الطاقة التي تنتجها (الأمثلة 2.1 ، 5.0 ، 6.7). أي نوع من البيانات هذا؟
  7. ما الذي ساهم في ارتفاع عدد الوفيات عام 2010؟ في عام 2004؟ يشرح.
  1. 0.5242
  2. 0.03%
  3. 6.86%
  4. منفصل كمي
  5. الكمي المستمر
  6. في كلا العامين ، أنتجت الزلازل تحت الماء موجات تسونامي هائلة.

بالنسبة للتمارين الأربعة التالية ، حدد نوع العينة المستخدمة (عشوائية بسيطة ، طبقية ، منهجية ، عنقودية ، أو ملائمة).

تنقسم مجموعة من الأشخاص المختبرين إلى اثنتي عشرة مجموعة ثم يتم اختيار أربع مجموعات بشكل عشوائي.

يقوم باحث السوق باستطلاع رأي كل عاشر شخص يدخل متجرًا.

يتم استطلاع آراء أول 50 شخصًا يشاركون في حدث رياضي وفقًا لتفضيلاتهم التلفزيونية.

يولد الكمبيوتر 100 رقم عشوائي ، ويتم اختيار 100 شخص تتوافق أسماؤهم مع الأرقام الموجودة في القائمة.


استخدم المعلومات التالية للإجابة على التمارين السبعة التالية: غالبًا ما يتم إجراء الدراسات بواسطة شركات الأدوية لتحديد مدى فعالية برنامج العلاج. افترض أن عقارًا جديدًا للأجسام المضادة للإيدز قيد الدراسة حاليًا. يتم إعطاؤه للمرضى بمجرد ظهور أعراض الإيدز. الاهتمام هو متوسط ​​(متوسط) طول الفترة الزمنية بالأشهر التي يعيشها المرضى بمجرد بدء العلاج. يتابع باحثان مجموعة مختلفة من 40 مريضاً بالإيدز من بداية العلاج حتى وفاتهم. يتم جمع البيانات التالية (بالأشهر).

الباحث أ: 3 4 11 15 16 17 22 44 37 16 14 24 25 15 26 27 33 29 35 44 13 21 22 10 12 8 40 32 26 27 31 34 29 17 8 24 18 47 33 34

الباحث ب: 3 14 11 5 16 17 28 41 31 18 14 14 26 25 21 22 31 2 35 44 23 21 21 16 12 18 41 22 16 25 33 34 29 13 18 24 23 42 33 29

أكمل الجداول باستخدام البيانات المقدمة:

الباحث أ
مدة البقاء (بالأشهر) تكرار التردد النسبي التردد النسبي التراكمي
0.5–6.5
6.5–12.5
12.5–18.5
18.5–24.5
24.5–30.5
30.5–36.5
36.5–42.5
42.5–48.5
الباحث ب
مدة البقاء (بالأشهر) تكرار التردد النسبي التردد النسبي التراكمي
0.5–6.5
6.5–12.5
12.5–18.5
18.5–24.5
24.5–30.5
30.5–36.5
36.5-45.5

حدد ما تشير إليه بيانات المصطلح الرئيسي في المثال أعلاه للباحث أ.

قيم X، مثل 3 و 4 و 11 وما إلى ذلك

اذكر سببين لاختلاف البيانات.

& lt! & # 8211 & ستختلف إجابات الحلول. نموذج للإجابة: قد يكون أحد الأسباب هو متوسط ​​عمر الأفراد في العينتين. أو ربما يؤثر الدواء على الرجال والنساء بشكل مختلف. إذا لم تكن نسبة الرجال والنساء هي نفسها في كلتا مجموعتي العينة ، فإن البيانات ستختلف. & # 8211 & GT

هل يمكنك معرفة ما إذا كان أحد الباحثين على صواب والآخر غير صحيح؟ لماذا ا؟

لا ، ليس لدينا معلومات كافية لتقديم مثل هذه المطالبة.

هل تتوقع أن تكون البيانات متطابقة؟ لما و لما لا؟

& lt! & # 8211 & ltsolution نظرًا لأن العلاج ليس هو نفسه ، فقد تختلف البيانات ما لم يكن لأي من العلاجين تأثير. & # 8211 & GT

اقترح طريقتين على الأقل قد يستخدمهما الباحثون لجمع بيانات عشوائية.

خذ عينة عشوائية بسيطة من كل مجموعة. إحدى الطرق هي تخصيص رقم لكل مريض واستخدام مولد أرقام عشوائي لاختيار المرضى بشكل عشوائي.

لنفترض أن الباحث الأول أجرى مسحه عن طريق اختيار ولاية واحدة بشكل عشوائي في الدولة ثم اختيار 40 مريضًا بشكل عشوائي من تلك الولاية. ما هي طريقة أخذ العينات التي استخدمها الباحث؟

& lt! & # 8211 & ltsolution لقد استخدم طريقة عينة عشوائية بسيطة. & # 8211 & GT

لنفترض أن الباحث الثاني أجرى الاستطلاع باختيار 40 مريضًا يعرفهم. ما هي طريقة أخذ العينات التي استخدمها الباحث؟ ما هي مخاوفك بشأن مجموعة البيانات هذه ، بناءً على طريقة جمع البيانات؟

سيكون هذا أخذ عينات مريح وليس عشوائيًا.

استخدم البيانات التالية للإجابة على التدريبات الخمسة التالية: يقوم باحثان بجمع بيانات عن ساعات من ألعاب الفيديو التي يلعبها الأطفال في سن المدرسة والشباب. قام كل منهم بأخذ عينات عشوائية لمجموعات مختلفة من 150 طالبًا من نفس المدرسة. يقومون بجمع البيانات التالية.

الباحث أ
ساعات اللعب في الأسبوع تكرار التردد النسبي التردد النسبي التراكمي
0–2 26 0.17 0.17
2–4 30 0.20 0.37
4–6 49 0.33 0.70
6–8 25 0.17 0.87
8–10 12 0.08 0.95
10–12 8 0.05 1
الباحث ب
ساعات اللعب في الأسبوع تكرار التردد النسبي التردد النسبي التراكمي
0–2 48 0.32 0.32
2–4 51 0.34 0.66
4–6 24 0.16 0.82
6–8 12 0.08 0.90
8–10 11 0.07 0.97
10–12 4 0.03 1

اذكر سبب اختلاف البيانات.

& lt! & # 8211 & ltsolution يدرس الباحثون مجموعات مختلفة ، لذا سيكون هناك بعض الاختلاف في البيانات. & # 8211 & GT

هل سيكون حجم العينة كبيرًا بما يكفي إذا كان السكان هم طلاب المدرسة؟

نعم ، سيكون حجم العينة 150 كبيرًا بما يكفي ليعكس عدد سكان مدرسة واحدة.

هل سيكون حجم العينة كبيرًا بما يكفي إذا كان عدد السكان أطفالًا وشبابًا في سن المدرسة في الولايات المتحدة؟

& lt! & # 8211 & ltsolution هناك العديد من الأطفال والشباب في سن المدرسة في الولايات المتحدة ، وقد أجريت الدراسة في مدرسة واحدة فقط ، وبالتالي فإن حجم العينة ليس كبيرًا بما يكفي ليعكس عدد السكان. & # 8211 & GT

يخلص الباحث أ إلى أن معظم الطلاب يلعبون ألعاب الفيديو ما بين أربع إلى ست ساعات كل أسبوع. استنتج الباحث ب أن معظم الطلاب يلعبون ألعاب الفيديو ما بين ساعتين وأربع ساعات كل أسبوع. من هو الصحيح؟

على الرغم من أن البيانات المحددة تدعم استنتاجات كل باحث ، إلا أن النتائج المختلفة تشير إلى ضرورة جمع المزيد من البيانات قبل أن يتمكن الباحثون من التوصل إلى نتيجة.

كجزء من طريقة لمكافأة الطلاب على المشاركة في الاستبيان ، أعطى الباحثون لكل طالب بطاقة هدايا لمتجر لألعاب الفيديو. هل سيؤثر ذلك على البيانات إذا علم الطلاب بالجائزة قبل الدراسة؟

& lt! & # 8211 & ltsolution نعم ، قد يكون الأشخاص الذين يمارسون الألعاب أكثر عرضة للمشاركة ، لأنهم يريدون بطاقة الهدايا أكثر من الطالب الذي لا يلعب ألعاب الفيديو. سيؤدي ذلك إلى استبعاد العديد من الطلاب الذين لا يلعبون الألعاب على الإطلاق ويشوهون البيانات. & # 8211 & GT

استخدم البيانات التالية للإجابة على التدريبات الخمسة التالية: تم إجراء زوج من الدراسات لقياس فعالية برنامج برمجي جديد مصمم لمساعدة مرضى السكتة الدماغية على استعادة مهاراتهم في حل المشكلات. طُلب من المرضى استخدام البرنامج مرتين في اليوم ، مرة في الصباح ومرة ​​في المساء. ولاحظت الدراسات تعافي 200 مريض بسكتة دماغية على مدى عدة أسابيع. جمعت الدراسة الأولى البيانات في (الشكل). جمعت الدراسة الثانية البيانات في (الشكل).

مجموعة أظهر التحسن لا يوجد تحسن تدهور
البرنامج المستخدم 142 43 15
لم تستخدم البرنامج 72 110 18
مجموعة أظهر التحسن لا يوجد تحسن تدهور
البرنامج المستخدم 105 74 19
لم تستخدم البرنامج 89 99 12

بالنظر إلى ما تعرفه ، أي دراسة صحيحة؟

لا توجد معلومات كافية للحكم على ما إذا كان أحدهما صحيحًا أم غير صحيح.

تم إجراء الدراسة الأولى من قبل الشركة التي صممت البرنامج. الدراسة الثانية أجرتها الجمعية الطبية الأمريكية. أي دراسة أكثر موثوقية؟

& lt! & # 8211 & ltsolution الدراسة الثانية أكثر موثوقية ، لأن الشركة ستكون مهتمة بإظهار النتائج التي تفضل معدل تحسن أعلى من المرضى الذين يستخدمون برامجهم. قد تكون البيانات منحرفة ومع ذلك ، فإن الجمعية الطبية الأمريكية لا تهتم بنجاح البرنامج ولذا يجب أن تكون موضوعية. & # 8211 & GT

استنتجت المجموعتان اللتان أجرتا الدراسة أن البرنامج يعمل. هل هذا دقيق؟

يبدو أن البرنامج يعمل لأن الدراسة الثانية تظهر أن المزيد من المرضى يتحسنون أثناء استخدام البرنامج أكثر من عدمه. على الرغم من أن الاختلاف ليس كبيرًا مثل ذلك في الدراسة الأولى ، فمن المحتمل أن تكون نتائج الدراسة الثانية أكثر موثوقية ولا تزال تظهر تحسنًا.

تعتبر الشركة الدراستين كدليل على أن برنامجها يؤدي إلى تحسن عقلي لمرضى السكتة الدماغية. هل هذا بيان عادل؟

& lt! & # 8211 & ltsolution لا ، تشير البيانات إلى أن الاثنين مرتبطان ، ولكن يلزم إجراء المزيد من الدراسات لإثبات أن استخدام البرنامج يؤدي إلى تحسين مرضى السكتة الدماغية. & # 8211 & GT

كان المرضى الذين استخدموا البرنامج أيضًا جزءًا من برنامج تمرين بينما لم يكن المرضى الذين لم يستخدموا البرنامج كذلك. هل يغير هذا من صحة الاستنتاجات من (الشكل)؟

نعم ، لأننا لا نستطيع معرفة ما إذا كان التحسين ناتجًا عن البرنامج أو التمرين ، فإن البيانات مشوشة ، ولا يمكن استخلاص نتيجة موثوقة. يجب إجراء دراسات جديدة.

هل حجم العينة 1000 هو مقياس موثوق لعدد السكان البالغ 5000؟

& lt! & # 8211 & ltsolution نعم ، يمثل 1000 يمثل 20٪ من السكان ويجب أن يكون ممثلًا ، إذا تم اختيار مجتمع العينة عشوائيًا. & # 8211 & GT

هل تمثل عينة من 500 متطوع مقياسًا موثوقًا به لعدد سكان يبلغ 2500؟

لا ، على الرغم من أن العينة كبيرة بما يكفي ، فإن حقيقة أن العينة تتكون من متطوعين تجعلها عينة ذاتية الاختيار ، وهو أمر غير موثوق به.

يقول سؤال في استطلاع: & # 8220 هل تفضل المذاق اللذيذ للعلامة التجارية X أم طعم العلامة التجارية Y؟ & # 8221 هل هذا سؤال عادل؟

& lt! & # 8211 & ltsolution No ، السؤال هو خلق تأثير لا داعي له بإضافة الكلمة & # 8220delicious & # 8221 لوصف العلامة التجارية X. قد تؤثر الصياغة على الردود. & # 8211 & GT

هل حجم العينة المكون من شخصين ممثلين لمجتمع مكون من خمسة أفراد؟

لا ، على الرغم من أن العينة تمثل جزءًا كبيرًا من السكان ، إلا أن إجابتين لا تكفيان لتبرير أي استنتاجات. نظرًا لأن عدد السكان صغير جدًا ، سيكون من الأفضل تضمين الجميع في السكان للحصول على البيانات الأكثر دقة.

هل من الممكن إجراء تجربتين بشكل جيد بأحجام عينات متشابهة للحصول على بيانات مختلفة؟

& lt! & # 8211 & ltsolution نعم ، سيكون هناك على الأرجح درجة من الاختلاف بين أي دراستين ، حتى لو تم إعدادهما وتشغيلهما بنفس الطريقة. قد تتأثر كل دراسة بشكل مختلف بعوامل غير معروفة مثل الموقع أو الحالة المزاجية للموضوعات أو الوقت من العام. & # 8211 & GT

واجب، فرض

بالنسبة للتمارين التالية ، حدد نوع البيانات التي يمكن استخدامها لوصف الاستجابة (كمية منفصلة ، أو كمية مستمرة ، أو نوعية) ، وأعط مثالاً على البيانات.

عدد التذاكر المباعة لحفلة موسيقية

المنفصلة الكمية ، 150

& lt! & # 8211 & ltsolution الكمي المستمر ، 19.2٪ & # 8211 & GT

الوقت في الطابور لشراء البقالة

& lt! & # 8211 & ltsolution الكمي المستمر ، 7.2 دقيقة & # 8211 & GT

عدد الطلاب المسجلين في كلية إيفرجرين فالي

منفصل كمي 11.234 طالب وطالبة

البرنامج التلفزيوني الأكثر مشاهدة

& lt! & # 8211 & ltsolution النوعي ، الرقص مع النجوم & # 8211 & gt

المسافة إلى أقرب دار سينما

& lt! & # 8211 & ltsolution الكمي المستمر ، 8.32 ميل & # 8211 & GT

عمر المديرين التنفيذيين في شركات Fortune 500

الكمي المستمر 47.3 سنة

عدد حزم برامج جداول بيانات الكمبيوتر المتنافسة

& lt! & # 8211 & ltsolution الكمي المنفصل ، ثلاثة & # 8211 & GT

استخدم المعلومات التالية للإجابة على التمرينين التاليين: تم إجراء دراسة لتحديد العمر وعدد المرات في الأسبوع والمدة (مقدار الوقت) لاستخدام المقيمين لحديقة محلية في سان خوسيه. تم اختيار المنزل الأول في الحي المحيط بالمنتزه بشكل عشوائي ثم تمت مقابلة كل منزل ثامن في الحي المحيط بالمنتزه.

"عدد مرات في الأسبوع" ما هو نوع البيانات؟

"المدة (مقدار الوقت)" ما هو نوع البيانات؟

تهتم شركات الطيران باتساق عدد الأطفال في كل رحلة ، بحيث يكون لديهم معدات سلامة كافية. افترض أن شركة طيران تجري مسحًا. خلال عطلة نهاية الأسبوع في عيد الشكر ، قامت باستطلاع ست رحلات جوية من بوسطن إلى سولت ليك سيتي لتحديد عدد الأطفال على متن الرحلات. يحدد كمية معدات السلامة التي تحتاجها نتيجة تلك الدراسة.

  1. باستخدام جمل كاملة ، ضع قائمة بثلاثة أشياء خاطئة في طريقة إجراء الاستطلاع.
  2. باستخدام جمل كاملة ، ضع قائمة بثلاث طرق يمكنك من خلالها تحسين الاستطلاع إذا تم تكراره.
  1. تم إجراء المسح باستخدام ست رحلات جوية مماثلة.
    لن يكون المسح تمثيلًا حقيقيًا لجميع المسافرين جواً.
    لن يؤدي إجراء الاستطلاع في عطلة نهاية الأسبوع إلى نتائج تمثيلية.
  2. قم بإجراء المسح في أوقات مختلفة من العام.
    قم بإجراء المسح باستخدام الرحلات الجوية من وإلى المواقع المختلفة.
    قم بإجراء المسح في أيام مختلفة من الأسبوع.

لنفترض أنك تريد تحديد متوسط ​​عدد الطلاب لكل فصل إحصائي في ولايتك. صف طريقة ممكنة لأخذ العينات في ثلاث إلى خمس جمل كاملة. اجعل الوصف مفصلاً.

لنفترض أنك تريد تحديد متوسط ​​عدد علب الصودا التي يشربها الطلاب في العشرينات من العمر في مدرستك كل شهر. صف طريقة ممكنة لأخذ العينات في ثلاث إلى خمس جمل كاملة. اجعل الوصف مفصلاً.

الأجوبة ستختلف. نموذج إجابة: يمكنك استخدام طريقة منهجية لأخذ العينات. أوقف الشخص العاشر عندما يغادر أحد المباني في الحرم الجامعي في الساعة 9:50 صباحًا. ثم توقف الشخص العاشر عندما يغادر مبنى مختلفًا في الحرم الجامعي في الساعة 1:50 بعد الظهر.

اذكر بعض الصعوبات العملية التي ينطوي عليها الحصول على نتائج دقيقة من استطلاع عبر الهاتف.

& lt! & # 8211 & ستختلف إجابات الحلول. نموذج إجابة: ليس كل الأشخاص لديهم رقم هاتف مدرج. كثير من الناس يغلقون الخط أو لا يستجيبون لاستطلاعات الرأي عبر الهاتف & # 8211 & GT

اذكر بعض الصعوبات العملية التي ينطوي عليها الحصول على نتائج دقيقة من المسح بالبريد.

الأجوبة ستختلف. نموذج إجابة: كثير من الناس لن يستجيبوا للاستطلاعات البريدية. إذا ردوا على الاستطلاعات ، فلن تكون متأكدًا من المستجيب. بالإضافة إلى ذلك ، يمكن أن تكون القوائم البريدية غير كاملة.

مع زملائك في الفصل ، قم بعصف ذهني لبعض الطرق التي يمكنك من خلالها التغلب على هذه المشاكل إذا كنت بحاجة إلى إجراء مسح عبر الهاتف أو البريد.

& lt! & # 8211 & ltsolution اطلب من الجميع تضمين أعمارهم ثم أخذ عينة عشوائية من البيانات. قم بتضمين التقرير كيف تم إجراء المسح ولماذا قد لا تكون النتائج دقيقة. & # 8211 & GT

تأخذ المعلمة عينتها من خلال جمع بيانات عن خمسة طلاب تم اختيارهم عشوائيًا من كل فصل رياضيات بكلية ليك تاهو المجتمعية. نوع أخذ العينات التي استخدمتها هو

  1. أخذ العينات العنقودية
  2. اخذ العينات الطبقية
  3. عينة عشوائية بسيطة
  4. أخذ العينات الملائمة

تم إجراء دراسة لتحديد العمر وعدد المرات في الأسبوع والمدة (مقدار الوقت) للمقيمين الذين يستخدمون حديقة محلية في سان خوسيه. تم اختيار المنزل الأول في الحي المحيط بالمنتزه بشكل عشوائي ثم تمت مقابلة كل ثامن منزل في الحي المحيط بالمنتزه. كانت طريقة أخذ العينات:

قم بتسمية طريقة أخذ العينات المستخدمة في كل من المواقف التالية:

  1. امرأة في المطار توزع استبيانات للمسافرين تطلب منهم تقييم خدمة المطار. إنها لا تسأل المسافرين الذين يسارعون عبر المطار وأيديهم مليئة بالأمتعة ، ولكنها تسأل بدلاً من ذلك جميع المسافرين الذين يجلسون بالقرب من البوابات ولا يأخذون قيلولة أثناء الانتظار.
  2. تريد معلمة معرفة ما إذا كان طلابها يقومون بواجب منزلي ، لذلك تختار بشكل عشوائي الصفين الثاني والخامس ثم تدعو جميع الطلاب في الصف الثاني وجميع الطلاب في الصف الخامس لتقديم حلول لمشاكل الواجب المنزلي إلى الفصل.
  3. يريد مدير التسويق في أحد متاجر سلسلة الإلكترونيات معلومات حول أعمار عملائه. على مدار الأسبوعين المقبلين ، في كل موقع متجر ، يتم إعطاء 100 عميل تم اختيارهم عشوائيًا استبيانات لملء طلب معلومات حول العمر ، وكذلك حول المتغيرات الأخرى ذات الأهمية.
  4. يريد أمين المكتبة في مكتبة عامة تحديد نسبة مستخدمي المكتبة من الأطفال. أمينة المكتبة لديها ورقة إحصاء تحدد عليها ما إذا كان قد تم سحب الكتب من قبل شخص بالغ أو طفل. تقوم بتسجيل هذه البيانات لكل رابع مستفيد يقوم بمراجعة الكتب.
  5. حزب سياسي يريد معرفة رد فعل الناخبين على نقاش بين المرشحين. في اليوم التالي للمناقشة ، اتصل موظفو الاقتراع بالحزب بـ 1200 رقم هاتف تم اختيارهم عشوائيًا. إذا قام ناخب مسجل بالرد على الهاتف أو كان متاحًا للحضور عبر الهاتف ، فسيُسأل ذلك الناخب المسجل عمن ينوي التصويت له وما إذا كانت المناقشة قد غيرت رأيه أو رأيها بالمرشحين.

الراحة العنقودية طبقية منهجية بسيطة عشوائية

تم إجراء "مسح عشوائي" على 3274 شخصًا من "جيل المعالجات الدقيقة" (الأشخاص الذين ولدوا منذ عام 1971 ، وهو العام الذي تم فيه اختراع المعالج الدقيق). أفيد أن 48 ٪ من الأفراد الذين شملهم الاستطلاع ذكروا أنه إذا كان لديهم 2000 جنيه استرليني لإنفاقها ، فسيستخدمونها في أجهزة الكمبيوتر. أيضًا ، اعتبر 66٪ ممن شملهم الاستطلاع أنهم من مستخدمي الكمبيوتر الأذكياء نسبيًا.

  1. هل تعتبر أن حجم العينة كبير بما يكفي لدراسة من هذا النوع؟ لما و لما لا؟
  2. بناءً على "شعورك الغريزي" ، هل تعتقد أن النسب المئوية تعكس بدقة عدد سكان الولايات المتحدة بالنسبة للأفراد الذين ولدوا منذ عام 1971؟ إذا لم يكن الأمر كذلك ، فهل تعتقد أن النسب المئوية للسكان هي في الواقع أعلى أو أقل من إحصاءات العينة؟ لماذا ا؟
    معلومات إضافية: تم ملء الاستطلاع ، الذي أبلغت عنه شركة Intel ، من قبل الأفراد الذين زاروا مركز مؤتمرات لوس أنجلوس لمشاهدة عرض معهد سميثسونيان و # 8217s بعنوان "America’s Smithsonian".
  3. مع هذه المعلومات الإضافية ، هل تشعر أن جميع المجموعات الديموغرافية والعرقية تم تمثيلها بالتساوي في هذا الحدث؟ لما و لما لا؟
  4. مع المعلومات الإضافية ، قم بالتعليق على مدى دقة اعتقادك أن إحصاءات العينة تعكس معلمات السكان.

& lt! & # 8211 & ltsolution نعم ، في الاقتراع ، تعتبر العينات التي تتراوح من 1200 إلى 1500 ملاحظة كبيرة بما يكفي وجيدة بما يكفي إذا كان المسح عشوائيًا وتم إجراؤه جيدًا. ليس لدينا معلومات كافية لتقرير ما إذا كانت هذه عينة عشوائية من سكان الولايات المتحدة. لا ، هذه عينة ملائمة مأخوذة من الأفراد الذين زاروا معرضًا في مركز مؤتمرات أنجيليس. هذه العينة لا تمثل سكان الولايات المتحدة. من الممكن أن تكون إحصائيات العينة ، 48٪ و 66٪ ، أكبر من المعلمات الحقيقية في المجتمع ككل. على أي حال ، لا يمكن استنتاج أي استنتاج حول النسب السكانية من عينة الملاءمة هذه. & # 8211 & GT

مؤشر الرفاهية هو مسح يتبع اتجاهات المقيمين في الولايات المتحدة على أساس منتظم. هناك ستة مجالات للصحة والعافية تم تناولها في الاستطلاع: تقييم الحياة ، والصحة العاطفية ، والصحة البدنية ، والسلوك الصحي ، وبيئة العمل ، والوصول الأساسي. بعض الأسئلة المستخدمة لقياس المؤشر مذكورة أدناه.

حدد نوع البيانات التي تم الحصول عليها من كل سؤال مستخدم في هذا المسح: نوعية أو كمية منفصلة أو كمية مستمرة.

  1. هل لديك أي مشاكل صحية تمنعك من القيام بأي من الأشياء التي يمكن للأشخاص في عمرك القيام بها عادة؟
  2. خلال الثلاثين يومًا الماضية ، كم عدد الأيام التي منعك فيها اعتلال الصحة من ممارسة أنشطتك المعتادة؟
  3. في الأيام السبعة الماضية ، كم عدد الأيام التي مارستها فيها لمدة 30 دقيقة أو أكثر؟
  4. هل لديك تغطية تأمين صحي؟
  1. نوعي
  2. منفصل كمي
  3. منفصل كمي
  4. نوعي

قبل الانتخابات الرئاسية لعام 1936 ، أصدرت مجلة بعنوان Literary Digest نتائج استطلاع للرأي تنبأت بفوز المرشح الجمهوري ألف لاندون بهامش كبير. أرسلت المجلة بطاقات بريدية إلى ما يقرب من 10000000 ناخب محتمل. تم اختيار هؤلاء الناخبين المحتملين من قائمة الاشتراك في المجلة ، ومن قوائم تسجيل السيارات ، ومن قوائم الهاتف ، ومن قوائم عضوية النادي. أعاد ما يقرب من 2300000 شخص البطاقات البريدية.

  1. فكر في حالة الولايات المتحدة في عام 1936. اشرح سبب عدم تمثيل العينة المختارة من قوائم الاشتراك في المجلات وقوائم تسجيل السيارات ودفاتر الهاتف وقوائم عضوية النادي لسكان الولايات المتحدة في ذلك الوقت.
  2. ما هو تأثير معدل الاستجابة المنخفض على موثوقية العينة؟
  3. هل هذه المشاكل أمثلة على خطأ في أخذ العينات أو خطأ غير أخذ العينات؟
  4. خلال نفس العام ، أجرى جورج جالوب استطلاعه الخاص لـ 30.000 ناخب محتمل. استخدم هؤلاء الباحثون طريقة أطلقوا عليها & # 8220quota sampling & # 8221 للحصول على إجابات استقصائية من مجموعات فرعية محددة من السكان. أخذ العينات بنظام الحصص هو مثال على طريقة أخذ العينات الموضحة في هذه الوحدة؟

& lt! & # 8211 & ltsolution كانت البلاد في منتصف فترة الكساد الكبير ولم يتمكن الكثير من الناس من شراء هذه العناصر & # 8220luxury & # 8221 ، وبالتالي لا يمكن تضمينها في الاستطلاع. يمكن أن تؤدي العينات الصغيرة جدًا إلى تحيز في أخذ العينات. خطأ أخذ العينات طبقية & # 8211 & GT

تم جمع الإحصاءات المتعلقة بالجريمة والديموغرافية لـ 47 ولاية أمريكية في عام 1960 من الوكالات الحكومية ، بما في ذلك FBI & # 8217s تقرير الجريمة الموحد. وجد أحد تحليلات هذه البيانات علاقة قوية بين التعليم والجريمة مما يشير إلى أن المستويات الأعلى من التعليم في المجتمع تتوافق مع معدلات الجريمة المرتفعة.

أي من المشاكل المحتملة مع العينات التي تمت مناقشتها في (الشكل) يمكن أن تفسر هذا الارتباط؟

السببية: حقيقة أن متغيرين مرتبطين لا يضمن أن أحد المتغيرات يؤثر على الآخر. لا يمكننا أن نفترض أن معدل الجريمة يؤثر على مستوى التعليم أو أن مستوى التعليم يؤثر على معدل الجريمة.

مربك: هناك العديد من العوامل التي تحدد المجتمع بخلاف مستوى التعليم ومعدل الجريمة. قد يكون للمجتمعات ذات معدلات الجريمة المرتفعة والمستويات التعليمية العالية متغيرات كامنة أخرى تميزها عن المجتمعات ذات معدلات الجريمة المنخفضة والمستويات التعليمية المنخفضة. لأننا لا نستطيع عزل هذه المتغيرات ذات الأهمية ، لا يمكننا استخلاص استنتاجات صحيحة حول العلاقة بين التعليم والجريمة. تشمل المتغيرات الكامنة المحتملة نفقات الشرطة ، ومستويات البطالة ، والمنطقة ، ومتوسط ​​العمر ، والحجم.

YouPolls هو موقع ويب يتيح لأي شخص إنشاء استطلاعات الرأي والرد عليها. سؤال واحد تم نشره في 15 أبريل يسأل:

"هل تشعر بالسعادة عند دفع ضرائبك عندما يُسمح لأعضاء إدارة أوباما بتجاهل التزاماتهم الضريبية؟" (lastbaldeagle. 2013. On Tax Day، House to Call for Firing Federal Workers Who Owe Back Taxes. نشر استطلاع رأي على الإنترنت على: http://www.youpolls.com/details.aspx؟id=12328 (تمت الزيارة في 1 مايو / أيار 2013) ).)

اعتبارًا من 25 أبريل ، رد 11 شخصًا على هذا السؤال. أجاب كل مشارك "لا!"

أي من المشاكل المحتملة مع العينات التي تمت مناقشتها في هذه الوحدة يمكن أن تفسر هذا الارتباط؟

& lt! & # 8211 & ltsolution عينات مختارة ذاتيًا: فقط الأشخاص المهتمون بالموضوع هم من يختارون الرد. قضايا حجم العينة: لن تمثل العينة المكونة من 11 مشاركًا فقط آراء أمة ما بدقة. تأثير لا داعي له: السؤال عبارة عن صياغة بطريقة محددة لتوليد استجابة محددة. دراسات التمويل الذاتي أو دراسات المصلحة الذاتية: تم إنشاء هذا السؤال لدعم مطالبة شخص واحد # 8217s وقد تم تصميمه للحصول على الإجابة التي يرغب فيها الشخص. & # 8211 & GT

تبدأ المقالة العلمية حول معدلات الاستجابة بالاقتباس التالي:

"يؤدي انخفاض معدلات الاتصال والتعاون في الاستطلاعات الهاتفية الوطنية ذات الأرقام العشوائية (RDD) إلى إثارة مخاوف جدية بشأن صحة التقديرات المستمدة من مثل هذه الأبحاث." (سكوت كيتر وآخرون ، "قياس تأثير تزايد عدم الاستجابة على التقديرات من RDD الوطنية استطلاع عبر الهاتف "Public Opinion Quarterly 70 no. 5 (2006) http://poq.oxfordjournals.org/content/70/5/759.full (تمت الزيارة في 1 مايو / أيار 2013).)

يقر مركز بيو لأبحاث الناس والصحافة:

"النسبة المئوية للأشخاص الذين قابلناهم - من بين كل ما نحاول مقابلتهم - آخذة في الانخفاض على مدار العقد الماضي أو أكثر." (الأسئلة المتداولة ، مركز أبحاث بيو للناس والصحافة ، http://www.people-press.org/methodology/frequently-asked-questions/#dont-you-have-trouble-getting-people-to- الإجابة على استطلاعات الرأي (تمت الزيارة في 1 مايو 2013).)

  1. ما هي بعض أسباب انخفاض معدل الاستجابة خلال العقد الماضي؟
  2. اشرح سبب اهتمام الباحثين بتأثير انخفاض معدل الاستجابة على استطلاعات الرأي العام.
  1. الأسباب المحتملة: زيادة استخدام معرف المتصل ، وانخفاض استخدام الخطوط الأرضية ، وزيادة استخدام الأرقام الخاصة ، والبريد الصوتي ، ومديري الخصوصية ، والطبيعة المحمومة للجداول الشخصية ، وانخفاض الرغبة في إجراء المقابلات
  2. عندما يرفض عدد كبير من الأشخاص المشاركة ، فقد لا يكون للعينة نفس خصائص السكان. ربما يفعل غالبية الأشخاص الراغبين في المشاركة ذلك لأنهم يشعرون بقوة تجاه موضوع الاستطلاع.

اجمعها معا

استجاب سبعمائة وواحد وسبعون طالبًا من طلاب التعلم عن بعد في Long Beach City College لاستطلاعات الرأي في العام الدراسي 2010-11. تم سرد النقاط البارزة في التقرير الموجز في (الشكل).

  1. ما هي نسبة الطلاب الذين شملهم الاستطلاع ليس لديهم جهاز كمبيوتر في المنزل؟
  2. حول كم عدد الطلاب في الاستطلاع الذين يعيشون على بعد 16 ميلاً على الأقل من الحرم الجامعي؟
  3. إذا تم إجراء نفس الاستطلاع في Great Basin College في إلكو ، نيفادا ، هل تعتقد أن النسب المئوية ستكون هي نفسها؟ لماذا ا؟

& lt! & # 8211 & ltsolution 4٪ 13٪ ليس بالضرورة. لونج بيتش سيتي هي سابع أكبر مدينة في كاليفورنيا ، حيث يبلغ عدد الطلاب المسجلين في الكلية حوالي 27000 طالب. من ناحية أخرى ، يوجد في Great Basin College حرم جامعي في المناطق الريفية الشمالية الشرقية بولاية نيفادا ، ويبلغ عدد الطلاب المسجلين فيها حوالي 3500 طالب. & # 8211 & GT

يعلن العديد من بائعي الكتب المدرسية بالتجزئة عبر الإنترنت أن أسعارهم أقل من أسعار المكتبات داخل الحرم الجامعي. ومع ذلك ، فإن العامل المهم هو ما إذا كان تجار التجزئة على الإنترنت لديهم بالفعل الكتب المدرسية التي يحتاجها الطلاب في المخزون. يجب أن يكون الطلاب قادرين على الحصول على الكتب المدرسية على الفور في بداية الفصل الدراسي بالكلية. إذا لم يكن الكتاب متاحًا ، فلن يتمكن الطالب من الحصول على الكتاب المدرسي على الإطلاق ، أو قد يتأخر التسليم إذا تمت إعادة طلب الكتاب.


يقوم مراسل صحيفة جامعية بالتحقيق في مدى توفر الكتب المدرسية في متاجر التجزئة عبر الإنترنت. قرر التحقيق في كتاب مدرسي واحد لكل من الموضوعات السبعة التالية: حساب التفاضل والتكامل ، وعلم الأحياء ، والكيمياء ، والفيزياء ، والإحصاء ، والجيولوجيا ، والهندسة العامة. يستشير بيانات مبيعات صناعة الكتب المدرسية ويختار أكثر الكتب المدرسية شيوعًا المستخدمة على المستوى الوطني في كل من هذه الموضوعات. يقوم بزيارة مواقع الويب للحصول على عينة عشوائية من كبار بائعي الكتب المدرسية عبر الإنترنت ويبحث عن كل من هذه الكتب المدرسية السبعة لمعرفة ما إذا كانت متوفرة في المخزون للتسليم السريع من خلال تجار التجزئة هؤلاء. بناءً على تحقيقه ، كتب مقالًا يستخلص فيه استنتاجات حول التوافر العام لجميع الكتب المدرسية من خلال تجار التجزئة للكتب المدرسية عبر الإنترنت.

اكتب تحليلاً لدراسته يتناول القضايا التالية: هل عينته تمثل السكان في جميع الكتب المدرسية بالكلية؟ اشرح لماذا ولماذا لا. صف بعض المصادر المحتملة للتحيز في هذه الدراسة وكيف يمكن أن تؤثر على نتائج الدراسة. قدم بعض الاقتراحات حول ما يمكن فعله لتحسين الدراسة.

الأجوبة ستختلف. نموذج للإجابة: العينة لا تمثل مجتمع جميع الكتب المدرسية بالكلية. سببان لعدم تمثيله هو أنه أخذ عينات فقط من سبعة موضوعات وأنه قام بالتحقيق في كتاب مدرسي واحد فقط في كل موضوع. هناك عدة مصادر محتملة للتحيز في الدراسة. المواد السبعة التي درسها كلها في الرياضيات والعلوم ، وهناك العديد من المواد في العلوم الإنسانية ، والعلوم الاجتماعية ، ومجالات أخرى ، (على سبيل المثال: الأدب ، والفن ، والتاريخ ، وعلم النفس ، وعلم الاجتماع ، والأعمال التجارية) التي لم يبحث فيها. على الاطلاق. قد تكون المجالات المختلفة للموضوعات تعرض أنماطًا مختلفة لتوافر الكتب المدرسية ، لكن عينته لن تكتشف مثل هذه النتائج.

كما نظر أيضًا إلى الكتاب المدرسي الأكثر شيوعًا في كل من الموضوعات التي درسها. قد يختلف توفر الكتب المدرسية الأكثر شيوعًا عن توفر الكتب المدرسية الأخرى بإحدى طريقتين:

  • قد تكون الكتب المدرسية الأكثر شيوعًا متاحة بسهولة عبر الإنترنت ، نظرًا لطباعة المزيد من النسخ الجديدة ، ويقوم المزيد من الطلاب في جميع أنحاء البلاد ببيع نسخهم المستعملة أو
  • قد يكون من الصعب العثور على الكتب المدرسية الأكثر شيوعًا على الإنترنت ، لأن المزيد من طلب الطلاب يستنفد العرض بشكل أسرع.

في الواقع ، لا يستخدم العديد من طلاب الجامعات الكتاب المدرسي الأكثر شيوعًا في موضوعهم ، ولا تقدم هذه الدراسة معلومات مفيدة حول وضع الكتب المدرسية الأقل شيوعًا.


النطاق

المقياس الأول للتغير الذي نناقشه هو الأبسط.

تعريف

ال النطاق تباين مجموعة البيانات كما تم قياسه بالرقم R = x max - x min. من مجموعة البيانات هو الرقم ص التي تحددها الصيغة

أين x ماكس هو أكبر قياس في مجموعة البيانات و س دقيقة هو الاصغر.

المثال 10

ابحث عن نطاق كل مجموعة بيانات في الجدول 2.1 "مجموعتا بيانات".

بالنسبة لمجموعة البيانات I ، الحد الأقصى هو 43 والحد الأدنى هو 38 ، وبالتالي فإن النطاق هو R = 43-38 = 5.

بالنسبة لمجموعة البيانات II ، الحد الأقصى هو 47 والحد الأدنى هو 33 ، وبالتالي فإن النطاق هو R = 47 - 33 = 14.

النطاق هو مقياس للتغير لأنه يشير إلى حجم الفاصل الزمني الذي يتم توزيع نقاط البيانات عليه. يشير النطاق الأصغر إلى تباين أقل (تشتت أقل) بين البيانات ، بينما يشير النطاق الأكبر إلى عكس ذلك.


لماذا التباين مهم؟

الاختلاف مهم لسببين رئيسيين:

  • الاختبارات الإحصائية البارامترية حساسة للتباين.
  • تساعدك مقارنة تباين العينات في تقييم الاختلافات الجماعية.

تجانس التباين في الاختبارات الإحصائية

التباين مهم يجب مراعاته قبل إجراء الاختبارات البارامترية. تتطلب هذه الاختبارات تباينات متساوية أو متشابهة ، وتسمى أيضًا تجانس التباين أو التماثل ، عند مقارنة عينات مختلفة.

تؤدي الفروق غير المتكافئة بين العينات إلى نتائج اختبار منحازة ومنحرفة. إذا كان لديك تباينات غير متساوية عبر العينات ، فإن الاختبارات غير المعلمية تكون أكثر ملاءمة.

استخدام التباين لتقييم اختلافات المجموعة

تستخدم الاختبارات الإحصائية مثل اختبارات التباين أو تحليل التباين (ANOVA) تباين العينة لتقييم فروق المجموعة. يستخدمون تباينات العينات لتقييم ما إذا كانت المجموعات السكانية التي ينتمون إليها تختلف عن بعضها البعض.

مثال بحثي بصفتك باحثًا تعليميًا ، فأنت تريد اختبار الفرضية القائلة بأن الترددات المختلفة للاختبارات القصيرة تؤدي إلى درجات نهائية مختلفة لطلاب الجامعات. تقوم بجمع الدرجات النهائية من ثلاث مجموعات كل منها 20 طالبًا خضعوا لاختبارات بشكل متكرر ، أو نادرًا ، أو نادرًا على مدار فصل دراسي.

  • العينة أ: مرة واحدة في الأسبوع
  • العينة ب: مرة كل 3 أسابيع
  • العينة ج: مرة كل 6 أسابيع

لتقييم اختلافات المجموعة ، تقوم بإجراء ANOVA.

الفكرة الرئيسية وراء ANOVA هي مقارنة الفروق بين المجموعات والتباينات داخل المجموعات لمعرفة ما إذا كانت النتائج يمكن تفسيرها بشكل أفضل من خلال الاختلافات الجماعية أو الفروق الفردية.

إذا كان هناك تباين أعلى بين المجموعات بالنسبة إلى التباين داخل المجموعة ، فمن المحتمل أن تكون المجموعات مختلفة نتيجة للعلاج. إذا لم يكن الأمر كذلك ، فقد تأتي النتائج من الفروق الفردية لأعضاء العينة بدلاً من ذلك.

مثال بحثي يقيم ANOVA الخاص بك ما إذا كانت الاختلافات في متوسط ​​الدرجات النهائية بين المجموعات تأتي من الاختلافات في تكرار الاختبارات أو الفروق الفردية للطلاب في كل مجموعة.

للقيام بذلك ، تحصل على نسبة التباين بين المجموعة للدرجات النهائية والتباين داخل المجموعة للنتائج النهائية & # 8211 هذا هو إحصاء F. باستخدام إحصائية F كبيرة ، يمكنك العثور على المقابل ص-قيمة واستنتاج أن المجموعات تختلف اختلافًا كبيرًا عن بعضها البعض.


أخذ العينات الهادفة في بحوث التنفيذ

خصائص بحوث التنفيذ

في البحث التطبيقي ، غالبًا ما تلعب الأساليب الكمية والنوعية أدوارًا مهمة ، إما بشكل متزامن أو متتابع ، لغرض الإجابة على نفس السؤال من خلال تقارب النتائج من مصادر مختلفة ، والإجابة على الأسئلة ذات الصلة بطريقة تكميلية ، باستخدام مجموعة واحدة من الأساليب للتوسع أو شرح النتائج التي تم الحصول عليها من استخدام مجموعة أخرى من الأساليب ، باستخدام مجموعة واحدة من الأساليب لتطوير الاستبيانات أو النماذج المفاهيمية التي تفيد في استخدام المجموعة الأخرى ، واستخدام مجموعة واحدة من الأساليب لتحديد العينة للتحليل باستخدام مجموعة أخرى من (بالينكاس وآخرون ، 2011). كشفت مراجعة لتصميمات الطرق المختلطة في أبحاث التنفيذ التي أجرتها Palinkas وزملاؤها (2011) عن سبع ترتيبات هيكلية متسلسلة ومتزامنة مختلفة ، وخمس وظائف مختلفة للطرق المختلطة ، وثلاث طرق مختلفة لربط البيانات الكمية والنوعية معًا. ومع ذلك ، لم تأخذ هذه المراجعة بعين الاعتبار استراتيجيات أخذ العينات المتضمنة في أنواع الأساليب الكمية والنوعية الشائعة في تنفيذ البحث ، ولم تأخذ في الاعتبار نتائج استراتيجية أخذ العينات المختارة لطريقة واحدة أو لمجموعة من الطرق على اختيار استراتيجية أخذ العينات من أجل طريقة أخرى أو مجموعة من الأساليب. على سبيل المثال ، يكمن أحد أهم التحديات التي تواجه أخذ العينات في تصميمات الطريقة المختلطة المتسلسلة في القيود التي قد تضعها الطريقة الأولية على أخذ العينات للطريقة اللاحقة. كما لاحظ مورس ونيهاوس (2009) ، عندما تكون الطريقة الأولية نوعية ، قد تكون العينة المختارة صغيرة جدًا وتفتقر إلى العشوائية اللازمة لتحقيق الافتراضات الخاصة بالتحليل الكمي اللاحق. من ناحية أخرى ، عندما تكون الطريقة الأولية كمية ، فقد تكون العينة المختارة كبيرة جدًا بحيث لا يمكن إدراجها في البحث النوعي لكل فرد وتفتقر إلى الاختيار الهادف لتقليل حجم العينة إلى حجم أكثر ملاءمة للبحث النوعي. حقيقة أن المشاركين المحتملين قد تم تجنيدهم واختيارهم بشكل عشوائي لا يجعلهم بالضرورة غنية بالمعلومات.

كشفت إعادة فحص 22 دراسة و 6 دراسات إضافية نُشرت منذ عام 2009 أن 5 دراسات فقط (Aarons & # x00026 Palinkas، 2007 Bachman et al.، 2009 Palinkas et al.، 2011 Palinkas et al.، 2012 Slade et al. . ، 2003) إشارة محددة إلى أخذ العينات الهادف. لم تشر ثلاث دراسات إضافية (Henke et al. ، 2008 Proctor et al. ، 2007 Swain et al. ، 2010) بشكل واضح إلى أخذ العينات الهادفة ولكنها قدمت أساسًا منطقيًا لاختيار العينة. لم تقدم الدراسات العشرين المتبقية أي وصف لاستراتيجية أخذ العينات المستخدمة لتحديد المشاركين في جمع البيانات النوعية وتحليلها ، ومع ذلك ، يمكن استنتاج الأساس المنطقي بناءً على وصف الذين تم تعيينهم واختيارهم للمشاركة. من بين 28 دراسة ، استخدمت 3 أكثر من استراتيجية واحدة لأخذ العينات. استخدمت إحدى وعشرون دراسة من أصل 28 دراسة (75٪) شكلاً من أشكال أخذ العينات المعيارية. في معظم الحالات ، يرتبط المعيار المستخدم بالدور الفردي & # x02019 ، إما في مشروع البحث (على سبيل المثال ، المدرب ، قائد الفريق) ، أو الوكالة (مدير البرنامج ، المشرف السريري ، الطبيب) بمعنى آخر ، معيار التضمين في فئة معينة (المعيار الأول) ، على عكس الحالات الخارجية لمعيار محدد (المعيار- هـ). على سبيل المثال ، في سلسلة من الدراسات التي تستند إلى المشروع الوطني للتنفيذ القائم على الأدلة ، تضمن المشاركون مقابلات شبه منظمة مع المدربين الاستشاريين وقادة البرامج في كل موقع دراسة (برونيت وآخرون ، 2008 مارشال وآخرون ، 2008 مارتي وآخرون. al.، 2007 Rapp et al.، 2010 Woltmann et al.، 2008). استخدمت ست دراسات شكلاً من أشكال أخذ عينات التباين الأقصى لضمان تمثيل وتنوع المنظمات والممارسين الفرديين. استخدمت دراستان أخذ عينات مكثفة لإجراء تناقضات. على سبيل المثال ، اختار آرونز وبالينكاس (2007) عن قصد 15 مديرًا لحالة رعاية الطفل يمثلون أولئك الذين لديهم أكثر إيجابية والذين لديهم آراء أكثر سلبية عن SafeCare ، وهو تدخل وقائي قائم على الأدلة ، استنادًا إلى نتائج مسح كمي عبر الإنترنت يسأل عن القيمة المتصورة وفائدة SafeCare. قام Kramer and Burns (2008) بتجنيد وإجراء مقابلات مع الأطباء الذين يقدمون الرعاية المعتادة والأطباء الذين تركوا الدراسة قبل الموافقة على التناقض مع الأطباء الذين قدموا التدخل قيد التحقيق. استخدمت إحدى الدراسات (Hoagwood وآخرون ، 2007) نهج حالة نموذجي لتحديد المشاركين من أجل التقييم النوعي للتحديات التي تواجههم في تنفيذ تدخل يركز على الصدمات للشباب. استخدمت إحدى الدراسات (Green & # x00026 Aarons ، 2011) استراتيجية مجمعة لأخذ عينات كرة الثلج / المعيار الأول من خلال مطالبة مديري البرامج المعينين بتحديد الأطباء وموظفي الدعم الإداري والمستهلكين لتوظيف المشروع. تم تعيين المديرين العقليين في المقاطعة ومديري الوكالات ومديري البرامج لتمثيل مصالح سياسة التنفيذ بينما تم تعيين الأطباء وموظفي الدعم الإداري والمستهلكين لتمثيل وجهات نظر الممارسة المباشرة لتطبيق EBP.

يوفر الجدول 2 أدناه وصفًا لاستخدام استراتيجيات أخذ العينات الهادفة المختلفة في دراسات تنفيذ الطرق المختلطة. تم استخدام أخذ العينات من المعيار -1 بشكل متكرر في دراسات تنفيذ الطرق المختلطة التي استخدمت تصميمًا متزامنًا حيث كانت الطريقة النوعية ثانوية للطريقة الكمية أو الدراسات التي استخدمت بنية متزامنة حيث تم إعطاء الطرق النوعية والكمية أولوية متساوية. تم استخدام تصميمات الطرق المختلطة هذه لاستكمال عمق الفهم الذي توفره الطرق النوعية مع اتساع الفهم الذي توفره الطرق الكمية (ن = 13) ، لشرح أو تفصيل نتائج مجموعة واحدة من الأساليب (عادة الكمية) مع النتائج من مجموعة الطرق الأخرى (ن = 10) ، أو البحث عن التقارب من خلال تثليث النتائج أو تحديد البيانات النوعية (ن = 8) تضمنت عملية طرق الخلط في الغالبية العظمى (ن = 18) من هذه الدراسات تضمين الدراسة النوعية في الدراسة الكمية الأكبر.في دراسة واحدة (Goia & # x00026 Dziadosz ، 2008) ، تم استخدام أخذ العينات المعيارية في تصميم متزامن حيث تم دمج البيانات الكمية والنوعية معًا بطريقة تكميلية ، وفي دراستين (Aarons et al. ، 2012 Zazelli et al. ، 2008) ، تم ربط البيانات الكمية والنوعية معًا ، واحدة في تصميم متسلسل لغرض تطوير نموذج مفاهيمي (Zazelli et al. ، 2008) ، وواحد في تصميم متزامن لغرض تكامل بعضها البعض (Aarons et al. ، 2012). استخدمت ثلاث من الدراسات الست التي استخدمت عينات التباين الأقصى هيكلًا متزامنًا مع الأساليب الكمية التي تأخذ الأولوية على الأساليب النوعية وعملية لتضمين الأساليب النوعية في دراسة كمية أكبر (Henke et al.، 2008 Palinkas et al.، 2010 Slade et آل ، 2008). استخدمت اثنتان من الدراسات الست أقصى تباين لأخذ العينات في تصميم متسلسل (Aarons et al. ، 2009 Zazelli et al. ، 2008) وواحدة في تصميم متزامن (Henke et al. ، 2010) لغرض التطوير ، وثلاث مستخدمة في تصميم متزامن للتكامل (Bachman et al.، 2009 Henke et al.، 2008 Palinkas، Ell، Hansen، Cabassa، & # x00026 Wells، 2011). استخدمت الدراستان اللتان تعتمدان على كثافة العينات بنية متزامنة لغرض التقارب أو التوسع ، واشتملت الدراستان على دراسة نوعية مضمنة في دراسة كمية أكبر (Aarons & # x00026 Palinkas، 2007 Kramer & # x00026 Burns، 2008). تضمنت دراسة الحالة النموذجية الفردية تصميمًا متزامنًا حيث تم تضمين الدراسة النوعية في دراسة كمية أكبر بغرض التكامل (Hoagwood et al. ، 2007). تضمنت دراسة كرة الثلج / الحد الأقصى للتباين تصميمًا متسلسلًا حيث تم دمج الدراسة النوعية في البيانات الكمية لغرض التقارب وتطوير النموذج المفاهيمي (Green & # x00026 Aarons ، 2011). على الرغم من عدم استخدامها في أي من دراسات التنفيذ البالغ عددها 28 دراسة التي تم فحصها هنا ، إلا أن استراتيجية أخذ العينات التسلسلية الشائعة الأخرى تستخدم معايير أخذ عينات من العينة الكمية الأكبر لإنتاج عينة نوعية من المرحلة الثانية بطريقة مشابهة لأخذ عينات التباين الأقصى ، باستثناء أن السابق يضيق نطاق التباين بينما يوسع الأخير النطاق.

الجدول 2

إستراتيجيات أخذ العينات الهادفة وتصميمات الطرق المختلطة في البحث التطبيقي

استراتيجية أخذ العيناتهيكلتصميمدور
أخذ العينات على مرحلة واحدة (ن = 22)
معيار
(ن = 18)
في وقت واحد (ن = 17)
متسلسل (ن = 6)
مدمجة (ن = 9)
متصل (ن = 9)
مضمن (ن = 14)
التقارب (ن = 6)
التكامل (ن = 12)
التوسع (ن = 10)
التنمية (ن = 3)
أخذ العينات (ن = 4)
أقصى اختلاف
(ن = 4)
متزامن (ن = 3)
متسلسل (ن = 1)
مدمجة (ن = 1)
متصل (ن = 1)
مضمن (ن = 2)
التقارب (ن = 1)
التكامل (ن = 2)
التوسع (ن = 1)
التنمية (ن = 2)
شدة
(ن = 1)
متزامنة
تسلسلي
مندمجة
متصل
مغروس
التقارب
التكامل
توسع
تطوير
دراسة حالة نموذجية
(ن = 1)
متزامنةمغروسالتكامل
أخذ العينات متعدد المراحل (ن = 4)
المعيار / الحد الأقصى
الاختلاف
(ن = 2)
متزامنة
تسلسلي
مغروس
متصل
التكامل
تطوير
المعيار / الشدة
(ن = 1)
متزامنةمغروسالتقارب
التكامل
توسع
المعيار / كرة الثلج
(ن = 1)
تسلسليمتصلالتقارب
تطوير

يشترك أخذ العينات من المعيار i كإستراتيجية أخذ عينات هادفة في العديد من الخصائص مع أخذ عينات الاحتمالية العشوائية ، على الرغم من وجود أهداف مختلفة وإجراءات مختلفة لتحديد واختيار المشاركين المحتملين. في كلتا الحالتين ، يتم اختيار المشاركين في الدراسة من الوكالات أو المنظمات أو الأنظمة المشاركة في عملية التنفيذ. يتم اختيار الأفراد على أساس افتراض أنهم يمتلكون المعرفة والخبرة مع ظاهرة الاهتمام (أي تنفيذ EBP) وبالتالي سيكونون قادرين على تقديم معلومات مفصلة (عمق) وقابلة للتعميم (اتساع). المشاركون في الدراسة النوعية ، عادة ما يكون مقدمو الخدمات ، أو المستهلكون ، أو مديرو الوكالات ، أو صانعو السياسات الحكومية ، يتم اختيارهم من عينة أكبر من المشاركين في الدراسة الكمية. يتم اختيارهم من العينة الأكبر لأنهم يستوفون نفس المعايير ، في هذه الحالة ، يلعبون دورًا محددًا في المنظمة و / أو عملية التنفيذ. إلى حد ما ، يُفترض أن يكونوا & # x0201crepresentative & # x0201d لهذا الدور ، على الرغم من أن دراسات التنفيذ نادرًا ما تشرح الأساس المنطقي لاختيار بعض وليس كل ممثلي الأدوار المتاحة (على سبيل المثال ، توظيف 15 مقدم خدمة من وكالة لشبه منظم المقابلات من عينة متاحة من 25 من مقدمي الخدمة). من منظور المنهجية النوعية ، فإن المشاركين الذين يستوفون أو يتجاوزون معيارًا أو معايير محددة يمتلكون معرفة حميمة (أو على الأقل ، أكبر) بظاهرة الاهتمام بحكم خبرتهم ، مما يجعلهم حالات غنية بالمعلومات.

ومع ذلك ، قد لا يكون أخذ العينات المعياري هو الإستراتيجية الأنسب لبحوث التنفيذ لأنه بمحاولة التقاط كل من اتساع وعمق الفهم ، قد يكون في الواقع غير مناسب لمهمة إنجاز أي منهما. على الرغم من أن الأساليب النوعية غالبًا ما تتناقض مع الأساليب الكمية على أساس العمق مقابل الاتساع ، إلا أنها تتطلب في الواقع عناصر من كليهما من أجل توفير فهم شامل لظاهرة الاهتمام. من الناحية المثالية ، فإن الهدف من تحقيق التشبع النظري من خلال توفير أكبر قدر ممكن من التفاصيل يتضمن اختيار الأفراد أو الحالات التي يمكن أن تضمن تضمين جميع جوانب هذه الظاهرة في الفحص وأن أي جانب واحد يتم فحصه بدقة. لذلك ، يتطلب هذا الهدف نهجًا يوسع ويضيق مجال الرؤية بالتتابع أو في نفس الوقت. من خلال اختيار الأفراد الذين يستوفون معيارًا محددًا محددًا على أساس دورهم في عملية التنفيذ أو الذين لديهم خبرة محددة (على سبيل المثال ، منخرطون فقط في تنفيذ مُعرَّف بأنه ناجح أو فقط في تطبيق تم تعريفه على أنه غير ناجح) ، قد يفشل المرء في التقاط تجارب أو أنشطة المجموعات الأخرى التي تلعب أدوارًا أخرى في العملية. على سبيل المثال ، قد يفشل التركيز على الممارسين فقط في الحصول على رؤى وخبرات وأنشطة المستهلكين أو أفراد الأسرة أو مديري الوكالات أو الموظفين الإداريين أو قادة سياسة الدولة في عملية التنفيذ ، مما يحد من اتساع فهم هذه العملية. من ناحية أخرى ، قد يفشل اختيار المشاركين على أساس ما إذا كانوا ممارسين أو مستهلكين أو مديرين أو موظفين أو أيًا مما سبق ، في تحديد أولئك الذين لديهم أكبر خبرة أو الأكثر معرفة أو الأكثر قدرة على توصيل ما يعرفونه و / أو قد اختبروا ، مما يحد من عمق فهم عملية التنفيذ.

لمعالجة القيود المحتملة لأخذ العينات المعيارية ، ينبغي النظر في استراتيجيات أخذ العينات الهادفة الأخرى وربما اعتمادها في بحث التنفيذ (الشكل 1). على سبيل المثال ، الاستراتيجيات التي تركز بشكل أكبر على الاتساع والتباين مثل الحد الأقصى للتباين ، والحالة القصوى ، والتأكيد وعدم التأكيد على أخذ عينات الحالة هي أكثر ملاءمة لفحص الاختلافات ، بينما تركز الاستراتيجيات بشكل أكبر على العمق والتشابه مثل التجانس ، وكرة الثلج ، والنموذجي. يعتبر أخذ عينات الحالة أكثر ملاءمة لفحص القواسم المشتركة أو أوجه التشابه ، على الرغم من أن كلا النوعين من استراتيجيات أخذ العينات يشتملان على التركيز على كل من الاختلافات وأوجه التشابه. قد تكون بدائل أخذ العينات المعيارية أكثر ملاءمة للوظائف المحددة للطرق المختلطة. على سبيل المثال ، قد يتطلب استخدام الأساليب النوعية لغرض التكامل أن تؤكد إستراتيجية أخذ العينات على التشابه إذا كانت تهدف إلى تحقيق عمق في الفهم أو استكشاف وتطوير الفرضيات التي تكمل استراتيجية أخذ العينات الاحتمالية الكمية التي تحقق اتساعًا في الفهم واختبار الفرضيات (Kemper et al. . ، 2003). وبالمثل ، فإن الطرق المختلطة التي تتناول الأسئلة ذات الصلة بغرض توسيع أو شرح النتائج أو تطوير مقاييس جديدة أو نماذج مفاهيمية قد تتطلب استراتيجية أخذ عينات هادفة تهدف إلى التشابه الذي يكمل أخذ العينات الاحتمالية التي تهدف إلى التباين أو التشتت. قد تساعد استراتيجية أخذ العينات الهادفة ذات التركيز الضيق للتحليل النوعي التي & # x0201ccomplements & # x0201d عينة احتمالية مركزة أوسع للتحليل الكمي على تحقيق توازن بين زيادة جودة الاستدلال / الموثوقية (الصلاحية الداخلية) والتعميم / قابلية النقل (الصلاحية الخارجية). إن الطريقة الوحيدة التي تركز فقط على وجهة نظر واسعة قد تقلل من الصلاحية الداخلية على حساب الصلاحية الخارجية (Kemper et al. ، 2003). من ناحية أخرى ، قد يشير هدف التقارب (الإجابة على نفس السؤال بأي من الطريقتين) إلى استخدام استراتيجية أخذ عينات هادفة تهدف إلى اتساع يوازي استراتيجية أخذ العينات الاحتمالية الكمية.

استراتيجيات أخذ العينات الهادفة والعشوائية لدراسات تنفيذ الطرق المختلطة

يمكن عكس الأولوية والتسلسل النوعي (QUAL) والكمي (QUAN).

يشير إلى تركيز استراتيجية أخذ العينات.

يشير إلى هيكل متسلسل يشير إلى هيكل متزامن.

علاوة على ذلك ، تشير الطبيعة المحددة لبحوث التنفيذ إلى استخدام استراتيجية أخذ عينات هادفة متعددة المراحل. ثلاث استراتيجيات مختلفة لأخذ العينات متعددة المراحل موضحة في الشكل 1 أدناه. يوصي العديد من علماء المنهجيات النوعية بأخذ عينات من أجل التباين (الاتساع) قبل أخذ العينات من أجل القواسم المشتركة (العمق) (جلاسر ، 1978 برنارد ، 2002) (متعدد المراحل 1). تُعرف أيضًا باسم & # x0201cfunnel نهج & # x0201d ، غالبًا ما يوصى بهذه الاستراتيجية عند إجراء مقابلات شبه منظمة (Spradley ، 1979) أو مجموعات التركيز (Morgan ، 1997). يبدأ هذا النهج بنظرة واسعة للموضوع ثم ينتقل إلى تضييق نطاق المحادثة إلى مكونات محددة جدًا للموضوع. ومع ذلك ، كما ذكرنا سابقًا ، قد يتطلب الافتقار إلى فهم واضح لطبيعة النطاق نهجًا تكراريًا حيث تساعد كل مرحلة من مراحل تحليل البيانات في تحديد الوسائل اللاحقة لجمع البيانات وتحليلها (Denzen ، 1978 باتون ، 2001) (Multistage II ). وبالمثل ، فإن تصميمات أخذ العينات الهادفة متعددة المراحل مثل أخذ العينات الانتهازية أو الطارئة ، تسمح بخيار الإضافة إلى عينة للاستفادة من الفرص غير المتوقعة بعد بدء جمع البيانات (باتون ، 2001 ، ص 240) (متعدد المراحل 3). تشتمل نماذج المراحل الأولى بشكل عام على مرحلتين ، بينما يتطلب نموذج متعدد المراحل II 3 مراحل على الأقل ، بالتناوب من أخذ العينات للتباين إلى أخذ العينات من أجل التشابه. يبدأ نموذج متعدد المراحل III بأخذ عينات من أجل التباين وينتهي بأخذ عينات للتشابه ، ولكنه قد يتضمن مرحلة أو أكثر من المراحل المتداخلة لأخذ العينات من أجل التباين أو التشابه حسب الحاجة أو الفرصة.

يتوافق أخذ العينات الهادف متعدد المراحل أيضًا مع استخدام التصميمات الهجينة لفحص فعالية التدخل والتنفيذ في نفس الوقت. امتدادًا لمفهوم & # x0201cpractical التجارب السريرية & # x0201d (تونس ، Stryer & # x00026 Clancey ، 2003) ، توفر التصاميم الهجينة ذات التنفيذ الفعال فوائد مثل المكاسب الترجمية السريعة في استيعاب التدخل السريري ، واستراتيجيات التنفيذ الأكثر فعالية ، والمزيد معلومات مفيدة للباحثين وصناع القرار (كوران وآخرون ، 2012). قد تعطي هذه التصميمات أولوية متساوية لاختبار العلاجات السريرية واستراتيجيات التنفيذ (النوع الهجين 2) أو تعطي الأولوية لاختبار فعالية العلاج (النوع الهجين 1) أو استراتيجية التنفيذ (النوع الهجين 3). يقترح كوران وزملاؤه (2012) أن تقييم التدخل وفعالية # x02019 سيتطلب أو يتضمن استخدام مقاييس كمية بينما يتطلب تقييم عملية التنفيذ استخدام طرق مختلطة أو يتضمنها. عند إجراء تصميم هجين من النوع 1 (إجراء تقييم عملية للتنفيذ في سياق تجربة الفعالية السريرية) ، يمكن استخدام البيانات النوعية لإبلاغ نتائج تجربة الفعالية. وبالتالي ، فإن تجربة الفعالية التي تجد تباينًا جوهريًا قد تختار عن قصد المشاركين باستخدام استراتيجية أوسع مثل أخذ العينات للحالات غير المؤكدة لمراعاة التباين. على سبيل المثال ، تتطلب التجارب العشوائية الجماعية معرفة السياقات والظروف المتشابهة والمختلفة عبر المواقع لحساب الاختلافات الحتمية في الموقع في التدخلات والمساعدة في التنفيذ المحلي للتدخل (Bloom & # x00026 Michalopoulos، 2013 Raudenbush & # x00026 Liu، 2000). بدلاً من ذلك ، يمكن استخدام استراتيجية ضيقة لمراعاة عدم وجود تباين. في كلتا الحالتين ، يتم تحديد اختيار استراتيجية أخذ العينات الهادفة من خلال نتائج التحليل الكمي الذي يعتمد على استراتيجية أخذ العينات الاحتمالية. في التصميمات الهجينة من النوع 2 والنوع 3 حيث تُمنح عملية التنفيذ أولوية مساوية أو أكبر من تجربة الفعالية ، يجب أن تكون استراتيجية أخذ العينات الهادفة أولاً وقبل كل شيء متسقة مع أهداف دراسة التنفيذ ، والتي قد تكون لفهم التباين والميول المركزية ، او كلاهما. في جميع الحالات الثلاث ، قد تختلف استراتيجية أخذ العينات المستخدمة في دراسة التنفيذ بناءً على الأولوية المعينة لتلك الدراسة فيما يتعلق بتجربة الفعالية. على سبيل المثال ، قد يعطي أخذ العينات الهادف لتصميم هجين من النوع 1 أولوية أعلى للتباين والمقارنة لفهم معلمات عمليات التنفيذ أو السياق كمساهمة في فهم نتائج الفعالية (أي استخدام البيانات النوعية للتوسع في النتائج أو شرحها من تجربة الفعالية) ، في الواقع ، يمكن اعتبار تدابير العملية هذه بمثابة معدلات للابتكار / نتائج EBP. في المقابل ، قد يعطي أخذ العينات الهادف لتصميم Hybrid Type 3 أولوية أعلى للتشابه والعمق لفهم السمات الأساسية للنتائج الناجحة فقط.

أخيرًا ، قد تكون استراتيجيات أخذ العينات متعددة المراحل أكثر اتساقًا مع الابتكارات في التصميمات التجريبية التي تمثل بدائل للتجربة المعشاة ذات الشواهد الكلاسيكية في البيئات المجتمعية التي تتمتع بقدر أكبر من الجدوى والقبول والصلاحية الخارجية. في حين أن تصميمات RCT توفر أعلى مستوى من الأدلة ، & # x0201c في العديد من الإعدادات السريرية والمجتمعية ، وخاصة في الدراسات التي أجريت مع السكان المحرومين من الخدمات وإعدادات الموارد المنخفضة ، فقد لا يكون التوزيع العشوائي ممكنًا أو مقبولًا & # x0201d (Glasgow، et al.، 2005، p 554). تعد التجارب العشوائية أيضًا & # x0201 ضعيفة نسبيًا في تقييم الفائدة من الصحة العامة المعقدة أو التدخلات الطبية التي تأخذ في الاعتبار التفضيلات الفردية المؤيدة أو المعارضة لتدخلات معينة ، أو التقيد التفاضلي أو التناقص ، أو الجرعة المتغيرة أو تكييف التدخل وفقًا للاحتياجات الفردية & # x0201d (براون وآخرون ، 2009 ، ص 2). تم اقتراح عدة بدائل للتصميم العشوائي ، مثل & # x0201cinterrupt سلسلة زمنية ، & # x0201d & # x0201cm خط أساس متعدد عبر الإعدادات & # x0201d أو & # x0201cregression-discontinuity & # x0201d Designs. تمثل التصميمات المثلى أحد هذه البدائل للتجربة العشوائية العشوائية الكلاسيكية ويتم تناولها بالتفصيل من قبل دوان وزملائه (هذه المشكلة). مثل أخذ العينات الهادف ، تهدف التصميمات المثلى إلى التقاط الحالات الغنية بالمعلومات ، والتي يتم تحديدها عادةً كأفراد من المرجح أن يستفيدوا من التدخل التجريبي. الهدف هنا ليس تحديد المريض العادي أو المتوسط ​​، ولكن المرضى الذين يمثلون نهاية واحدة من الاختلاف في حالة قصوى ، أو أخذ عينات شدة ، أو استراتيجية أخذ عينات معيارية. ومن ثم ، فإن استراتيجية أخذ العينات التي تبدأ بأخذ عينات من أجل التباين في المرحلة الأولى ثم أخذ العينات من أجل التجانس ضمن معلمة محددة لهذا التباين (أي طرف أو آخر من التوزيع) في المرحلة الثانية قد تبدو أفضل نهج لتحديد عينة & # x0201coptimal & # x0201d للتجربة السريرية.

بديل آخر للتجربة العشوائية المضبوطة الكلاسيكية هو التصميمات التكيفية التي اقترحها براون وزملاؤه (براون وآخرون ، 2006 براون وآخرون ، 2008 براون وآخرون ، 2009). التصاميم التكيفية هي سلسلة من التجارب التي تعتمد على نتائج الدراسات الحالية لتحديد المرحلة التالية من أبحاث التقييم. يستخدمون المعرفة التراكمية لنجاحات العلاج الحالية أو الفشل في تغيير صفات التجربة الجارية. يعدل التدخل التكيفي ما يتلقاه الفرد (أو المجتمع من أجل تجربة قائمة على المجموعة) استجابة لتفضيلاته أو ردوده الأولية على التدخل. بالتوافق مع أخذ العينات متعدد المراحل في البحث النوعي ، فإن التصميم متكرر نوعًا ما في طبيعته ، بمعنى أن المعلومات المكتسبة من تحليل البيانات التي تم جمعها في المرحلة الأولى تؤثر على طبيعة البيانات التي تم جمعها ، وطريقة جمعها ، في المراحل اللاحقة (Denzen ، 1978). علاوة على ذلك ، قد تستفيد العديد من هذه التصميمات التكيفية من استراتيجية أخذ عينات هادفة متعددة المراحل في المراحل المبكرة من التجربة السريرية لتحديد نطاق التباين والخصائص الأساسية للمشاركين في الدراسة. يمكن بعد ذلك استخدام هذه المعلومات لأغراض تحديد الجرعة المثلى من العلاج ، والحد من حجم العينة ، والتوزيع العشوائي للمشاركين في إجراءات تسجيل مختلفة ، وتحديد من يجب أن يكون مؤهلاً لتعيين عشوائي (كما هو الحال في التصميم الأمثل) لزيادة الالتزام بالعلاج وتقليل التسرب ، أو تحديد الحوافز والدوافع التي يمكن استخدامها لتشجيع المشاركة في التجربة نفسها.

قد تكون بدائل تصميم RCT الكلاسيكي مرغوبة أيضًا في الدراسات التي تتبنى إطارًا بحثيًا تشاركيًا مجتمعيًا (Minkler & # x00026 Wallerstein ، 2003) ، والتي تعتبر أداة مهمة في إجراء بحث التنفيذ (Palinkas & # x00026 Soydan ، 2012) . تشير مثل هذه الأطر إلى أن تحديد وتوظيف المشاركين المحتملين في الدراسة سيضع تركيزًا أكبر على الأولويات والمعرفة المحلية & # x0201d للشركاء المجتمعيين أكثر من التركيز على الحاجة إلى أخذ عينات من أجل التباين أو التوحيد. في هذه الحالة ، قد تقترب المرحلة الأولى من أخذ العينات من إستراتيجية أخذ العينات للحالات المهمة سياسيًا (باتون ، 2002) في المرحلة الأولى ، متبوعة باستراتيجيات أخذ العينات الأخرى التي تهدف إلى تعظيم الاختلافات في آراء أو خبرة أصحاب المصلحة.


تعريف "أخذ العينات العشوائية"

تعريف: أخذ العينات العشوائية هو جزء من تقنية أخذ العينات حيث يكون لكل عينة احتمالية متساوية للاختيار. يُقصد بالعينة المختارة عشوائيًا أن تكون تمثيلًا غير متحيز لإجمالي السكان. إذا كانت العينة لا تمثل المجتمع ، لبعض الأسباب ، فإن التباين يسمى خطأ أخذ العينات.

وصف: أخذ العينات العشوائية هو أحد أبسط أشكال جمع البيانات من إجمالي السكان. في إطار أخذ العينات العشوائي ، يحمل كل عضو في المجموعة الفرعية فرصة متساوية للاختيار كجزء من عملية أخذ العينات. على سبيل المثال ، إجمالي القوى العاملة في المؤسسات هو 300 ولإجراء مسح ، يتم اختيار عينة من 30 موظفًا لإجراء المسح.في هذه الحالة ، يكون السكان هو إجمالي عدد الموظفين في الشركة ومجموعة العينة المكونة من 30 موظفًا هي العينة. يتمتع كل فرد من القوى العاملة بفرصة متساوية في الاختيار لأن جميع الموظفين الذين تم اختيارهم ليكونوا جزءًا من الاستبيان تم اختيارهم عشوائيًا. ولكن ، هناك دائمًا احتمال ألا تمثل المجموعة أو العينة السكان ككل ، وفي هذه الحالة ، يُطلق على أي تغيير عشوائي اسم خطأ في أخذ العينات.

العينة العشوائية غير المتحيزة مهمة لاستخلاص النتائج. على سبيل المثال ، عندما أخذنا عينة من 30 موظفًا من إجمالي عدد السكان البالغ 300 موظف ، هناك دائمًا احتمال أن ينتهي الأمر بالباحث باختيار أكثر من 25 رجلاً حتى لو كان السكان يتألفون من 200 رجل و 100 امرأة. ومن ثم ، يمكن أن تظهر بعض الاختلافات عند رسم النتائج ، وهو ما يُعرف باسم خطأ أخذ العينات. أحد مساوئ أخذ العينات العشوائية هو حقيقة أنه يتطلب قائمة كاملة من السكان. على سبيل المثال ، إذا أرادت إحدى الشركات إجراء مسح وتعتزم نشر عينات عشوائية ، في هذه الحالة ، يجب أن يكون هناك إجمالي عدد الموظفين وهناك احتمال أن يكون جميع الموظفين منتشرين عبر مناطق مختلفة مما يجعل عملية المسح صعب قليلا.

التعريفات ذات الصلة

تم تطوير نموذج تحليل القوى الخمس بواسطة مايكل بورتر لتحليل البيئة التنافسية

المصادقات هي شكل من أشكال الإعلان يستخدم شخصيات مشهورة أو مشاهير يأمرون بـ h

يُعرف السعر المرجعي أيضًا باسم التسعير التنافسي ، لأنه هنا يُباع المنتج بسعر أقل بقليل

قادة الخسارة عبارة عن علامات تجارية أو منتجات ذات حجم كبير وذات شهرة عالية يتم بيعها بواسطة تجار التجزئة باستخدام in

تدور Ambient Advertising حول وضع الإعلانات على أشياء غير معتادة أو في أماكن غير معتادة حيث لا تريد & rsquot

الاستهلاك الظاهر هو ممارسة شراء السلع أو الخدمات لعرض الثروة علنًا

يتم استخدام تركيز السوق عندما تمثل الشركات الصغيرة نسبة كبيرة من إجمالي السوق. هو - هي

Cash Cow هي إحدى الفئات الأربع التي تمثل مصفوفة النمو لمجموعة Boston Consulting Group

وحدة الأعمال الإستراتيجية ، المعروفة باسم SBU ، هي وحدة كاملة الوظائف من الأعمال التجارية التي لديها

إعادة تسمية العلامة التجارية هي عملية تغيير صورة الشركة للمؤسسة. إنها استراتيجية سوق


الأسئلة المتداولة حول أخذ العينات

أ عينة هي مجموعة فرعية من الأفراد من عدد أكبر من السكان. أخذ العينات يعني اختيار المجموعة التي ستقوم بالفعل بجمع البيانات منها في بحثك. على سبيل المثال ، إذا كنت تبحث عن آراء الطلاب في جامعتك ، فيمكنك مسح عينة من 100 طالب.

في الإحصائيات ، يسمح لك أخذ العينات باختبار فرضية حول خصائص السكان.

عينات تستخدم لتقديم استنتاجات حول السكان. من الأسهل جمع البيانات من العينات لأنها عملية وفعالة من حيث التكلفة وملائمة ويمكن التحكم فيها.

يعني أخذ العينات الاحتمالية أن كل فرد من السكان المستهدفين لديه فرصة معروفة ليتم تضمينه في العينة.

في أخذ العينات غير الاحتمالية ، يتم اختيار العينة بناءً على معايير غير عشوائية ، وليس لدى كل فرد من السكان فرصة للتضمين.

تشمل طرق أخذ العينات غير الاحتمالية الشائعة أخذ العينات الملائمة ، وأخذ عينات الاستجابة الطوعية ، وأخذ العينات الهادف ، وأخذ عينات كرة الثلج ، وأخذ عينات الحصص.

يحدث التحيز في أخذ العينات عندما يكون من المرجح بشكل منهجي أن يتم اختيار بعض أفراد المجتمع في عينة أكثر من غيرهم.


شاهد الفيديو: أنواع العينات. مبادئ الاحصاء (شهر اكتوبر 2021).