مقالات

1.6.4.3: الألوان والأسماء والجنس - بيانات اسمية


اسمى، صورى شكلى، بالاسم فقط، أو قاطع، البيانات ، على عكس المرتبة ، من المستحيل ترتيبها أو مواءمتها. على سبيل المثال ، إذا قمنا بتعيين قيم عددية للذكور والإناث (على سبيل المثال ، "1" و "2") ، فلن يعني ذلك أن أحد الجنسين "أكبر" بطريقة ما عن الآخر. من الصعب أيضًا تخيل قيمة وسيطة (مثل "1.5"). وبالتالي ، يمكن تسمية المؤشرات الاسمية بأي أحرف أو كلمات أو أحرف خاصة - لا يهم.

الطرق العددية المنتظمة عادلة لا ينطبق للبيانات الاسمية. ومع ذلك ، هناك طرق للتغلب عليها. أبسط واحد هو عد، حساب الترددات لكل مستوى من المتغيرات الاسمية. هذه الأعداد والقياسات المشتقة الأخرى أسهل في التحليل.

نواقل الشخصية

لدى R عدة طرق لتخزين البيانات الاسمية. الأول هو ناقل حرف (نصي):

الرمز ( PageIndex {1} ) (R):

(يرجى ملاحظة الدالة str () مرة أخرى لابد من استخدامه في كل مرة عندما تتعامل مع أشياء جديدة!)

بالمناسبة ، لإدخال سلاسل الأحرف يدويًا ، من الأسهل البدء بشيء مثل aa <- c ("" "") ، ثم إدخال الفواصل والمسافات: aa <- c ("" ، "") وأخيراً إدراج القيم : aa <- c ("b"، "c").

خيار آخر هو إدخال scan (what = "char") ثم كتابة الأحرف بدون علامات اقتباس وفواصل ؛ في النهاية ، أدخل سلسلة فارغة.

لنفترض أن الجنس المتجه يسجل جنس الموظفين في شركة صغيرة. هذه هي الطريقة التي يعرض بها R محتواه:

الرمز ( PageIndex {2} ) (R):

لتحديد عناصر من المتجه ، استخدم الأقواس المربعة:

الرمز ( PageIndex {3} ) (R):

نعم، الأقواس المربعة هي الأمر! اعتادوا على فهرس النواقل وغيرها من الكائنات R. لكى تثبت ذلك، يركض ؟ "[". هناك طريقة أخرى للتحقق من ذلك وهي باستخدام backticks التي تسمح باستخدام مكالمات غير تافهة والتي تكون غير قانونية بخلاف ذلك:

الرمز ( PageIndex {4} ) (R):

قد "تفهم" الوظائف الذكية الموجهة للكائنات في R شيئًا عن جنس الكائن:

الرمز ( PageIndex {5} ) (R):

يحسب جدول الأوامر () العناصر من كل نوع ويخرج ملف الطاولة، وهي إحدى الطرق العددية القليلة للعمل مع البيانات الاسمية (يوضح القسم التالي المزيد عن التهم).

عوامل

لكن المؤامرة () لا يمكنها فعل أي شيء مع متجه الشخصية (التحقق من بنفسك). لرسم البيانات الاسمية ، علينا إبلاغ R أولاً أنه يجب التعامل مع هذا المتجه على أنه عامل:

الرمز ( PageIndex {6} ) (R):

الآن مؤامرة () سوف "ترى" ما يجب القيام به. سيعد العناصر بشكل غير مرئي ويرسم مخططًا (الشكل ( PageIndex {1} )):

الرمز ( PageIndex {7} ) (R):

حدث ذلك لأن متجه الشخصية تم تحويله إلى كائن من نوع خاص بالبيانات الفئوية ، وهو عامل مكون من اثنين المستويات:

الرمز ( PageIndex {8} ) (R):

الشكل ( PageIndex {1} ) هذه هي الطريقة التي يرسم بها الرسم البياني () عاملاً.

الرمز ( PageIndex {9} ) (R):

في R ، تفضل العديد من الوظائف (بما في ذلك المؤامرة ()) العوامل على متجهات الأحرف. يمكن لبعضهم حتى تحويل الشخصية إلى عامل ، لكن البعض الآخر لا. لذلك كن حذرا!

هناك بعض الحقائق الأخرى التي يجب وضعها في الاعتبار.

أولاً (والأهم) ، تسمح العوامل ، بخلاف متجهات الشخصية ، بالتحويل السهل إلى أرقام:

الرمز ( PageIndex {10} ) (R):

لكن لماذا الأنثى 1 والذكر 2؟ الإجابة بسيطة حقًا: لأن "أنثى" هي الأولى حسب الترتيب الأبجدي. يستخدم R هذا الترتيب في كل مرة يتعين فيها تحويل العوامل إلى أرقام.

تصبح أسباب هذا التحول شفافة في المثال التالي. لنفترض أننا قمنا أيضًا بقياس أوزان الموظفين من مثال سابق:

الرمز ( PageIndex {11} ) (R):

قد نرغب في رسم جميع المتغيرات الثلاثة: الطول والوزن والجنس. إليك إحدى الطرق الممكنة (الشكل ( PageIndex {2} )):

الرمز ( PageIndex {12} ) (R):

الشكل ( PageIndex {2} ) مخطط بثلاثة متغيرات.

تحدد المعلمات pch (من "print character") و col (من "color") شكل ولون الأحرف المعروضة في الرسم. اعتمادًا على قيمة الجنس المتغير ، يتم عرض نقطة البيانات على شكل دائرة أو مثلث ، وأيضًا باللون الأسود أو الأحمر. بشكل عام ، يكفي استخدام أيٍّ من الشكل أو اللون للتمييز بين المستويات.

لاحظ أنه تم طباعة الألوان من الأرقام وفقًا للوحة الحالية. لمعرفة الأرقام التي تعني الألوان ، اكتب:

الرمز ( PageIndex {13} ) (R):

من الممكن تغيير اللوحة الافتراضية باستخدام هذه الوظيفة مع الوسيطة. على سبيل المثال ، لوحة الألوان (قوس قزح (8)) ستحل محل الافتراضي بـ 8 ألوان "قوس قزح" جديدة. للعودة ، اكتب لوح الألوان ("افتراضي"). من الممكن أيضًا إنشاء لوح الألوان الخاص بك ، على سبيل المثال باستخدام وظيفة colorRampPalette () (انظر الأمثلة في الفصول التالية) أو باستخدام الحزمة المنفصلة (مثل RColorBrewer أو cetcolor ، يسمح الأخير بإنشاء موحد إدراكي لوحات).

كيفية تلوين شريط الرسم من الشكل ( PageIndex {1} ) باللون الأسود (أنثى) والأحمر (ذكر)؟

إذا كان العامل الخاص بك مكونًا من أرقام وتريد تحويله العودة إلى الأرقام (هذه المهمة ليست نادرة!) ، قم بتحويلها أولاً إلى متجه الأحرف ، وبعد ذلك فقط - إلى أرقام:

الرمز ( PageIndex {14} ) (R):

الميزة المهمة التالية للعوامل هي أن المجموعة الفرعية من العامل تحتفظ افتراضيًا بعدد المستويات الأصلي ، حتى لو لم تعد بعض المستويات موجودة هنا بعد الآن. قارن:

الرمز ( PageIndex {15} ) (R):

هناك عدة طرق لاستبعاد المستويات غير المستخدمة ، على سبيل المثال باستخدام أمر droplevels () ، مع وسيطة إسقاط ، أو عن طريق تحويل البيانات "ذهابًا وإيابًا" (عامل إلى حرف إلى عامل):

الرمز ( PageIndex {16} ) (R):

ثالثًا ، يجوز لنا ترتيب عوامل. دعونا نقدم المتغير الرابع - مقاسات القمصان لهؤلاء الموظفين الافتراضيين السبعة:

الرمز ( PageIndex {17} ) (R):

هنا تتبع المستويات الترتيب الأبجدي ، وهو أمر غير مناسب لأننا نريد أن يكون S (صغير) هو الأول. لذلك ، يجب أن نخبر R أن هذه البيانات مرتبة:

الرمز ( PageIndex {18} ) (R):

(الآن يتعرف R على العلاقات بين الأحجام ، ويمكن التعامل مع متغير m مرتبة.)

في هذا القسم ، أنشأنا عددًا غير قليل من كائنات R الجديدة. تتمثل إحدى المهارات التي يجب تطويرها في فهم الأشياء الموجودة في جلستك في الوقت الحالي. لرؤيتهم ، قد ترغب في ذلك قائمة الكائنات:

الرمز ( PageIndex {19} ) (R):

إذا كنت تريد كل الكائنات مع بنيتها ، فاستخدم الأمر ls.str ().

هناك أيضًا إصدار أكثر تعقيدًا من قائمة الكائنات ، والذي يُبلغ عن الكائنات في جدول:

الرمز ( PageIndex {20} ) (R):

(لاستخدام Ls () ، قم بتنزيل asmisc.r ثم المصدر () من القرص ، أو المصدر من عنوان URL المذكور في المقدمة.)

يكون Ls () مفيدًا أيضًا عند بدء العمل مع الكائنات الكبيرة: فهو يساعد في تنظيف ذاكرة R (^ {[1]} ).

المتجهات المنطقية والبيانات الثنائية

البيانات الثنائية (لا تخلط مع تنسيق ملف ثنائي) هي حالة خاصة مرتبطة بكل من البيانات الاسمية والمرتبة. من الأمثلة الجيدة على ذلك الإجابة بـ "نعم" أو "لا" في الاستبيان ، أو الحضور ضد. عدم وجود شيء. في بعض الأحيان ، قد يتم طلب البيانات الثنائية (كما في حالة الحضور / الغياب) ، وأحيانًا لا يتم طلبها (كما هو الحال مع الإجابات الصحيحة أو الخاطئة). يمكن تقديم البيانات الثنائية كأرقام 0/1 ، أو على شكل ناقل منطقي وهي سلسلة قيم TRUE أو FALSE.

تخيل أننا سألنا سبعة موظفين عما إذا كانوا يحبون البيتزا وقمنا بترميز إجاباتهم بـ "نعم" / "لا" إلى صواب أو خطأ:

الرمز ( PageIndex {21} ) (R):

المتجه الناتج ليس حرفًا أو عاملاً ، إنه كذلك منطقي. إحدى الميزات المثيرة للاهتمام هي أن المتجهات المنطقية تشارك في العمليات الحسابية دون مشاكل. من السهل أيضًا تحويلها إلى أرقام مباشرة باستخدام as.numeric () ، وكذلك تحويل الأرقام إلى منطقية باستخدام as.logical ():

الرمز ( PageIndex {22} ) (R):

هذه هي الميزة الأكثر فائدة للبيانات الثنائية. جميع أنواع البيانات الأخرى، من القياس إلى القيمة الاسمية (الأخير هو الأكثر فائدة) ، يمكن تحويله إلى منطقي ، ومن السهل تحويله إلى أرقام منطقية: 0/1:

الرمز ( PageIndex {23} ) (R):

بعد ذلك ، ستصبح العديد من الأساليب المتخصصة ، مثل الانحدار اللوجستي أو مقاييس التشابه الثنائية ، متاحة حتى لتلك البيانات الاسمية في البداية.

كمثال ، هذه هي كيفية تحويل متجه جنس الشخصية إلى منطقي:

الرمز ( PageIndex {24} ) (R):

(طبقنا تعبير منطقي على الجانب الأيمن من التخصيص باستخدام "تساوي؟" مشغل رمز المعادلة المزدوجة. هذه هي الطريقة العددية الثانية للعمل مع البيانات الاسمية. لاحظ أن واحد أصبح متجه الحرف بنوعين من القيم اثنين ناقلات منطقية.)

المتجهات المنطقية مفيدة أيضًا في الفهرسة:

الرمز ( PageIndex {25} ) (R):

(أولاً ، طبقنا تعبيرًا منطقيًا بعلامة أكبر لإنشاء المتجه المنطقي. ثانيًا ، استخدمنا الأقواس المربعة لفهرسة متجه ارتفاعات الارتفاع ؛ وبعبارة أخرى ، نحن المحدد تلك الارتفاعات التي تزيد عن 170 سم).

بصرف النظر عن العلامات الأكبر والمتساوية ، هناك العديد من العلامات الأخرى العوامل المنطقية التي تسمح بإنشاء تعبيرات منطقية في R (انظر الجدول ( PageIndex {1} )):

==مساو
<=متساوية أو أقل
>=مساوية أو أكثر
&و
|أو
!ليس
!=ليس متساوي
٪في٪تطابق

جدول ( PageIndex {1} ) بعض العوامل المنطقية وكيفية فهمها.

تساعد عوامل التشغيل AND و OR (& و |) في إنشاء تعبيرات منطقية متقدمة حقًا ومفيدة للغاية:

الرمز ( PageIndex {26} ) (R):

(اخترنا هنا فقط الأشخاص الذين يقل ارتفاعهم عن 170 سم أو وزنهم 70 كجم أو أقل ، يجب أن يكون هؤلاء الأشخاص إما إناثًا أو يتحملون قمصانًا صغيرة الحجم. لاحظ أن استخدام الأقواس يسمح بالتحكم في ترتيب الحسابات و يجعل التعبير أكثر قابلية للفهم.)

تكون التعبيرات المنطقية أكثر قوة إذا تعلمت كيفية استخدامها مع الأمر ifelse () والعامل إذا (يتم توفير الأخير بشكل متكرر مع else):

الرمز ( PageIndex {27} ) (R):

(الأمر ifelse () هو متجه لذلك يمر بشروط متعددة في وقت واحد. عامل التشغيل إذا أخذ شرطًا واحدًا فقط.)

لاحظ استخدام الأقواس المعقوفة إنها الصفوف الأخيرة. تحول الأقواس المتعرجة عددًا من التعبيرات إلى تعبير واحد (مدمج). عندما يكون هناك أمر واحد فقط ، تكون الأقواس المتعرجة اختيارية. قد تحتوي الأقواس المتعرجة على أمرين في صف واحد إذا تم فصلهما بفاصلة منقوطة.

مراجع

1. افتراضيًا ، لا يُخرج Ls () وظائف. إذا لزم الأمر ، يمكن تغيير هذا السلوك مع Ls (استبعاد = "بلا").


ما هو الفرق بين البيانات الاسمية والترتيبية أمبير؟

في الإحصاء ، يشير المصطلحان "الاسمي" و "الترتيبي" إلى أنواع مختلفة من البيانات القابلة للتصنيف. لفهم ما يعنيه كل مصطلح من هذه المصطلحات ونوع البيانات التي يشير إليها كل منهما ، فكر في جذر كل كلمة واجعل ذلك دليلًا على نوع البيانات التي يصفها. تتضمن البيانات الاسمية تسمية البيانات أو تحديدها لأن كلمة "اسمية" تشترك في جذر لاتيني مع كلمة "اسم" ولها صوت مماثل ، ومن السهل تذكر وظيفة البيانات الاسمية. تتضمن البيانات الترتيبية وضع المعلومات في ترتيب ، وصوت "الترتيب" و "الترتيب" على حد سواء ، مما يجعل وظيفة البيانات الترتيبية سهلة التذكر أيضًا.

TLDR (طويل جدًا لم تتم قراءته)

تقوم البيانات الاسمية بتعيين أسماء لكل نقطة بيانات دون وضعها في نوع من الترتيب. على سبيل المثال ، يمكن تصنيف نتائج الاختبار اسميًا على أنها "نجاح" أو "فشل".

تجمع البيانات الترتيبية البيانات وفقًا لنوع من نظام التصنيف: فهي تطلب البيانات. على سبيل المثال ، يمكن تجميع نتائج الاختبار بترتيب تنازلي حسب الدرجة: A و B و C و D و E و F.


ترتيبي

يتم تعيين العناصر الموجودة على مقياس ترتيبي في نوع ما ترتيب من خلال موقعهم على المقياس. قد يشير هذا إلى الموقف الزمني ، والتفوق ، وما إلى ذلك.

غالبًا ما يتم تحديد ترتيب العناصر من خلال تخصيص أرقام لها لإظهار موقعها النسبي. يمكن أيضًا استخدام الأحرف أو الرموز المتسلسلة الأخرى حسب الاقتضاء.

عادة ما تكون العناصر الترتيبية قاطعة ، من حيث أنها تنتمي إلى فئة يمكن تحديدها ، مثل "عدائي ماراثون 1956".

لا يمكنك إجراء العمليات الحسابية باستخدام الأعداد الترتيبية - فهي تظهر التسلسل فقط.

مثال

الشخص الأول والثالث والخامس في السباق.

نطاقات الدفع في مؤسسة ، كما يُشار إليها من قبل A و B و C و D.


أي نوع من المتغيرات العمر؟

لا يوجد ترتيب مرتبط بالقيم في اسمى، صورى شكلى، بالاسم فقط المتغيرات. [نسبة] سن هو على مستوى نسبة القياس لأنه يحتوي على قيمة صفرية مطلقة والفرق بين القيم له معنى. على سبيل المثال ، الشخص الذي يبلغ من العمر 20 عامًا قد عاش (منذ الولادة) نصف طول الشخص الذي يبلغ من العمر 40 عامًا.

وبالمثل ، هل العمر متغير في البحث؟ على سبيل المثال، سن يمكن اعتباره أ عامل لأن سن يمكن أن تأخذ قيمًا مختلفة لأشخاص مختلفين أو لنفس الشخص في أوقات مختلفة. وبالمثل ، يمكن اعتبار البلد أ عامل لأنه يمكن تعيين قيمة لبلد الشخص. المتغيرات ليست دائمًا "كمية" أو عددية.

يُسأل أيضًا ، هل العمر متغير قاطع؟

متغيرات مقولية خذ قيم الفئة أو التسمية ووضع الفرد في واحدة من عدة مجموعات. كمي المتغيرات تأخذ القيم العددية وتمثل نوعًا من القياس. في مثالنا الطبي ، سن هو مثال كمي عامل لأنه يمكن أن يأخذ قيمًا عددية متعددة.

هل العمر متغير قاطع أم متغير مستمر؟

أ عامل يقال أن يكون مستمر إذا كان بإمكانه افتراض عدد لا حصر له من القيم الحقيقية. أمثلة على المتغير المستمر هي المسافة ، سن ودرجة الحرارة.


محاور فئوية في بايثون

Plotly هي مكتبة رسوم بيانية مجانية ومفتوحة المصدر لبايثون. نوصيك بقراءة دليل البدء للحصول على أحدث إرشادات التثبيت أو الترقية ، ثم الانتقال إلى البرامج التعليمية لـ Plotly Fundamentals أو الغوص مباشرة في بعض دروس الرسوم البيانية الأساسية.

تعرض هذه الصفحة أمثلة على كيفية تكوين محاور ديكارتية ثنائية الأبعاد لتصور البيانات الفئوية (أي البيانات النوعية أو الاسمية أو الترتيبية بدلاً من البيانات الرقمية المستمرة). هذه المحاور مناسبة بشكل طبيعي للمخططات الشريطية ، ومخططات الشلال ، ومخططات القمع ، وخرائط الحرارة ، ومخططات الكمان ، والمخططات الصندوقية ، ولكن يمكن استخدامها أيضًا مع المخططات المبعثرة والمخططات الخطية. يتم تكوين خطوط الشبكة والعلامات وعلامات التجزئة وعناوين المحاور على المحاور اللوغاريتمية كما هو الحال مع المحاور الخطية.

نوع المحور الديكارتي ثنائي الأبعاد والكشف التلقائي & # 182

يتم تكوين الأنواع المختلفة من المحاور الديكارتية عبر سمة xaxis.type أو yaxis.type ، والتي يمكن أن تأخذ القيم التالية:

  • "خطي" (انظر دروس المحاور الخطية)
  • 'log' (انظر البرنامج التعليمي لقطعة السجل)
  • "التاريخ" (انظر البرنامج التعليمي على سلاسل الوقت)
  • "الفئة" انظر أدناه
  • "متعدد الفئات" انظر أدناه

يتم اكتشاف نوع المحور تلقائيًا من خلال النظر إلى البيانات من التتبع الأول المرتبط بهذا المحور:

  • تحقق أولاً من الفئات المتعددة ، ثم التاريخ ، ثم الفئة ، وإلا إلى الخطي الافتراضي (لا يتم تحديد السجل تلقائيًا مطلقًا)
  • تعد الفئة المتعددة مجرد اختبار للشكل: هل المصفوفة متداخلة؟
  • التاريخ والفئة: تتطلب أكثر من ضعف عدد سلاسل التاريخ أو الفئات المميزة كأرقام مميزة من أجل اختيار هذا النوع من المحور.
    • كلاهما يختبر عينة متساوية التباعد بحد أقصى 1000 قيمة

    إجبار المحور على أن يكون فئوي & # 182

    من الممكن فرض نوع المحور من خلال تحديد نوع xaxis_type بشكل صريح. في المثال أدناه ، سيكون نوع المحور X التلقائي خطيًا (لأنه لا يوجد أكثر من ضعف عدد السلاسل الفريدة مثل الأرقام الفريدة) ولكننا نجبرها على أن تكون فئة.


    استنتاج

    عند التعامل مع البيانات الإحصائية ، من المهم معرفة ما إذا كانت البيانات التي تتعامل معها اسمية أم ترتيبية ، حيث تساعدك هذه المعلومات على تحديد كيفية استخدام البيانات. الإحصائي قادر على اتخاذ قرار مناسب بشأن التحليل الإحصائي الذي يجب تطبيقه على مجموعة بيانات معينة بناءً على ما إذا كان اسميًا أم ترتيبيًا.

    تتمثل الخطوة الأولى للتحديد الصحيح للبيانات الاسمية والترتيبية في معرفة التعريفات الخاصة بكل منهما. بعد ذلك ، تحتاج إلى تحديد أوجه التشابه والاختلاف بينهما حتى لا تختلط أثناء التحليل.

    هذه المعرفة ضرورية للغاية ، لأنها تساعد الباحث في تحديد نوع البيانات التي يجب جمعها.


    نشاط البرنامج

    ال أنواع المتغيرات أنت تحلل تتصل مباشرة بالمتوفر وصفي واستنتاجي أساليب إحصائية.

    • تقييم كيفية قياس تأثير الفائدة و
    • تعرف كيف يحدد هذا الأساليب الإحصائية التي يمكنك استخدامها.

    بينما نمضي في هذه الدورة ، سنؤكد باستمرار على أنواع المتغيرات هذا هو مناسبة لكل طريقة نناقشها.


    أنواع موازين القياس

    نظرًا لأن المقياس الفاصل لا يحتوي على نقطة الصفر الحقيقية ، فليس من المنطقي حساب نسب درجات الحرارة.

    • لا معنى أن تكون النسبة من 40 إلى 20 درجة فهرنهايت هي نفسها النسبة من 100 إلى 50 درجة
    • لا يتم الاحتفاظ بأي خاصية مادية مثيرة للاهتمام عبر النسبتين.
    • بعد كل شيء ، إذا تم تطبيق ملصق "صفر" عند درجة الحرارة التي تصادف فهرنهايت على أنها 10 درجات ، فإن النسبتين ستكونان بدلاً من ذلك 30 إلى 10 ومن 90 إلى 40 ، لن تكون هي نفسها!
    • لهذا السبب ، ليس من المنطقي أن نقول إن 80 درجة "ضعف الحرارة" 40 درجة.

    المقياس الاسمي مقابل المقياس الترتيبي: ما هو الفرق؟

    المقياس الاسمي والمقياس الترتيبي هما مقياسان من أربعة مقاييس متغيرة للقياس. كلا مقياسي القياس لهما أهميته في الاستبيانات / الاستبيانات ، واستطلاعات الرأي ، والتحليل الإحصائي اللاحق. الفرق بين المقياس الاسمي والترتيبي له تأثير كبير على طرق تحليل أبحاث السوق بسبب التفاصيل والمعلومات التي يقدمها كل منهم.

    المقياس الاسمي مشتق من الكلمة اللاتينية "نوماليس" التي تشير إلى "ذات الصلة بالأسماء" ، وعادة ما تستخدم للإشارة إلى الفئات. هذه الفئات لها أرقام مقابلة مخصصة لتحليل البيانات المجمعة. على سبيل المثال ، يعتبر جنس الشخص وعرقه ولون شعره وما إلى ذلك بيانات لمقياس اسمي.

    من ناحية أخرى ، يتضمن المقياس الترتيبي ترتيب المعلومات بترتيب معين ، أي بالمقارنة مع بعضها البعض و "ترتيب" كل متغير (متغير). على سبيل المثال ، بعد أن يتسوق أحد العملاء من أحد منافذ البيع بالتجزئة ، يُطلب منه / منها ملء استبيان كشك: "على مقياس من 1 إلى 5 ، كيف كانت تجربة التسوق الخاصة بك؟" & # 8211

    • 1 يشير إلى غير مرض للغاية ، و 2 غير مرض ، و 3 محايد ، و 4 يشير إلى مرضٍ ، و 5 يشير إلى مرضٍ للغاية.
    • هنا ، ستكون البيانات التي تم جمعها على مقياس ترتيبي حيث توجد رتبة مرتبطة بكل خيار من خيارات الإجابة ، أي أن 2 أقل من 4 و 4 أقل من 5.
    • ولكن ، في المقياس الترتيبي ، ليس من الضروري أن يكون الفرق بين 4 (مُرضٍ) و 2 (غير مُرضٍ) هو نفسه الفرق بين 5 (مُرضٍ للغاية) و 3 (محايد) ، حيث لم يتم تخصيص الرقم لـ القياس الكمي ولكن لأغراض وضع العلامات فقط.

    يجب على كل إحصائي تقييم هذا الاختلاف بدقة حيث يتم حساب المقياسين المتغيرين الآخرين ، أي الفاصل الزمني والنسبة. قبل المضي قدمًا في المناقشة حول المقاييس الاسمية مقابل المقاييس الترتيبية ، إليك وصفًا موجزًا ​​للمستويات الاسمية والترتيبية للقياس-

    المستوى الاسمي للقياس: في المستوى الاسمي للقياس ، يتم تمييز المتغيرات من خلال تسمياتها. هذه المتغيرات ليس لها ترتيب أو تسلسل هرمي مرتبط بها.

    الأرقام المرتبطة بالأسماء هي مجرد علامات ليس لها جانب رياضي مرتبط بها. هذه المتغيرات وصفية بطبيعتها. من حيث الإحصائيات ، المقياس الاسمي هو الأسهل في الفهم والتنفيذ. تحتوي هذه المتغيرات على قسمين على الأقل مثل ذكر / أنثى ، نعم / لا.

    لا يحتوي هذا المقياس على قيمة عددية ، على سبيل المثال & # 8211 الجنس والعرق والعرق وما إلى ذلك.

    المستوى الترتيبي للقياس: في المستوى الترتيبي للقياس ، يعتبر ترتيب المتغيرات أمرًا بالغ الأهمية. لم يتم تأسيس الفرق بين هذه المتغيرات وهو ليس جانبًا لا يتجزأ من مقياس القياس هذا.

    يتم تحديد المتغيرات ووصفها جنبًا إلى جنب مع تخصيص قيمة لكل من هذه المتغيرات المحددة. في أبحاث السوق ، تُستخدم المقاييس الترتيبية لتحليل التصورات النسبية ، والاختيارات ، والتغذية المرتدة ، أي أنه يمكن للمسوقين تقييم درجة رضا العملاء أو سعادتهم ، وفهم ما إذا كان ينبغي نشر رسائلهم الإخبارية في كثير من الأحيان ، وما إلى ذلك.


    أمثلة البيانات الفئوية والتعريف

    في مجال الإحصاء وإدارة البيانات ، يمكن أن تحصل على قائمة ضخمة من أمثلة البيانات الفئوية والتطبيقات.


    البيانات ، بالمعنى العلمي ، هي مجموعة من المعلومات التي تم جمعها لغرض ما. تنقسم البيانات عادةً إلى نوعين مختلفين: فئوية (تُعرف على نطاق واسع باسم البيانات النوعية) ورقمية (كمية).

    في هذه الصفحة سوف تتعلم:

    • ما هي البيانات الفئوية؟ التعريف والخصائص الرئيسية.
    • قائمة 22 أمثلة من البيانات الفئوية.
    • البيانات الفئوية مقابل البيانات العددية.
    • انفوجرافيك في PDF

    كما قد تتخيل ، البيانات الفئوية هي بيانات مقسمة إلى مجموعات أو فئات. تستند هذه الفئات على الخصائص النوعية مثل الجنس والألوان أو أي شيء آخر ليس له رقم مرتبط به.

    هذا لا يعني & # 8217t أن البيانات الفئوية لا يمكن أن تحتوي على قيم عددية.

    في الواقع ، غالبًا ما تأخذ البيانات الفئوية قيمًا رقمية ، ولكن هذه الأرقام ليس لها أي معنى رياضي. إنهم يمثلون فقط عدد العناصر في كل مجموعة. على سبيل المثال 12 شقرا في الفصل.

    هذا يجعل من الممكن القيام بتحليل البيانات الفئوية والمعالجات المختلفة ، لا سيما في تطبيق جداول البيانات.

    لا يوجد ترتيب للقيم والمتغيرات الفئوية. بعبارة أخرى ، لم يتم ترتيبهم من الأعلى إلى الأدنى.

    على سبيل المثال ، لا يوجد ترتيب لفئات العيون الزرقاء والبنية والخضراء.

    كيفية عرض المتغيرات الفئوية بيانياً؟

    تعد المخططات الشريطية والمخططات الدائرية أدوات رائعة لمقارنة قيمتين أو أكثر من القيم الفئوية مع بعضها البعض. إنهم يمثلون فقط عدد الأشياء في الفئة.

    على سبيل المثال ، إذا كنت تريد عرض عدد العاملين في شركة ما ، فيمكن تقديم النتائج على مخطط دائري أو على رسم بياني شريطي.

    أمثلة البيانات الفئوية الرسومية:

    استبيان حول & # 8220 ما الذي يحفز الموظفين على العمل بشكل أفضل؟ & # 8221

    قبل إنشاء مخطط دائري أو مخطط شريطي ، يجب عليك التحقق مما إذا كانت البيانات في أعداد أو نسب مئوية. لعمل عرض رسومي للبيانات الفئوية ، يعد هذا شرطًا ضروريًا.

    غالبًا ما يتضمن تحليل البيانات الفئوية جداول البيانات. يتم تمثيل القيم كجدول ثنائي الاتجاه أو جدول طوارئ عن طريق حساب عدد العناصر الموجودة في كل فئة.

    هنا ملف مثال على جدول ثنائي الاتجاه للبيانات الفئوية لمجموعة من 50 شخصًا.

    يوضح الجدول نتائج المجموعات المكونة بإحصاء لون الشعر والعين لكل شخص.

    تعد الجداول ذات الاتجاهين والجداول الاحتياطية أدوات رائعة لمعرفة كيفية ارتباط متغيرين فئويين.

    يمثل الجدول التعداد أو النسب المئوية للأشخاص الذين ينتمون إلى مجموعة لمتغيرين كميين أو أكثر. يسهل العثور على علاقات مختلفة بين البيانات.

    دعونا نلخص & # 8217s ال الخصائص الرئيسية للبيانات الفئوية تعلمنا أعلاه:

    • البيانات الفئوية هي مقسمة إلى مجموعات أو الفئات.
    • الفئات على أساس نوعي مميزات.
    • هنالك لا طلب إلى القيم والمتغيرات الفئوية.
    • يمكن أن تأخذ البيانات الفئوية قيمًا رقمية ، ولكن هذه الأرقام ليس لها أي معنى رياضي.
    • يتم عرض البيانات الفئوية بيانياً بواسطة المخططات الشريطية والمخططات الدائرية.

    عندما يتعلق الأمر بأمثلة البيانات الفئوية ، يمكن إعطاء مجموعة واسعة من الأمثلة. في بياناتنا السابقة الاسمية مقابل الترتيبية ، قدمنا ​​الكثير من الأمثلة على المتغيرات الاسمية (البيانات الاسمية هي النوع الرئيسي للبيانات الفئوية).

    أمثلة على البيانات الفئوية:

    • الجنس ذكر أنثى)
    • العلامة التجارية للصابون (دوف ، أولاي ...)
    • لون الشعر (أشقر ، بني ، بني ، أحمر ، إلخ.)
    • استطلاع حول موضوع & # 8220 هل لديك أطفال؟ & # 8221 (نعم أم لا)
    • دوافع الموظفين للعمل بشكل أفضل: (تحفيز الأقران ، ليتم الاعتراف بها ، وفرص النمو المهني ، وثقافة العمل ، والشعور بالانخراط وما إلى ذلك)
    • دوافع السفر (الترفيه ، سفر العمل ، زيارة الأصدقاء وما إلى ذلك)
    • التحقق من موقع الحساب (كاليفورنيا ، تكساس ، كولورادو & # 8230)
    • المستوى التعليمي: (Associate & # 8217s degree، Bachelor & # 8217s degree، Master & # 8217s Degree، Doctor and إلخ.)
    • الفئة العمرية (أقل من 12 عامًا ، و12-17 عامًا ، و18-24 عامًا ، و25-34 عامًا ، و35-44 عامًا ، وما إلى ذلك)
    • العرق (من أصل اسباني ، أمريكي من أصل أفريقي ، أمريكي أصلي ، آسيوي ، أخرى)
    • لون العين (أخضر ، أزرق ، بني ، أسود)
    • تكوين الأسرة (أعزب ، متزوج ، أرمل ، مطلق)
    • الحالة الوظيفية (موظف مقابل أجر ، يعمل لحسابه الخاص ، ربة منزل ، طالب ، متقاعد وما إلى ذلك)
    • أنواع الأفلام (الحركة ، المغامرة ، الكوميديا ​​، الجريمة ، الغموض ، الدراما ، التاريخية وغيرها)
    • الوطن (كندا ، الولايات المتحدة الأمريكية ، أستراليا ، الهند ، ألمانيا).
    • لون السيارة (أحمر ، أخضر ، رمادي ، أسود ، أبيض ، إلخ.)
    • الدين (موسلين ، بوذي ، مسيحي).
    • أسباب شراء هدية (عيد ميلاد ، ذكرى سنوية ، وما إلى ذلك)
    • الفصول (الشتاء ، الربيع ، الصيف ، الخريف)
    • الأعياد (عيد الشكر ، عيد الهالوين)
    • أنواع الحيوانات الأليفة (كلب ، قطة ، هامستر)
    • فصائل الدم (المجموعة A ، المجموعة B ، المجموعة AB ، المجموعة O).

    عندما تحتوي البيانات الفئوية على قيمتين محتملتين فقط ، فإنها تسمى ثنائية. إذا استخدمنا أمثلة البيانات الفئوية أعلاه ، فإن نتائج المسح الجنساني (ذكور وإناث) والاستطلاع حول موضوع & # 8220 هل لديك أطفال؟ & # 8221 (نعم أو لا) هي أمثلة على البيانات الثنائية.

    البيانات الفئوية والكمية (العددية): الفرق

    في بعض الأحيان ، يصعب التمييز بين البيانات الفئوية والكمية.

    يتم قياس البيانات الكمية والتعبير عنها عدديًا. لها معنى عددي وتستخدم في الحسابات والحساب.

    هذا هو السبب في أن الاسم الآخر للبيانات الكمية هو اسم رقمي.

    أمثلة على البيانات الكمية هي: الوزن ودرجة الحرارة والطول والمعدل التراكمي والدخل السنوي وعدد الساعات التي يقضيها العمل وما إلى ذلك. المزيد من الأمثلة يمكنك الاطلاع عليها في مقالة ThoughtGo & # 8220 البيانات الكمية & # 8221.

    بالمقارنة ، لا تحتوي البيانات الفئوية على أي معنى عددي أو كمي. إنه يصف فقط الخصائص النوعية لشيء ما.

    أنواع البيانات الكمية هي: ترتيبي ، فاصل ، ونسبة. البيانات الفئوية هي دائمًا نوع واحد & # 8211 النوع الاسمي.

    يعد التمييز بين المتغيرات الفئوية والكمية أمرًا بالغ الأهمية لتحديد أنواع طرق تحليل البيانات التي يجب استخدامها. يتم تحليل البيانات الكمية باستخدام الإحصاء الوصفي ، والسلاسل الزمنية ، ونماذج الانحدار الخطي ، وغير ذلك الكثير. بالنسبة للبيانات الفئوية ، عادةً ما يتم استخدام الأساليب الرسومية والوصفية فقط.

    كما ترى ، يمكن إعطاء الكثير من أمثلة البيانات الفئوية لفهم معنى البيانات النوعية والغرض منها.


    عند العمل مع إدارة البيانات أو العلوم الإحصائية ، من الأهمية بمكان أن نفهم بوضوح بعض المصطلحات الرئيسية ، بما في ذلك البيانات الكمية والفئوية وما هو دورها.

    من المهم الحصول على معنى المصطلحات بشكل صحيح من البداية ، لذلك عندما يحين وقت التعامل مع مشاكل البيانات الحقيقية ، ستتمكن من التعامل معها بالطريقة الصحيحة.

    عن المؤلف

    سيلفيا فالتشيفا

    سيلفيا فالتشيفا هي مسوقة رقمية تتمتع بخبرة تزيد عن عشر سنوات في إنشاء محتوى لصناعة التكنولوجيا. لديها شغف قوي بالكتابة عن البرامج والتقنيات الناشئة مثل البيانات الضخمة والذكاء الاصطناعي وإنترنت الأشياء وأتمتة العمليات وما إلى ذلك.

    3 تعليقات

    كان هذا هو أفضل تفسير لمجموعة البيانات الفئوية عبر الإنترنت بالكامل.


    شاهد الفيديو: ويبينار استراتيجية التداول على النماذج الكلاسيكية, (شهر اكتوبر 2021).