مقالات

1.4: 04 النواقل العشوائية والاستقلالية - الرياضيات


1.4: 04 النواقل العشوائية والاستقلالية - الرياضيات

مشكلة 500

10 أسئلة حول المصفوفات غير اللغوية ، والمصفوفات المعكوسة ، والمتجهات المستقلة خطيًا.

تم تصميم الاختبار لاختبار فهمك للخصائص الأساسية لهذه الموضوعات.

يمكنك إجراء الاختبار عدة مرات كما تريد.

سيتم تقديم الحلول بعد الانتهاء من جميع المشكلات العشرة.
انقر على عرض السؤال زر لمعرفة الحلول.

بواسطة Yu & middot تاريخ النشر 06/19/2017 & middot آخر تعديل في 08/23/2017


المشكلة 704

دع $ A = ابدأ
2 & 4 & 6 & 8 \
1 ſ & 0 & 5 \
1 & 1 & 6 & 3
نهاية$.
(أ) ابحث عن أساس nullspace لـ $ A $.

(ب) ابحث عن أساس لمساحة الصف $ A $.

(ج) ابحث عن أساس لنطاق $ A $ الذي يتكون من متجهات عمود $ A $.

(د) لكل متجه عمود ليس متجهًا أساسيًا حصلت عليه في الجزء (ج) ، قم بالتعبير عنه كمجموعة خطية من المتجهات الأساسية لنطاق $ A $.


1.4: 04 النواقل العشوائية والاستقلالية - الرياضيات

في الحياة الواقعية ، نحتاج عادةً إلى التعامل مع أكثر من متغير عشوائي واحد. على سبيل المثال ، إذا كنت تدرس الخصائص الجسدية لأشخاص في منطقة معينة ، فيمكنك اختيار شخص عشوائيًا ثم النظر إلى وزنه وطوله وما إلى ذلك. وزن الشخص الذي تم اختياره عشوائيًا هو متغير عشوائي واحد ، في حين أن وزن الشخص الذي تم اختياره عشوائيًا هو متغير عشوائي واحد. طولها آخر. لا نحتاج فقط إلى دراسة كل متغير عشوائي على حدة ، ولكن نحتاج أيضًا إلى التفكير في ما إذا كان هناك الاعتماد (أي الارتباط) بينهما. هل صحيح أن الشخص الأطول من المرجح أن يكون أثقل أم لا؟ ستتم دراسة قضايا الاعتماد بين عدة متغيرات عشوائية بالتفصيل لاحقًا ، ولكن هنا نود التحدث عن سيناريو خاص حيث يوجد متغيرين عشوائيين مستقل.

يشبه مفهوم المتغيرات العشوائية المستقلة إلى حد كبير الأحداث المستقلة. تذكر أن حدثين $ A $ و $ B $ مستقلان إذا كان لدينا $ P (A، B) = P (A) P (B) $ (تذكر الفاصلة تعني و، على سبيل المثال ، $ P (A ، B) = P (A textrm <و> B) = P (A cap B) $). وبالمثل ، لدينا التعريف التالي للمتغيرات العشوائية المستقلة.

حدسيًا ، يكون متغيرين عشوائيين $ X $ و $ Y $ مستقلين إذا كانت معرفة قيمة أحدهما لا يغير احتمالات الآخر. بمعنى آخر ، إذا كان $ X $ و $ Y $ مستقلين ، فيمكننا كتابة $ P (Y = y | X = x) = P (Y = y) ، textrm <للجميع> x ، y. أحداث مستقلة ، من السهل أحيانًا القول بأن متغيرين عشوائيين مستقلان لمجرد أنهما لا يمتلكان أي تفاعلات جسدية مع بعضهما البعض. هذا مثال بسيط: أرمي قطعة نقود بقيمة $ 2N $ مرات. لنفترض أن $ X $ هو عدد الرؤوس التي لاحظتها في أول رميات لعملة $ N $ ودع $ Y $ هو عدد الرؤوس التي لاحظتها في رميات العملة الثانية $ N $. نظرًا لأن $ X $ و $ Y $ هما نتيجة رميات عملة مستقلة ، فإن المتغيرين العشوائيين $ X $ و $ Y $ مستقلان. من ناحية أخرى ، في سيناريوهات أخرى ، قد يكون الأمر أكثر تعقيدًا لإظهار ما إذا كان متغيرين عشوائيين مستقلين.

أرمي عملة معدنية مرتين وحدد $ X $ ليكون عدد الرؤوس التي أراقبها. بعد ذلك ، رميت العملة مرتين أخريين وحدد $ Y $ ليكون عدد الرؤوس التي ألاحظها هذه المرة. ابحث عن $ P bigg ((X 1) bigg) $.


الأسماء

ميزة رائعة لمتجهات R هي أنه يمكن تسمية كل عنصر. يمكن أن يؤدي تصنيف العناصر في كثير من الأحيان إلى تسهيل قراءة التعليمات البرمجية الخاصة بك. يمكنك تحديد الأسماء عند إنشاء متجه في النموذج الاسم = القيمة . إذا كان اسم العنصر هو اسم متغير صالح ، فلا داعي لإحاطة علامات اقتباس. يمكنك تسمية بعض عناصر المتجه وترك العناصر الأخرى فارغة:

يمكنك إضافة أسماء عناصر إلى متجه بعد إنشائه باستخدام وظيفة الأسماء:

يمكن أيضًا استخدام وظيفة الأسماء هذه لاسترداد أسماء المتجه:

إذا لم يكن للمتجه أسماء عناصر ، فإن دالة الأسماء ترجع NULL:


مناقشة

من المواقف المتكررة في التعلم الآلي وجود كمية هائلة من البيانات ، ومع ذلك ، فإن معظم العناصر الموجودة في البيانات عبارة عن أصفار. على سبيل المثال ، تخيل مصفوفة حيث توجد الأعمدة في كل فيلم على Netflix ، والصفوف تمثل كل مستخدم لـ Netflix ، والقيم هي عدد المرات التي شاهد فيها المستخدم هذا الفيلم المحدد. ستحتوي هذه المصفوفة على عشرات الآلاف من الأعمدة وملايين الصفوف! ومع ذلك ، نظرًا لأن معظم المستخدمين لا يشاهدون معظم الأفلام ، فإن الغالبية العظمى من العناصر ستكون صفرًا.

المصفوفات المتفرقة تخزن فقط العناصر غير الصفرية وتفترض أن جميع القيم الأخرى ستكون صفرية ، مما يؤدي إلى توفير حسابي كبير. في حلنا ، أنشأنا مصفوفة NumPy بقيمتين غير صفريتين ، ثم قمنا بتحويلها إلى مصفوفة متفرقة. إذا رأينا المصفوفة المتفرقة ، يمكننا أن نرى أنه يتم تخزين القيم غير الصفرية فقط:

هناك عدد من أنواع المصفوفات المتفرقة. ومع ذلك، في صف متناثر مضغوط تمثل مصفوفات (CSR) ، (1 ، 1) و (2 ، 0) المؤشرات (المفهرسة الصفرية) للقيم غير الصفرية 1 و 3 ، على التوالي. على سبيل المثال ، يوجد العنصر 1 في الصف الثاني والعمود الثاني. يمكننا أن نرى ميزة المصفوفات المتفرقة إذا أنشأنا مصفوفة أكبر بكثير تحتوي على عدد أكبر من العناصر الصفرية ثم قارننا هذه المصفوفة الأكبر مع المصفوفة المتفرقة الأصلية:

كما نرى ، على الرغم من حقيقة أننا أضفنا العديد من العناصر الصفرية في المصفوفة الأكبر ، فإن تمثيلها المتناثر هو بالضبط نفس المصفوفة المتفرقة الأصلية. أي أن إضافة عناصر صفرية لا يغير حجم المصفوفة المتفرقة.

كما ذكرنا ، هناك العديد من الأنواع المختلفة من المصفوفات المتفرقة ، مثل العمود المتناثر المضغوط ، وقائمة القوائم ، وقاموس المفاتيح. في حين أن شرح الأنواع المختلفة وآثارها خارج نطاق هذا الكتاب ، فمن الجدير بالذكر أنه على الرغم من عدم وجود نوع مصفوفة متفرقة "أفضل" ، إلا أن هناك اختلافات ذات مغزى بينها ويجب أن نكون مدركين لسبب اختيارنا نوع على آخر.


1 المقدمة

قياس واختبار الاعتماد بين | $$ | و | $$ | هي مشكلة أساسية في الإحصاء. ربما يكون ارتباط بيرسون هو الكمية الأولى والأكثر شهرة لقياس درجة الاعتماد الخطي بين متغيرين عشوائيين أحادي المتغير. يمكن استخدام الامتدادات بما في ذلك Spearman’s (1904) rho و Kendall’s (1938) tau وتلك الناتجة عن Hoeffding (1948) و Blum (1961) لقياس الاعتماد غير الخطي دون شروط اللحظة.

اختبار الاستقلال له تطبيقات مهمة. هناك مثالان من أبحاث الجينوم يختبران ما إذا كانت هناك مجموعتان من الجينات مرتبطان أم لا ، ويفحصان ما إذا كانت بعض الأنماط الظاهرية محددة بواسطة أنماط وراثية معينة. في أبحاث العلوم الاجتماعية ، يهتم العلماء بفهم الارتباطات المحتملة بين الخصائص النفسية والفسيولوجية. قدم Wilks (1935) اختبار حدودي يعتمد على | $ | < mbox <$ Sigma $ >> _ <,> | / (| < mbox <$ Sigma $ >> _| | < mbox <$ Sigma $ >> _|) $ | ⁠ ، حيث | $ < mbox <$ Sigma $ >> _ <,> = < mbox><(<^ < rm T >> ،<^ < rm T >>) <^ < rm T >> > in mathbb^ <(p + q) times (p + q)> $ | ⁠، | $ < mbox <$ Sigma $ >> _= < mbox>() in mathbb^

$ | و | $ < mbox <$ Sigma $ >> _ = < mbox>() in mathbb^$ | ⁠. طوال | $ < mbox <$ Sigma $ >> _ = < mbox>() $ | لتقف على مصفوفة التغاير لـ | $$ | و | $ | < mbox <$ Sigma $ >> _| $ | لتقف على محدد | $ < mbox <$ Sigma $ >> _$ | ⁠. اقترح هوتلينج (1936) معامل الارتباط الكنسي ، الذي يبحث عن | $ < mbox <$ alpha $ >> in mathbb^ ص $ | و | $ < mbox <$ beta $ >> in mathbb^ q $ | بحيث يكون ارتباط بيرسون بين | $ < mbox <$ alpha $ >> <^ < rm T >>$ | و | $ < mbox <$ beta $ >> <^ < rm T >>$ | إلى أقصى حد. يمكن استخدام كل من اختبار Wilks والارتباط الكنسي لاختبار الاستقلال بين | $$ | و | $$ | عندما يتبعون التوزيعات العادية. تم اقتراح الامتدادات اللامعلمية لاختبار ويلكس بواسطة Puri & amp Sen (1971) ، Hettmansperger & amp Oja (1994) ، Gieser & amp Randles (1997) ، Taskinen et al. (2003) و Taskinen وآخرون. (2005). يمكن استخدام هذه الاختبارات لاختبار الاستقلال بين | $$ | و | $$ | عندما تتبع توزيعات متناظرة بيضاويًا ، لكنها غير قابلة للتطبيق عندما تنتهك افتراضات الحالة الطبيعية أو الإهليلجية أو عندما تكون أبعاد | $$ | و | $$ | يتجاوز حجم العينة. بالإضافة إلى ذلك ، فإن اختبارات الاستقلال القائمة على الرتب متعددة المتغيرات غير فعالة لاختبار الاعتماد على غير النونوتون (Székely et al. ، 2007).

يمكن استخدام ارتباط المسافة (Székely et al. ، 2007) لقياس واختبار الاعتماد بين | $$ | و | $$ | في أبعاد اعتباطية دون افتراض الحالة الطبيعية أو الإهليلجية. شريطة أن | $ E ( || +| |) & lt infty $ | ⁠ ، علاقة المسافة بين | $$ | و | $$ | ⁠ ، يُرمز له بـ | $ < small < rm DC >> (,) $ | ⁠ غير سالب ويساوي صفرًا فقط إذا كان | $$ | و | $$ | مستقلة. طوال الوقت ، نحدد | $ || = (<^< m T>>) ^ <1/2> $ | لمتجه | $$ | ⁠. لاحظ Székely & amp Rizzo (2013) أن ارتباط المسافة قد يتأثر سلبًا بأبعاد | $$ | و | $$ | ⁠ ، واقترح مقدرًا غير متحيز له عند | $$ | و | $$ | ذات أبعاد عالية. في هذا البحث ، سنبين أن ارتباط المسافة قد يكون أقل كفاءة في اكتشاف الاعتماد غير الخطي عند الافتراض | $ E ( || +| |) & lt infty $ | انتهكت. لإزالة هذا الشرط اللحظة ، Benjamini et al. (2013) اقترح استخدام رتب المسافات ، ولكن هذا ينطوي على اختيار العديد من معلمات الضبط ، واختيارها مشكلة مفتوحة. الخصائص المقاربة للاختبار بناءً على رتب المسافات تحتاج أيضًا إلى مزيد من التحقيق.

نقترح استخدام ارتباط الإسقاط لوصف الاعتماد بين | $$ | و | $$ | ⁠. يعرض ارتباط الإسقاط أولاً المتجهات العشوائية متعددة المتغيرات في سلسلة من المتغيرات العشوائية أحادية المتغير ، ثم يكتشف الاعتماد غير الخطي عن طريق حساب ارتباط بيرسون بين المتغيرات العشوائية أحادية المتغير. علاقة الإسقاط بين | $$ | و | $$ | ⁠ ، يُرمز له بـ | $ < small < rm PC >> (,) $ | ⁠ غير سالب ويساوي صفرًا فقط إذا كان | $$ | و | $$ | مستقلة ، لذلك فهي قابلة للتطبيق بشكل عام كمؤشر لقياس درجة الاعتماد غير الخطي دون شروط اللحظة أو الحالة الطبيعية أو الاهليلجيه (Tracz et al. ، 1992). اختبار ارتباط الإسقاط من أجل الاستقلال متسق ضد جميع بدائل الاعتماد. ارتباط الإسقاط خالٍ من معلمات الضبط وثابت للتحول المتعامد. يجب أن نبين أن مقدر عينة ارتباط الإسقاط هو | $ n $ | -متوافق إذا | $$ | و | $$ | مستقلة وجذر- | $ n $ | - تتفق على خلاف ذلك. نجري دراسات مونت كارلو لتقييم أداء العينة المحدودة لاختبار ارتباط الإسقاط. تشير النتائج إلى أن ارتباط الإسقاط أقل حساسية لأبعاد | $$ | و | $$ | من ارتباط المسافة وحتى نسخته المحسّنة (Székely & amp Rizzo ، 2013) ، وهي أقوى من كل من ارتباط المسافة ورتب المسافات ، خاصةً عند أبعاد | $$ | و | $$ | كبيرة نسبيًا أو يتم انتهاك الشروط اللحظية التي يتطلبها ارتباط المسافة.


علينا أن نأخذ في الاعتبار كلا عنصري المتجه ، أي الاتجاه والحجم عند استخدام إضافة المتجه.

ضع في اعتبارك أنه يمكن إضافة المتجهين بنفس الحجم والاتجاه مثل الحجميات.

في هذا الموضوع ، سوف نستكشف الطرق الرسومية والرياضية لإضافة المتجهات ، بما في ذلك:

  1. إضافة المتجهات باستخدام قاعدة الرأس إلى الذيل
  2. إضافة المتجهات باستخدام طريقة متوازي الأضلاع
  3. إضافة المتجه باستخدام المكونات

إضافة المتجهات باستخدام قاعدة الرأس إلى الذيل

يمكن إجراء إضافة المتجهات باستخدام طريقة الرأس إلى الذيل الشهيرة. وفقًا لهذه القاعدة ، يمكن إضافة متجهين معًا عن طريق تجميعهما معًا بحيث ينضم المتجه الأول & # 8217s الرأس إلى ذيل المتجه الثاني. يمكن بعد ذلك الحصول على متجه المجموع الناتج عن طريق ضم ذيل المتجه الأول & # 8217s إلى رأس المتجه الثاني. يُعرف هذا أحيانًا أيضًا باسم طريقة المثلث لإضافة المتجهات.

يتم توضيح إضافة المتجه باستخدام قاعدة الرأس إلى الذيل في الصورة أدناه. المتجهان ص و س تمت إضافتها باستخدام طريقة الرأس إلى الذيل ، ويمكننا أن نرى المثلث مكونًا من المتجهين الأصليين والمتجه المجموع.

أولاً ، المتجهان ص و س يتم وضعها معًا بحيث يكون رأس المتجه ص يربط ذيل المتجه س. بعد ذلك ، للعثور على المجموع ، المتجه الناتج ص يتم رسمه بحيث يربط ذيل ص على رأس س.

رياضيا ، المجموع ، أو الناتج ، المتجه ، R ، في الصورة أدناه يمكن التعبير عنها على النحو التالي:

ص = ف + س

إضافة المتجهات باستخدام طريقة متوازي الأضلاع

لفهم إضافة المتجه باستخدام طريقة متوازي الأضلاع ، سننظر في الشكل أدناه ونوضحه.

أولاً ، ارسم المتجهات المعينة ، أ و ب، للحصول على نفس النقطة الأولية كما هو موضح في الصورة أدناه. ثم ارسم متوازي أضلاع باستخدام نسخ المتجهات المعطاة.

ثانيًا ، ارسم نسخة من المتجه ب اتصل ب'، ووضعه بالتوازي مع المتجه ب للاتصال إلى رأس المتجه الأول ، أ. وبالمثل ، ارسم نسخة من المتجه أ اتصل أ'، ووضعه بالتوازي مع A بحيث يتصل ذيله برأس المتجه ب.

أخيرًا ، ناتج المتجهين ، والذي يساوي مجموع المتجهات أ و ب، سيكون متوازي الأضلاع & # 8217s قطري. يمكن استخلاصه من خلال ضم النقطة الأولية للمتجهين أ و ب إلى رأس النواقل أ' و ب'.

باختصار ، هناك ثلاث خطوات مطلوبة لإجراء إضافة المتجه باستخدام طريقة متوازي الأضلاع:

الخطوة 1: ضع المتجهين بحيث يكون لهما نقطة بداية مشتركة

الخطوة 2: ارسم متوازي الأضلاع وأكمله باستخدام نسخ من المتجهين الأصليين

الخطوة 3: يكون قطري متوازي الأضلاع مساويًا لمجموع المتجهين

إضافة المتجه باستخدام المكونات

كما نعلم ، يمكن أن تتحلل المتجهات الواردة في الإحداثيات الديكارتية إلى مكوناتها الأفقية والرأسية. على سبيل المثال ، ناقل ص بزاوية Φ ، كما هو موضح في الصورة أدناه ، يمكن أن تتحلل إلى مكوناتها على النحو التالي:

صx، والذي يمثل مكون المتجه ص على طول المحور الأفقي (المحور السيني) ، و

صذ، والذي يمثل مكون المتجه ص على طول المحور الرأسي (المحور ص).

يمكن ملاحظة أن المتجهات الثلاثة تشكل مثلثًا قائمًا وهذا المتجه ص يمكن التعبير عنها على النحو التالي:

ص = صx+ صذ

رياضيًا ، يمكن أيضًا حساب مكونات المتجه باستخدام مقدار وزاوية المتجه المحدد.

صس = ف كوس Φ

صص = ف الخطيئة Φ

علاوة على ذلك ، يمكننا أيضًا تحديد المتجه الناتج إذا تم إعطاء مكوناته الأفقية والرأسية. على سبيل المثال ، إذا كانت قيم صxو صذبعد ذلك يمكننا حساب مقدار وزاوية المتجه P على النحو التالي:

| ف | = x ) ^ 2 + (صذ)^2

ويمكن إيجاد الزاوية على النحو التالي:

وبالتالي ، باختصار ، يمكننا تحديد ناقل ناتج إذا تم إعطاء مكوناته. بدلاً من ذلك ، إذا تم إعطاء المتجه نفسه ، فيمكننا تحديد المكونات باستخدام المعادلات أعلاه.

وبالمثل ، إذا تم التعبير عن المتجهات في أزواج مرتبة (متجهات العمود) ، فيمكننا إجراء عملية الجمع على المتجهات باستخدام مكوناتها. على سبيل المثال ، ضع في اعتبارك المتجهين م و ن نظرا ل:

إجراء إضافة متجه على المتجهين يكافئ إضافة المتجهين & # 8217 مكونات x و y ذات الصلة. هذا ينتج المتجه الناتج س:

س = م + ن

س = (م 1 + ن 1 ، م 2 + ن 2).

يمكن كتابتها بشكل صريح على النحو التالي:

حجم المتجه الناتج س يمكن حسابها على النحو التالي:

| S | = x ) ^ 2 + (S.ذ)^2

ويمكن حساب الزاوية على النحو التالي:


دمج التشفير المتغير في النموذج

للتعامل مع مشكلة إنشاء مجموعة متنوعة من الأمثلة ، قمت بدمج Variation Autoencoder (VAE) في شبكتنا. لن أخوض في تفاصيل شرح VAE هنا ، حيث كانت هناك بعض المشاركات الرائعة عنها ، وتنفيذ TensorFlow لطيف للغاية.

تساعد مساعدة VAE في القيام بأمرين. أولاً ، يسمحون لنا بذلك ترميز الصورة الموجودة إلى متجه Z كامن أصغر بكثير ، نوع من الضغط. يقوم بذلك عن طريق تمرير صورة عبر ملف شبكة التشفيروالتي سنسميها شبكة Q مع الأوزان. ومن هذا المتجه الكامن Z ، ستنتج شبكة المولد صورة قريبة قدر الإمكان من الصورة الأصلية التي تم تمريرها ، ومن ثم فهي عبارة عن نظام تشفير تلقائي. هذا يحل المشكلة التي واجهتنا في نموذج GAN ، لأنه إذا كان المولد ينتج أرقامًا معينة فقط ، ولكن ليس أرقامًا أخرى ، فسيتم معاقبته لأنه لا يقوم بإعادة إنتاج العديد من الأمثلة في مجموعة التدريب.

حتى الآن ، افترضنا أن المتجه Z هو متغيرات جاوس المستقلة البسيطة. ليس هناك ما يضمن أن شبكة التشفير Q ستقوم بتشفير الصور من صورة تدريب عشوائية X ، لإنتاج قيم Z التي تنتمي إلى توزيع احتمالي يمكننا إعادة إنتاجه واستخلاصه بشكل عشوائي ، مثل gaussian. تخيل أننا توقفنا هنا ، وقمنا بتدريب هذا المشفر الآلي كما هو. سنفتقر إلى القدرة على إنشاء صور عشوائية ، لأننا نفتقر إلى القدرة على رسم Z من توزيع عشوائي. إذا رسمنا Z من التوزيع الغاوسي ، فسيكون من قبيل المصادفة أن تبدو Z مثل بعض القيمة المقابلة لمجموعة التدريب ، وستنتج صورًا لا تبدو مثل مجموعة الصور بخلاف ذلك.

القدرة على التحكم الدقيق توزيع من Z هو الشيء الثاني الذي سيساعدنا VAE على القيام به ، والسبب الرئيسي وراء أهمية ورقة VAE وتأثيرها. بالإضافة إلى أداء وظيفة التشفير التلقائي ، فإن متغيرات Z الكامنة التي تم إنشاؤها من شبكة Q سوف تفعل أيضا لها خاصية كونها بسيطة مستقلة المتغيرات العشوائية gaussian. بمعنى آخر ، إذا كانت X عبارة عن صورة عشوائية من مجموعة التدريب الخاصة بنا ، والتي تنتمي إلى أي توزيع احتمالي غريب ومعقد ، فستتأكد شبكة Q من إنشاء Z بطريقة تجعل P (Z | X) عبارة عن مجموعة بسيطة من المتغيرات العشوائية المستقلة لوحدة جاوس. والشيء المذهل هو أن هذا الاختلاف بين توزيع P (Z | X) وتوزيع التوزيع الغاوسي (يسمون هذا تباعد كوالا لمبور) يمكن قياسها وتقليلها باستخدام النسب المتدرج باستخدام بعض الآلات الرياضية الأنيقة ، عن طريق حقن الضوضاء الغوسية في طبقة الإخراج لشبكة Q. يمكن تدريب نموذج VAE هذا عن طريق تقليل مجموع كل من خطأ إعادة البناء وخطأ اختلاف KL باستخدام النسب المتدرج ، في المعادلة 10 من ورقة VAE.

نموذج CPPN النهائي الخاص بنا مدمجًا مع GAN + VAE:

بدلاً من التمسك بنموذج VAE النقي ، أردت دمج VAE مع GAN ، لأنني وجدت أنه إذا تمسكت باستخدام VAE فقط ، فإن الصور التي تم إنشاؤها في النهاية تبدو ضبابية للغاية وغير مثيرة للاهتمام عندما نفجر الصورة. أعتقد أن هذا يرجع إلى أن مصطلح الخطأ يتم حسابه من أخطاء البكسل ، وهذه مشكلة معروفة لنموذج VAE. ومع ذلك ، فإنه لا يزال مفيدًا لقضيتنا ، وإذا تمكنا من دمجه مع GAN ، فقد نتمكن من تدريب نموذج سيكون قادرًا على إعادة إنتاج كل رقم ، ويبدو أكثر واقعية مع عمل شبكة المُميِّز كنقطة نهائية منقي.

سيتطلب تدريب هذا النموذج المدمج بعض التعديلات على الخوارزمية الحالية ، لأننا سنحتاج أيضًا إلى التدريب لتحسين خطأ VAE. لاحظ أننا سنقوم بضبط كلاهما وعند التحسين لكل من G_loss و VAE_loss.

خوارزمية CPPN + GAN + VAE لفترة تدريب واحدة:

الحيلة هنا ، هي هيكلة جميع هياكل الشبكات الفرعية وتحقيق التوازن بينها ، بحيث يحوم G_loss و D_loss حول 0.69 ، لذلك يحاولان بشكل متبادل التحسين من خلال قتال بعضهما البعض بمرور الوقت ، والتحسين بنفس المعدل. بالإضافة إلى ذلك ، يجب أن نرى انخفاض VAE_loss بمرور الوقت كل حقبة ، بينما تتصارع الشبكتان الأخريان على بعضهما البعض. إنه نوع من الفن الأسود لتدريب هذه الأشياء والحفاظ على التوازن. يحاول VAE السير عبر لوح خشبي يربط بين زورقين سريعين (G و D) في محاولة للتغلب على بعضهما البعض.

بعد تدريب النموذج ، يمكننا أن نرى نتائج تغذية المتجهات العشوائية لـ Z ، المأخوذة من وحدة التوزيع الغاوسي ، إلى شبكة G الخاصة بنا ، ويمكننا إنشاء بعض الصور العشوائية الكبيرة. دعونا نرى ما ينتهي بنا المطاف مع!

نواقل كامنة عشوائية

يمكننا إنشاء بعض العينات الكبيرة العشوائية من نموذجنا المدرب في IPython:

يمكننا أن نرى كيف تأخذ شبكة المولدات الخاصة بنا أي متجه عشوائي Z ، يتكون من 32 رقمًا حقيقيًا ، وتولد صورة عشوائية تشبه إلى حد ما رقمًا رقميًا بناءً على قيم Z.

الشيء التالي الذي نريد تجربته هو مقارنة أمثلة MNIST الفعلية بالأمثلة المشفرة تلقائيًا. أي ، التقط صورة MNIST عشوائية ، وقم بتشفير الصورة إلى متجه كامن Z ، ثم قم بإنشاء الصورة مرة أخرى. سنقوم أولاً بإنشاء الصورة بنفس أبعاد المثال (26 × 26) ، ثم صورة أكبر 50 مرة (1300 × 1300) لرؤية الشبكة تخيل الشكل الذي يجب أن تبدو عليه MNIST إذا كانت أكبر بكثير.

أولاً ، نرسم صورة عشوائية من MNIST ونعرضها.

ثم نقوم بترميز تلك الصورة إلى Z.

من Z ، نقوم بإنشاء صورة إعادة بناء بحجم 26 × 26.

يمكننا أيضًا إنشاء صورة إعادة بناء أكبر بكثير باستخدام نفس Z.

يبدو أن بنية VAE + GAN الحالية تنتج نسخًا ضبابية من صورة MNIST عندما نقوم بتوسيع نطاقها ، مثل محاولة رسم شيء من الدخان.

يوجد أدناه المزيد من المقارنات بين الأمثلة المشفرة تلقائيًا مقابل النسخ الأصلية. أحيانًا ترتكب الشبكة أخطاء ، لذلك فهي ليست مثالية هناك مثال على أن الصفر يساء تفسيره على أنه ستة ، والثالث يفسد تمامًا. يمكنك محاولة إنشاء عينات الكتابة الخاصة بك وإدخال صورة في IPython لمعرفة الأمثلة التي تم ترميزها تلقائيًا. ربما يمكنني في المستقبل عمل عرض جافا سكريبت للقيام بذلك.

العينات المشفرة تلقائيًا

كما تمت مناقشته سابقًا ، يمكن تفسير Latent Z Vector على أنه نسخة مشفرة مضغوطة من الصور الفعلية ، مثل إصدار غير خطي من PCA. مضمنة في هذه الأرقام الـ 32 هي معلومات لا تحتوي فقط على الرقم الذي تمثله الصورة ، ولكن أيضًا معلومات أخرى ، مثل حجم الصورة ونمطها واتجاهها. لا يكتب الجميع بنفس الطريقة ، فالبعض يكتبها بحلقة ، أو بدون حلقة ، وبعض الناس يكتبون أرقامًا أكبر من الآخرين ، بضربة قلم أكثر عدوانية. نرى أن برنامج التشفير التلقائي يمكنه التقاط معظم هذه المعلومات بنجاح ، وإعادة إنتاج نسخة من الصورة الأصلية. قد يكون القياس هو قيام شخص بالنظر إلى صورة ما ، وتدوين الملاحظات لوصف الصورة بتفصيل كبير ، ثم جعل شخص آخر يقوم بإعادة إنتاج الصورة الأصلية من الملاحظات.


أمثلة على المهام

أمثلة على مهام الطائرة

حل: | أ | = √ 2 2 + 4 2 = √ 4 + 16 = 20 = 2√ 5.

حل: | أ | = √ 3 2 + (-4) 2 = √ 9 + 16 = √ 25 = 5.

أمثلة على المهام المكانية

حل: | أ | = √ 2 2 + 4 2 + 4 2 = √ 4 + 16 + 16 = √ 36 = 6.

حل: | أ | = √ (-1) 2 + 0 2 + (-3) 2 = 1 + 0 + 9 = √ 10.

أمثلة على مهام الفضاء ذات الأبعاد

حل: | أ | = √ 1 2 + (-3) 2 + 3 2 + (-1) 2 = √ 1 + 9 + 9 + 1 = √ 20 = 2√ 5

حل: | أ | = √ 2 2 + 4 2 + 4 2 + 6 2 + 2 2 = √ 4 + 16 + 16 + 36 + 4 = √ 76 = 2√ 19.

مرحبا بكم في OnlineMSchool. مالك موقع الويب هذا هو عالم الرياضيات Dovzhyk Mykhailo. لقد صممت موقع الويب هذا وكتبت جميع النظرية الرياضية والتمارين والصيغ والآلات الحاسبة عبر الإنترنت


شاهد الفيديو: مقدمة مراجعة مادة الرياضيات العلمي توجيهي #2004 للاستاذ احمد عرابي (شهر اكتوبر 2021).