هذه مقالة غير مراجعة. ينبغي أن يزال هذا القالب بعد أن يراجعهامحرر؛ إذا لزم الأمر فيجب أن توسم المقالة بقوالب الصيانة المناسبة. يمكن أيضاً تقديم طلب لمراجعة المقالة في الصفحة المخصصة لذلك.(سبتمبر 2020)
الغابة العشوائية أو الغابات العشوائية (بالإنجليزية: Random forest) عبارة عن خوارزمية للتعلم الآلي تم تطويرها بناءً على مجموعة من أشجار القرار.[1][2] تستخدم هذه الخوارزمية للتصنيف، الانحدار ومهام أخرى. عادةً ما تتمتع خوارزمية الغابة العشوائية بدقة أفضل مقارنة بشجرة القرار.[2][3]
تاريخ
أول شخص ابتكر خوارزمية الغابة العشوائية كان تيم هو في 1995. تم تحسين هذه الخوارزمية بواسطة ليو بريمان.[4]
طريقة
لإنشاء غابة عشوائية، يجب تقسيم البيانات إلى مجموعات جزئية عشوائية متعددة. ثم يتم تدريب شجرة لكل مجموعة جزئية. سيكون لكل شجرة تنبؤها الخاصة لكل مثال جديد قادم. سيتم تحديد التنبؤ النهائي للنموذج عن طريق التصويت.[3][5]
أهمية المتغيرات
يمكن لخوارزمية الغابة العشوائية ترتيب المتغيرات بناءً على أهميتها. الصيغة الأساسية لتقييم الأهمية هي نفس صيغة شجرة القرار (على سبيل المثال الانتروبيا أو معامل جيني). الفرق الوحيد هو أنه سيتم حساب متوسط درجات الأهمية للأشجار المختلفة.[1][2]
المراجع
^ ابPiryonesi، S. M.؛ El-Diraby، T. E. (2020) [Published online: December 21, 2019]. "Data Analytics in Asset Management: Cost-Effective Prediction of the Pavement Condition Index". Journal of Infrastructure Systems. ج. 26 ع. 1. DOI:10.1061/(ASCE)IS.1943-555X.0000512.{{استشهاد بدورية محكمة}}: صيانة الاستشهاد: url-status (link)
^ ابجT. Hastie, R. Tibshirani, and J. Friedman, “The Elements of Statistical Learning,” Bayesian Forecast. Dyn. Model., vol. 1, pp. 1–694, 2009.
^Provost, F., & Fawcett, T. (2013). Data Science for Business: What you need to know about data mining and data-analytic thinking. " O'Reilly Media, Inc.".