صقل (تعلم الآلة)


الصقل أو الضبط الدقيق[1] في التعلم الآلي طريقة لنقل التعلم حيث يجري تدريب نموذج مدرب مسبقًا على بيانات جديدة.[2] يمكن إجراء الصقل على الشبكة العصبية بأكملها، أو على مجموعة فرعية فقط من طبقاتها، وفي هذه الحالة "تُجمّد" الطبقات التي لم تُصقَل (لم تُحدّث أثناء خطوة الانتشار العكسي).[3]

من الشائع الاحتفاظ بالطبقات السابقة (تلك الأقرب إلى طبقة الإدخال) مجمدة في بعض المعماريات، مثل الشبكات العصبية الالتفافية، لأنها تلتقط ميزات ذات مستوى أدنى، في حين أن الطبقات اللاحقة غالبًا ما تتميز بميزات عالية المستوى يمكن أن تكون أكثر ارتباطًا بـ المهمة التي دُرّب النموذج عليها.[4][5]

يجري الصقل عادةً من خلال التعلم المراقب، ولكن ثمة تقنيات لضبط النموذج باستخدام تعلم مراقب ضعيف أيضًا.[6] يستخدم التعلم بالتعزيز أيضًا لضبط نماذج اللغة مثل دردشة ج.ب.ت (نسخة دقيقة من GPT-3) وSparrow عن طريق التعليم المعزز من ردود الفعل البشرية.[7][8]

التكيف المنخفض الرتبة

يعد التكيف منخفض الرتبة (LoRA) تقنية لضبط النماذج بكفاءة. الفكرة الأساسية هي تصميم مصفوفة ذات رتبة منخفضة تضاف بعد ذلك إلى المصفوفة الأصلية.[9]

مراجع

  1. ^ معجم البيانات والذكاء الاصطناعي (PDF) (بالعربية والإنجليزية)، الهيئة السعودية للبيانات والذكاء الاصطناعي، 2022، ص. 68، QID:Q111421033
  2. ^ Quinn، Joanne (2020). Dive into deep learning: tools for engagement. Thousand Oaks, California. ص. 551. ISBN:978-1-5443-6137-6. مؤرشف من الأصل في 2023-01-10. اطلع عليه بتاريخ 2023-01-10.{{استشهاد بكتاب}}: صيانة الاستشهاد: مكان بدون ناشر (link)
  3. ^ "CS231n Convolutional Neural Networks for Visual Recognition". cs231n.github.io. مؤرشف من الأصل في 2023-03-23. اطلع عليه بتاريخ 2023-03-09.
  4. ^ "CS231n Convolutional Neural Networks for Visual Recognition". cs231n.github.io. مؤرشف من الأصل في 2023-03-23. اطلع عليه بتاريخ 2023-03-09.
  5. ^ Zeiler، Matthew D؛ Fergus، Rob (2013). "Visualizing and Understanding Convolutional Networks". arXiv:1311.2901. {{استشهاد بدورية محكمة}}: الاستشهاد بدورية محكمة يطلب |دورية محكمة= (مساعدة)
  6. ^ Yu، Yue؛ Zuo، Simiao؛ Jiang، Haoming؛ Ren، Wendi؛ Zhao، Tuo؛ Zhang، Chao (2020). "Fine-Tuning Pre-trained Language Model with Weak Supervision: A Contrastive-Regularized Self-Training Approach". arXiv:2010.07835. {{استشهاد بدورية محكمة}}: الاستشهاد بدورية محكمة يطلب |دورية محكمة= (مساعدة)
  7. ^ "Introducing ChatGPT". openai.com. مؤرشف من الأصل في 2023-04-10. اطلع عليه بتاريخ 2023-03-09.
  8. ^ Glaese، Amelia؛ McAleese، Nat؛ Trębacz، Maja؛ Aslanides، John؛ Firoiu، Vlad؛ Ewalds، Timo؛ Rauh، Maribeth؛ Weidinger، Laura؛ Chadwick، Martin (2022). "Improving alignment of dialogue agents via targeted human judgements". arXiv:2209.14375. {{استشهاد بدورية محكمة}}: الاستشهاد بدورية محكمة يطلب |دورية محكمة= (مساعدة)
  9. ^ Hu, Edward J.; Shen, Yelong; Wallis, Phillip; Allen-Zhu, Zeyuan; Li, Yuanzhi; Wang, Shean; Wang, Lu; Chen, Weizhu (28 Jan 2022). "LoRA: Low-Rank Adaptation of Large Language Models" (بالإنجليزية). Archived from the original on 2023-03-15. {{استشهاد بدورية محكمة}}: الاستشهاد بدورية محكمة يطلب |دورية محكمة= (help)