صقل (تعلم الآلة)
من الشائع الاحتفاظ بالطبقات السابقة (تلك الأقرب إلى طبقة الإدخال) مجمدة في بعض المعماريات، مثل الشبكات العصبية الالتفافية، لأنها تلتقط ميزات ذات مستوى أدنى، في حين أن الطبقات اللاحقة غالبًا ما تتميز بميزات عالية المستوى يمكن أن تكون أكثر ارتباطًا بـ المهمة التي دُرّب النموذج عليها.[4][5] يجري الصقل عادةً من خلال التعلم المراقب، ولكن ثمة تقنيات لضبط النموذج باستخدام تعلم مراقب ضعيف أيضًا.[6] يستخدم التعلم بالتعزيز أيضًا لضبط نماذج اللغة مثل دردشة ج.ب.ت (نسخة دقيقة من GPT-3) وSparrow عن طريق التعليم المعزز من ردود الفعل البشرية.[7][8] التكيف المنخفض الرتبةيعد التكيف منخفض الرتبة (LoRA) تقنية لضبط النماذج بكفاءة. الفكرة الأساسية هي تصميم مصفوفة ذات رتبة منخفضة تضاف بعد ذلك إلى المصفوفة الأصلية.[9] مراجع
|