كيفية ضبط نموذج الذكاء الاصطناعي
📖 8 دقيقة قراءة
Quick Answer
الضبط الدقيق هو كيفية تحويل نموذج عام مفتوح إلى نموذج خاص بك، نموذج يجيب بصوتك، أو يعرف مجالك، أو يؤدي مهمة ضيقة بشكل أفضل بكثير من القاعدة. الخبر السار لعام 2026: بفضل LoRA والتكميم، لم تعد بحاجة إلى مركز بيانات. يمكن لوحدة معالجة رسومات واحدة وبضع مئات من الأمثلة الجيدة أن تصلك إلى هناك.
🛠️ مقارنة مفيدة
المطالبة هي إعطاء تعليمات للموظف لمهمة واحدة. تقوم RAG بتسليمهم ملفًا مرجعيًا للبحث عن الأمور. الضبط الدقيق هو إرسالهم إلى دورة تدريبية بحيث تصبح المهارة طبيعة ثانية. كل منها يناسب مشكلة مختلفة، ومعرفة ما يجب الوصول إليه يوفر الوقت والمال.
LoRA: الإنجاز الذي جعلها رخيصة الثمن
يقوم الضبط الدقيق الكامل بتحديث كل معلمة متعطشة للذاكرة. يقوم LoRA (التكيف منخفض الرتبة) بتجميد النموذج الأصلي وتدريب مجموعة صغيرة فقط من أوزان "المحول" الجديدة، مما يقلل الذاكرة والتكلفة بأوامر من حيث الحجم مع الحفاظ على معظم الجودة. يضيف QLoRA التكميم (تخزين الأرقام بدقة أقل) بحيث تتناسب حتى النماذج الكبيرة مع وحدة معالجة رسومات مستهلكة واحدة. هذا هو المسار القياسي اليوم.
بناء مجموعة البيانات الخاصة بك
حدد التنسيق الذي يطابق هدفك، وعادةً ما يكون عبارة عن أزواج من التعليمات والإجابة. استهدف الجودة والاتساق على الرغم من الحجم الهائل: بضع مئات إلى بضعة آلاف من الأمثلة التمثيلية النظيفة غالبًا ما تتفوق على عشرات الآلاف من الأمثلة الصاخبة. قم بإزالة التكرارات، وأصلح الأخطاء، وتأكد من أن الأمثلة توضح بالفعل السلوك الذي تريده.
عندما لا لصقل
إذا كنت تريد النموذج فقط لاستخدام حقائق جديدة أو خاصة، فعادةً ما يكون الاسترجاع (RAG) أفضل وأرخص، ويمكنك إضافة المستندات التي يقرأها النموذج في وقت الاستعلام، دون إعادة التدريب. إذا كانت المطالبة الجيدة تعمل بالفعل، فاستخدمها. قم بالضبط الدقيق عندما تحتاج إلى أسلوب متسق، أو مهارة متخصصة، أو نموذج أصغر لتجاوز وزنه.
سير العمل من النهاية إلى النهاية
اختر نموذجًا أساسيًا مفتوحًا، وقم بإعداد مجموعة البيانات الخاصة بك، وقم بإجراء ضبط دقيق لـ LoRA (تقوم المكتبات ودفاتر الملاحظات المجانية بتنفيذ بعض الأوامر)، وقم بالتقييم على الأمثلة المعلقة، ثم قم بدمج المحول أو تحميله للاستدلال. قم بتشغيل النتيجة محليًا باستخدام Ollama أو قم بتقديمها بشكل خاص. الحلقة سريعة بما يكفي للتكرار في فترة ما بعد الظهر بمجرد أن تصبح بياناتك جاهزة.
🔑 الوجبات الجاهزة الرئيسية
يتيح لك الضبط الدقيق باستخدام LoRA أو QLoRA تخصيص نموذج مفتوح على وحدة معالجة رسومات واحدة مقابل القليل جدًا من المال. يعتمد النجاح على مجموعة بيانات نظيفة وجيدة التنسيق أكثر بكثير من اعتماده على الحوسبة الأولية. يمكنك الوصول إلى الضبط الدقيق عندما تحتاج إلى أسلوب ثابت أو مهارة محدودة، واستخدم RAG بدلاً من ذلك عندما تحتاج فقط إلى النموذج لمعرفة حقائق جديدة.
لماذا هذا مهم بالنسبة لك
يعد النموذج الصغير الذي تم ضبطه بدقة والذي يتم تشغيله محليًا مثاليًا للشركات الآسيوية التي تتعامل مع بيانات العملاء الحساسة بموجب قواعد الخصوصية أو إقامة البيانات الصارمة. تحصل على الذكاء الاصطناعي الذي يتحدث لغتك ومجالك، ويبقى على أجهزتك، ولا يرسل أبدًا سجل العميل إلى خادم أجنبي.
الأسئلة المتداولة
ما الفرق بين LoRA والضبط الدقيق الكامل؟▼
يقوم الضبط الدقيق الكامل بتحديث جميع معلمات النموذج ويحتاج إلى الكثير من ذاكرة وحدة معالجة الرسومات. تقوم LoRA بتدريب أوزان المحولات المضافة الصغيرة فقط أثناء تجميد النسخة الأصلية، مما يحقق نتائج مماثلة مقابل جزء صغير من الذاكرة والتكلفة. تذهب QLoRA إلى أبعد من ذلك من خلال تحديد حجم النموذج بحيث تتناسب حتى النماذج الكبيرة مع وحدة معالجة رسومات مستهلكة واحدة.
هل يجب أن أقوم بضبط RAG أو استخدامه؟▼
استخدم RAG عندما يحتاج النموذج فقط إلى الوصول إلى حقائق جديدة أو خاصة، فهو يقرأ المستندات في وقت الاستعلام، دون الحاجة إلى إعادة التدريب. قم بالضبط الدقيق عندما تحتاج إلى أسلوب أو نغمة أو مهارة متخصصة مدمجة في النموذج نفسه. تجمع العديد من الأنظمة الحقيقية بين الاثنين.
كم عدد الأمثلة التي أحتاجها؟▼
في كثير من الأحيان أقل مما يتوقعه الناس. بضع مئات إلى بضعة آلاف من الأمثلة المتسقة عالية الجودة يمكن أن تنتج ضبطًا قويًا. إن جودة البيانات وتنسيقها أهم بكثير من الكمية الأولية.