الرجوع للصفحة الرئيسية|الذكاء الاصطناعي|عاجل١٧ مايو ٢٠٢٦

هل تصبح "توجيه النماذج" اللغوية هي الطريقة القادمة للتحكم في الذكاء الاصطناعي؟

مع ظهور أدوات مثل DwarfStar 4، أصبح التلاعب المباشر بنشاط النماذج اللغوية "التوجيه" موضوعاً ساخناً. هل يمكننا استبدال الأوامر النصية بمقابض تحكم داخلية؟

هل تصبح "توجيه النماذج" اللغوية هي الطريقة القادمة للتحكم في الذكاء الاصطناعي؟

النقاط الرئيسية

DeepSeek-V4-Flash يمثل نموذجاً محلياً قوياً ينافس نماذج البرمجة المتقدمة.
مشروع DwarfStar 4 يدمج تقنيات "التوجيه" (Steering) كأداة أساسية للمطورين.
التوجيه يسمح بالتحكم في سلوك النموذج عبر التلاعب بمتجهات التنشيط الداخلية.
يمكن استغلال التوجيه لإزالة قيود الرفض في النماذج دون الحاجة لإعادة التدريب.
هناك تساؤلات حول ما إذا كان التوجيه قادراً على تحسين "ذكاء" النموذج أم أنه مجرد بديل للأوامر النصية.

لطالما استحوذت فكرة "التوجيه" (Steering) على اهتمامي منذ أن رأينا نماذج مثل Golden Gate Claude ، حيث يمكنك توجيه مخرجات النموذج عبر التلاعب المباشر بنشاطه الداخلي أثناء التشغيل. تخيل أنك لا تكتفي بطلب شيء من الذكاء الاصطناعي عبر النص، بل تتدخل في "دماغه" الرقمي لتعزيز مفاهيم معينة. اليوم، ومع ظهور DeepSeek-V4-Flash ، يبدو أن هذا المجال ينتقل من كونه تجربة أكاديمية معقدة إلى أداة عملية للمهندسين. لقد أثار مشروعي المفضل مؤخراً، DwarfStar 4، فضولي بشكل كبير. إنه إصدار مبسط من llama.cpp مخصص لتشغيل DeepSeek-V4-Flash فقط. ما يجعل هذا النموذج استثنائياً هو أنه يمثل ما كان ينتظره الكثير من المهندسين: نموذج محلي قوي بما يكفي للمنافسة في مهام البرمجة الوكيلة (agentic coding) التي كانت حكراً على النماذج الضخمة. ولأن التوجيه يتطلب وصولاً كاملاً للنموذج محلياً، فقد دمج المطور antirez تقنيات التوجيه كجزء أساسي داخل DwarfStar 4. ورغم أن هذه الميزات لا تزال في مراحلها الأولى، إلا أنها تفتح الباب لمستقبل مختلف تماماً في كيفية التعامل مع الأوزان المفتوحة. كيف يعمل التوجيه تقنياً؟ الفكرة الجوهرية تكمن في استخراج مفهوم معين من الحالة الداخلية للنموذج—مثل "الرد بإيجاز"—ثم تعزيز التنشيطات الرقمية المرتبطة بهذا المفهوم أثناء الاستنتاج. إحدى الطرق البدائية هي إدخال مائة أمر مرتين، مرة بشكل طبيعي ومرة مضافاً إليها عبارة "رد بإيجاز"، ثم قياس الفرق في مصفوفات التنشيط. هذا الفرق هو ما نسميه "متجه التوجيه" (steering vector). نظرياً، يمكنك إضافة هذا المتجه إلى أي طبقة تنشيط لتحصل على النتيجة المطلوبة في أي وقت. هناك طرق أكثر تعقيداً، مثل التي تستخدمها Anthropic عبر "المشفرات التلقائية المتفرقة" (sparse autoencoders)، حيث يتم تدريب نموذج ثانٍ لاستخراج أنماط سلوكية معقدة من التنشيطات. هذا يتطلب موارد حوسبية أكبر وخبرة أعمق، لكنه يسمح بالتقاط تفاصيل دقيقة لا يمكن للمقاربات البسيطة الوصول إليها. في رأيي، التوجيه يبدو كأنه "شفرة غش" في لعبة فيديو؛ بدلاً من قضاء ساعات في بناء مجموعات بيانات ضخمة لتدريب النموذج على سلوك معين، نقوم ببساطة بتحديد "مقبض" الذكاء أو الإيجاز داخل الدماغ الرقمي ونقوم بتحريكه. لماذا لا نرى لوحات تحكم للتوجيه في ChatGPT أو Claude ؟ السبب هو أن التوجيه يقع في منطقة "الطبقة المتوسطة" في أبحاث الذكاء الاصطناعي. المختبرات الكبرى مثل OpenAI لا تحتاج لعمليات جراحية في منتصف الاستنتاج لأنها تتحكم في التدريب نفسه. أما نحن كمستخدمين عاديين، فلا نملك وصولاً إلى أوزان النماذج المغلقة، وبالتالي يظل التوجيه حبيس النماذج مفتوحة الأوزان. علاوة على ذلك، يجادل البعض بأن التوجيه قد لا يكون ضرورياً في كثير من الحالات؛ فأنت تستطيع الحصول على تحكم دقيق جداً عبر "هندسة الأوامر" (prompt engineering). لماذا تعقد الأمور إذا كان بإمكانك ببساطة أن تطلب من النموذج أن يكون مختصراً؟ ومع ذلك، تبرز قيمة التوجيه عندما نواجه مفاهيم لا يمكن طلبها نصياً. هل يمكنك طلب "الذكاء" من نموذج؟ ربما، لكن النماذج الحديثة تملك هذا السلوك متأصلاً. هنا، قد يكون التوجيه هو الحل الوحيد. لكنني أظل متشككاً؛ فمفهوم "الذكاء" قد يكون متشابكاً مع كامل أوزان النموذج لدرجة أن محاولة استخراجه كمتجه توجيه قد تنتهي بكونها عملية تدريب نموذج جديد بالكامل. إذا قمت باستبدال نشاطات نموذج ضعيف بنشاطات نموذج قوي، فأنت لم تجعل النموذج الأول ذكياً، بل قمت ببساطة باستبداله. من ناحية أخرى، قد يعمل التوجيه كأداة "ضغط بيانات". تخيل لو استطعنا استخراج معرفة النموذج بـ "قاعدة الأكواد البرمجية الخاصة بك" في متجه توجيه ضخم بدلاً من حشو سياق النموذج (context window) بآلاف السطور. لا أعتقد أن هذا سهل، ولكن الفكرة مثيرة. هل سنرى مكتبات من "الميزات القابلة للتعزيز" (boostable features) لكل نموذج مشهور؟ هذا ما أتوقعه في الأشهر الستة القادمة. أحد الأمور التي تعلمتها من مجتمع المطورين، بما في ذلك نقاشات antirez على Hacker News ، هو أن التوجيه يمكنه إزالة "الرفض" أو القيود التي يضعها المطورون بطريقة لا تستطيع الأوامر النصية القيام بها. هذا يجعله بديلاً قوياً لعمليات "إلغاء الرقابة" (uncensoring) التي كانت تعتمد سابقاً على تعديل الأوزان (LoRA)، وهو إجراء قد يتلف قدرات النموذج. التوجيه يبدو أكثر خفة وأماناً لأنه يطبق فقط عند الحاجة. في النهاية، أنا منبهر بالتوجيه لكنني لست متفائلاً جداً بقدرته على استبدال التدريب التقليدي. أغلب المكاسب يمكن تحقيقها عبر الأوامر الذكية، والأهداف الطموحة تتطلب تدريباً فعلياً. ولكن مع دخول المجتمع مفتوح المصدر على الخط، قد نكتشف تطبيقات عملية لم نكن نتخيلها. هل سيصبح التوجيه المعيار الجديد للتحكم في نماذج الذكاء الاصطناعي المحلية؟ أم أنه مجرد ترف تقني سينتهي به المطاف كأداة للمتخصصين فقط؟ الأيام القادمة ستحمل الإجابة.

ما هو التوجيه (Steering) ولماذا يهمنا؟

التوجيه هو تقنية تتيح للمطورين تعديل مخرجات النموذج اللغوي عبر الوصول إلى حالاته الداخلية. بدلاً من الاعتماد فقط على التعليمات النصية، نقوم بتعزيز أنماط تنشيط معينة داخل العصبونات الرقمية للنموذج لضمان سلوك متسق. بالنسبة للمهندسين، هذا يعني القدرة على ضبط "مقابض" مثل الإيجاز أو الدقة بشكل مباشر. إنه يمثل تحولاً من التعامل مع الذكاء الاصطناعي كصندوق أسود إلى فهم كيفية عمله من الداخل وتطويعه لخدمة مهام محددة.

مستقبل DwarfStar 4 والنماذج المحلية

مشروع DwarfStar 4 يغير قواعد اللعبة من خلال توفير منصة بسيطة لتشغيل DeepSeek-V4-Flash مع أدوات توجيه مدمجة. هذا يقلل من حاجز الدخول للمطورين الذين يرغبون في استكشاف قدرات النماذج مفتوحة الأوزان. أرى أن هذا التوجه سيعزز من قدرة المجتمع على بناء "مكتبات ميزات" قابلة للتطبيق على النماذج، مما يقلل الاعتماد على النماذج المغلقة التي تتحكم فيها الشركات الكبرى فقط.

صيغ هذا المقال بمساعدة الذكاء الاصطناعي وروجِع تحريريًا قبل النشر. المصادر مذكورة أدناه.

عن الكاتب

عبدالله الجاسر

المؤسس

مهندس صناعي | مؤسس منصة نيوزلي | شغوف بالتقنية والذكاء الاصطناعي

كل مقالات الكاتب

المصادر

Sean Goedecke's Blog