لمحة عن GOAT.AI - Task to AI Agents
التنسيق الموجه نحو الهدف لمهام الوكيل. في الأساس، سيتواصل وكلاء الذكاء الاصطناعي مع بعضهم البعض لتنفيذ مهمتك.
مثال: "اختر أفضل يوم في الشهر القادم لسباق نصف ماراثون بطول 20 كم". سيبدأ الذكاء الاصطناعي في التعاون: يقوم وكيل الطقس باسترداد التوقعات، ويحدد وكيل بحث الويب ظروف التشغيل المثالية، ويحسب وكيل Wolfram "أفضل يوم". إنه فن الذكاء الاصطناعي المتصل، الذي يبسط المهام المعقدة مع التطور.
يعد LLMs باعتباره الإطار الرئيسي المركزي للوكلاء المستقلين مفهومًا مثيرًا للاهتمام. تعتبر العروض التوضيحية مثل AutoGPT وGPT-Engineer وBabyAGI بمثابة أمثلة توضيحية بسيطة لهذه الفكرة. تمتد إمكانات LLM إلى ما هو أبعد من إنشاء أو إكمال نسخ وقصص ومقالات وبرامج مكتوبة جيدًا؛ يمكن تصنيفهم على أنهم حلول قوية للمهام العامة، وهذا ما نهدف إلى تحقيقه في بناء التنسيق الموجه نحو الأهداف لفريق عمل الوكلاء (GOAT.AI)
لكي يكون التنسيق الموجه نحو الهدف لنظام فريق عمل وكيل LLM موجودًا ويعمل بشكل صحيح، يجب أن تعمل ثلاثة مكونات أساسية رئيسية للنظام بشكل صحيح
- ملخص
1) التخطيط
- الهدف الفرعي والتحليل: يقوم الوكيل بتقسيم المهام الكبيرة إلى أهداف فرعية أصغر يمكن التحكم فيها، مما يسهل التعامل مع المهام المعقدة بكفاءة.
- التفكير والصقل: ينخرط الوكيل في النقد الذاتي والتأمل الذاتي في الإجراءات الماضية، ويتعلم من الأخطاء، ويحسن أساليب الخطوات المستقبلية، وبالتالي تعزيز الجودة الشاملة للنتائج.
2) الذاكرة
- الذاكرة قصيرة المدى: تشير إلى مقدار النص الذي يستطيع النموذج معالجته قبل الإجابة دون أي تدهور في الجودة. في الوضع الحالي، يمكن لـ LLM تقديم إجابات دون أي انخفاض في الجودة لما يقرب من 128 ألف رمز مميز.
- الذاكرة طويلة المدى: تمكن الوكيل من تخزين واستدعاء كمية غير محدودة من المعلومات للسياق على مدى فترات طويلة. يتم تحقيق ذلك غالبًا باستخدام مخزن متجه خارجي لأنظمة RAG الفعالة.
3) مساحة العمل
- يكتسب الوكيل القدرة على استدعاء واجهات برمجة التطبيقات الخارجية للحصول على معلومات إضافية غير متوفرة في أوزان النموذج (والتي غالبًا ما يصعب تعديلها بعد التدريب المسبق). يتضمن ذلك الوصول إلى المعلومات الحالية، وتنفيذ التعليمات البرمجية، والوصول إلى مصادر المعلومات الخاصة، والأهم من ذلك: استدعاء وكلاء آخرين لاسترجاع المعلومات.
- تشمل مساحة العمل أيضًا الإجراءات التي لا تهدف إلى استرجاع شيء ما، بل تتضمن تنفيذ إجراءات محددة والحصول على النتيجة الناتجة. تتضمن أمثلة هذه الإجراءات إرسال رسائل البريد الإلكتروني، وتشغيل التطبيقات، وفتح الأبواب الأمامية، والمزيد. يتم تنفيذ هذه الإجراءات عادةً من خلال واجهات برمجة التطبيقات المختلفة. بالإضافة إلى ذلك، من المهم ملاحظة أن الوكلاء يمكنهم أيضًا استدعاء وكلاء آخرين للأحداث القابلة للتنفيذ التي يمكنهم الوصول إليها.
مثال: "اختر أفضل يوم في الشهر القادم لسباق نصف ماراثون بطول 20 كم". سيبدأ الذكاء الاصطناعي في التعاون: يقوم وكيل الطقس باسترداد التوقعات، ويحدد وكيل بحث الويب ظروف التشغيل المثالية، ويحسب وكيل Wolfram "أفضل يوم". إنه فن الذكاء الاصطناعي المتصل، الذي يبسط المهام المعقدة مع التطور.
يعد LLMs باعتباره الإطار الرئيسي المركزي للوكلاء المستقلين مفهومًا مثيرًا للاهتمام. تعتبر العروض التوضيحية مثل AutoGPT وGPT-Engineer وBabyAGI بمثابة أمثلة توضيحية بسيطة لهذه الفكرة. تمتد إمكانات LLM إلى ما هو أبعد من إنشاء أو إكمال نسخ وقصص ومقالات وبرامج مكتوبة جيدًا؛ يمكن تصنيفهم على أنهم حلول قوية للمهام العامة، وهذا ما نهدف إلى تحقيقه في بناء التنسيق الموجه نحو الأهداف لفريق عمل الوكلاء (GOAT.AI)
لكي يكون التنسيق الموجه نحو الهدف لنظام فريق عمل وكيل LLM موجودًا ويعمل بشكل صحيح، يجب أن تعمل ثلاثة مكونات أساسية رئيسية للنظام بشكل صحيح
- ملخص
1) التخطيط
- الهدف الفرعي والتحليل: يقوم الوكيل بتقسيم المهام الكبيرة إلى أهداف فرعية أصغر يمكن التحكم فيها، مما يسهل التعامل مع المهام المعقدة بكفاءة.
- التفكير والصقل: ينخرط الوكيل في النقد الذاتي والتأمل الذاتي في الإجراءات الماضية، ويتعلم من الأخطاء، ويحسن أساليب الخطوات المستقبلية، وبالتالي تعزيز الجودة الشاملة للنتائج.
2) الذاكرة
- الذاكرة قصيرة المدى: تشير إلى مقدار النص الذي يستطيع النموذج معالجته قبل الإجابة دون أي تدهور في الجودة. في الوضع الحالي، يمكن لـ LLM تقديم إجابات دون أي انخفاض في الجودة لما يقرب من 128 ألف رمز مميز.
- الذاكرة طويلة المدى: تمكن الوكيل من تخزين واستدعاء كمية غير محدودة من المعلومات للسياق على مدى فترات طويلة. يتم تحقيق ذلك غالبًا باستخدام مخزن متجه خارجي لأنظمة RAG الفعالة.
3) مساحة العمل
- يكتسب الوكيل القدرة على استدعاء واجهات برمجة التطبيقات الخارجية للحصول على معلومات إضافية غير متوفرة في أوزان النموذج (والتي غالبًا ما يصعب تعديلها بعد التدريب المسبق). يتضمن ذلك الوصول إلى المعلومات الحالية، وتنفيذ التعليمات البرمجية، والوصول إلى مصادر المعلومات الخاصة، والأهم من ذلك: استدعاء وكلاء آخرين لاسترجاع المعلومات.
- تشمل مساحة العمل أيضًا الإجراءات التي لا تهدف إلى استرجاع شيء ما، بل تتضمن تنفيذ إجراءات محددة والحصول على النتيجة الناتجة. تتضمن أمثلة هذه الإجراءات إرسال رسائل البريد الإلكتروني، وتشغيل التطبيقات، وفتح الأبواب الأمامية، والمزيد. يتم تنفيذ هذه الإجراءات عادةً من خلال واجهات برمجة التطبيقات المختلفة. بالإضافة إلى ذلك، من المهم ملاحظة أن الوكلاء يمكنهم أيضًا استدعاء وكلاء آخرين للأحداث القابلة للتنفيذ التي يمكنهم الوصول إليها.
المزيد