أخبار ar.wedoany.com، طوّر مختبر أبحاث مايكروسوفت نظاماً للذاكرة طويلة المدى يُدعى "ميمورا" (Memora)، يهدف إلى تزويد الوكلاء الذكاء الاصطناعي بقدرات ذاكرة أكثر قابلية للتوسع والموثوقية من خلال فصل محتوى الذاكرة عن آلية الاسترجاع.

مع احتياج وكلاء الذكاء الاصطناعي إلى الاحتفاظ بذاكرة السياق على مدى أسابيع أو أشهر، بدلاً من معالجة جلسة واحدة فقط، تؤدي طرق الذاكرة التقليدية إلى تجزئة المعلومات وتباطؤ الاسترجاع. وأوضح مختبر أبحاث مايكروسوفت أن "ميمورا" يمكنها تقليل استخدام رموز السياق بنسبة تصل إلى 98%، مع الحفاظ على دقة السياق الكامل أو تجاوزها، وذلك بفضل فصل محتوى الذاكرة عن آلية الاسترجاع.
تواجه عمليات النشر طويلة المدى للذكاء الاصطناعي حالياً اختناقات في أنظمة الذاكرة. تبدأ نماذج اللغات الكبيرة الحديثة كل جلسة من الصفر، وتتطلب المحادثات الطويلة إعادة قراءة التاريخ بالكامل بشكل متكرر، ويتم تخزين المعلومات الجديدة كنص خام أو ملخصات، مما قد يؤدي إلى فقدان التفاصيل الحيوية.
للحلول الحالية قيودها الخاصة. يستخلص نظام "ميمو" (Mem0) الحقائق الذرية من المحادثات، وتقوم طريقة التوليد المعزز بالاسترجاع (RAG) بفهرسة أجزاء النص، بينما تبني أنظمة الذاكرة القائمة على الرسوم البيانية (مثل "زيب" Zep و"غراف آر إيه جي" GraphRAG) هياكل من خلال علاقات الكيانات. لكن هذه الأساليب تقع بين نقيضين: الأنظمة التي تجزئ المحتوى (مثل RAG وMem0) تحتفظ بالتفاصيل لكنها تفقد الترابط السردي؛ بينما تقوم أنظمة التجريد الخشنة بضغط التجارب لكنها تفقد القيود والتفاصيل الرقمية؛ أما الأنظمة القائمة على الرسوم البيانية فتحتاج إلى أنطولوجيا صارمة ويعتمد استرجاعها على المحتوى نفسه.
تعالج بنية "ميمورا" هذه المشكلات من خلال فصل المحتوى المخزن عن آلية الاسترجاع. يحتوي كل إدخال ذاكرة على جزأين: الجزء الرئيسي هو عبارة مختصرة من 6 إلى 8 كلمات تلتقط المحتوى الأساسي للذاكرة؛ بينما تحتوي قيمة الذاكرة على المحتوى الغني نفسه. سيتم دمج المعلومات الجديدة المتعلقة بنفس الموضوع في إدخالات الذاكرة الحالية، مما يمنع التجزئة. بالإضافة إلى ذلك، يقدم النظام "نقاط ارتكاز دليلية"، وهي علامات مختصرة ومراعية للسياق تُستخرج من كل قيمة ذاكرة، لتوفير مسارات وصول بديلة لنفس الذاكرة.
تتضمن "ميمورا" أيضاً أداة استرجاع موجهة بالاستراتيجية، والتي لا تعيد العناصر الأعلى تشابهاً دفعة واحدة، بل تعمل على تحسين الاستعلام بشكل متكرر من خلال نقاط الارتكاز الدليلية، لتقديم ذكريات ذات صلة ولكنها غير متشابهة، وتقرر متى تتوقف. قال سانشيت فير غوغيا، المحلل الرئيسي في شركة "غريهاوند ريسيرش" (Greyhound Research): "ترفض ميمورا الاختصار الذي يساوي بين الاسترجاع والذاكرة، وتفصل التفاصيل الغنية للذاكرة عن مقابض البحث، ليصبح الاسترجاع سلوكاً تنقّلاً."
قامت مايكروسوفت بتقييم "ميمورا" على معياريين: "لوكومو" (LoCoMo) بمتوسط 600 جولة حوار، و"لونغ ميم إيفال" (LongMemEval) باستخدام سياق 115,000 رمز. أظهرت نتائج الاختبار أن "ميمورا" حققت دقة تقييم بنماذج اللغات الكبيرة بنسبة 86.3% على "لوكومو"، و87.4% على "لونغ ميم إيفال"، متجاوزة بذلك أنظمة RAG وMem0 وNemori وZep وLangMem والاستدلال بالسياق الكامل. يبلغ عدد إدخالات الذاكرة المخزنة لكل محادثة في "ميمورا" (344 إدخالاً) حوالي نصف ما هو عليه في "ميمو" (651 إدخالاً)، مع تقليل استهلاك الرموز بنسبة تصل إلى 98% مقارنة بالاستدلال بالسياق الكامل.
أشار غوغيا إلى أن انخفاض استهلاك الرموز لا يعني بالضرورة انخفاضاً مماثلاً في تكاليف البنية التحتية. لا يعني تقليل السياق في الاختبارات أن فواتير الشركات ستنخفض بنسبة 98%، فالتكاليف الفعلية تشمل بناء الذاكرة والفهرسة والتخزين وسجلات التدقيق. يستغرق وضع الاسترجاع الاستراتيجي الأقوى في "ميمورا" حوالي خمس إلى ست ثوانٍ لكل استعلام، بينما يستغرق الوضع الدلالي الأبسط أقل من ثانية واحدة، ويتم تعويض جزء من توفير الرموز بتأخير الاسترجاع والاستدلال الإضافي.
"ميمورا" حالياً مشروع نشط في مختبر أبحاث مايكروسوفت، وقد تم نشر كود البحث ذي الصلة على منصة "غيت هاب" (GitHub). نصح غوغيا قادة تكنولوجيا المعلومات باعتبار "ميمورا" بحثاً معمارياً، وليس برنامجاً جاهزاً للإنتاج، ويجب توخي الحذر حتى يصبح كودها قابلاً للتحقق والصيانة والدعم بشكل كامل. بالإضافة إلى ذلك، تحتاج الشركات إلى وضع سياسات الحوكمة والامتثال لضمان الإدارة الآمنة لذكاء الذكاء الاصطناعي وقابليته للتدقيق، بما في ذلك تحديد من يمكنه الكتابة أو القراءة في الذاكرة، ومدة استمرار الذاكرة، وكيف يمكن للمدقق إعادة بناء الذاكرة، وذلك لتلبية متطلبات قانون الذكاء الاصطناعي للاتحاد الأوروبي وقانون حماية البيانات الشخصية الرقمية الهندي وغيرهما من التشريعات.









