تقارير ومتابعاتتقنيات جديدة

جعل استرجاع متعددة المستويات أسرع من البحث في المنظمة الواحدة

0:00


كتب – المحرر الإفتراضي

أصبحت نماذج التضمين العصبية حجر الزاوية في استرجاع المعلومات الحديثة (IR). بالنظر إلى استعلام من مستخدم (على سبيل المثال ، “كم يبلغ طول MT Everest؟”) ، فإن الهدف من IR هو العثور على معلومات ذات صلة بالاستعلام من مجموعة كبيرة جدًا من البيانات (على سبيل المثال ، مليارات المستندات أو الصور أو مقاطع الفيديو على الويب). ينقل نماذج تضمين كل نقطة بيانات إلى “تضمين” في منظم واحد ، من هذا القبيل دلالة يتم تحويل نقاط بيانات مماثلة إلى رياضيا ناقلات مماثلة. تتم مقارنة التضمين بشكل عام من خلال تشابه المنتج الداخلي ، مما يتيح استردادًا فعالًا من خلال خوارزميات البحث الداخلي (MIPS) المحسّن. ومع ذلك ، فقد أظهرت التطورات الحديثة ، وخاصة إدخال نماذج متعددة المجرات مثل كولبيرت ، أداءً محسّنًا بشكل كبير في مهام الأشعة تحت الحمراء.

على عكس التضمينات المفردة ، تمثل النماذج متعددة المنظمات كل نقطة بيانات مع أ تعيين من التضمينات ، والاستفادة من وظائف التشابه الأكثر تطورا التي يمكن أن تلتقط علاقات أكثر ثراء بين نقاط البيانات. على سبيل المثال ، يلتقط مقياس تشابه Chamfer الشهير المستخدم في أحدث النماذج المتعددة المتجهيات عندما يتم احتواء المعلومات الموجودة في التضمين المتعدد المتجهيات داخل تضمين آخر متعدد المجالات. بينما يعزز هذا النهج متعدد المجال الدقة ويمكّن من استرداد المستندات الأكثر صلة ، فإنه يقدم تحديات حسابية كبيرة. على وجه الخصوص ، فإن زيادة عدد التضمين وتعقيد تسجيل التشابه متعدد المجال يجعل الاسترجاع أكثر تكلفة بكثير.

في “Muvera: استرجاع متعدد المنظمات عن طريق الترميزات الأبعاد الثابتة” ، نقدم خوارزمية استرجاعًا متعددة المستويات جديدة مصممة لسد الفجوة بين الكفاءة بين استرجاع واحد ومتعدد المستويات. نقوم بتحويل استرجاع المستويات المتعددة إلى مشكلة أبسط من خلال بناء ترميزات ثابتة الأبعاد (FDEs) من الاستعلامات والمستندات ، والتي هي متجهات مفردة تقارب منتجها الداخلي من التشابه متعدد المنظمات ، مما يقلل من استرجاع المعقد متعدد المنظمات إلى البحث عن المنتجات الداخلية المفردة المفردة (MIPs). يتيح لنا هذا النهج الجديد الاستفادة من خوارزميات MIPs ذات الأمراض العالية لاسترداد مجموعة أولية من المرشحين الذين يمكن بعد ذلك إعادة تصنيفها مع التشابه متعدد الجهات ، مما يتيح استرجاعًا فعالًا متعدد المجرات دون التضحية بالدقة. لقد قدمنا ​​تنفيذًا مفتوح المصدر لخوارزمية البناء FDE الخاصة بنا على Github.


هذا المحتوي تم بالكامل عن طريق أدوات الذكاء الإصطناعي

مقالات ذات صلة

زر الذهاب إلى الأعلى

Main Heading Goes Here
Sub Heading Goes Here

No, thank you. I do not want.
100% secure your website.
Powered by
Main Heading Goes Here
Sub Heading Goes Here

No, thank you. I do not want.
100% secure your website.