نظرة عامة
من صفحة إعدادات البحث، يمكنك تكوين نموذج التضمين، وإعادة الترتيب، ومجموعة متنوعة من خيارات البحث والفهرسة المتقدمة.
نموذج التضمين
يُستخدم نموذج التضمين لتحويل مستنداتك إلى متجهات يتم تخزينها في Vespa. تُستخدم هذه المتجهات للبحث عن مستندات ذات صلة عندما يستعلم مستخدم عن Gorbit. يمكن لنموذج تضمين قوي أن يحسن بشكل كبير دقة نتائج البحث الخاصة بك، لكن ذلك يأتي على حساب استخدام إضافي للذاكرة والقرص.
نماذج السحابة
نماذج السحابة
أفضل نماذج التضمين متاحة عمومًا من خلال مزود سحابي مثل Cohere أو Google.لاستخدام مزود سحابي، اختر النموذج الذي تريد استخدامه، قدم بيانات الاعتماد للمزود،
وانقر على متابعة.
نماذج مستضافة ذاتيًا
نماذج مستضافة ذاتيًا
تعمل النماذج المستضافة ذاتيًا على بنيتك التحتية الخاصة وتضمن أن بياناتك لا تغادر حدودك.في علامة تبويب مستضاف ذاتيًا، يمكنك اختيار نموذج مقترح أو اتباع التعليمات لتوصيل نموذجك الخاص.
تضمين البيانات على النطاق الذي يعمل به Gorbit يتطلب موارد حوسبة كبيرة.
إذا كنت تريد استخدام نموذج مستضاف ذاتيًا،
نوصي بشدة أن تجعل وحدة GPU متاحة لحاوية خادم نموذج الفهرسة في Gorbit.
تبديلات التضمين
إذا اخترت نموذج تضمين جديد، ستحتاج Gorbit إلى إعادة فهرسة جميع بياناتك. خلال هذه العملية، سيظل نموذج التضمين القديم متاحًا للبحث. أثناء التبديل قيد التقدم، سترى صفحة إعدادات البحث تعرض تفاصيل تقدم الفهرسة.
إعادة الترتيب
إعادة الترتيب هي خطوة اختيارية يمكن استخدامها لتحسين دقة نتائج البحث الخاصة بك. سيقوم نموذج إعادة الترتيب بتقييم وإعادة تنظيم نتائج البحث الخاصة بك بناءً على صلة المستندات بالاستعلام. تضيف هذه العملية قدرًا صغيرًا من التأخير إلى نتائج البحث الخاصة بك. عمومًا، إعادة الترتيب مفيدة فقط إذا كان لديك عدد كبير جدًا من المستندات.
التكوينات المتقدمة
في الصفحة الأخيرة، يمكنك تكوين مجموعة متنوعة من إعدادات البحث المتقدمة.التوسع متعدد اللغات
التوسع متعدد اللغات
يعيد التوسع متعدد اللغات صياغة استعلاماتك إلى اللغات الأخرى المحددة.
يمكن أن يكون هذا مفيدًا للنتائج عبر اللغات.
الفهرسة متعددة المراحل
الفهرسة متعددة المراحل
تنشئ الفهرسة متعددة المراحل أجزاءً بأحجام متفاوتة وتخزنها في الفهرس.
يمكن أن يساعد هذا خوارزمية البحث الهجينة في تحديد المصادر ذات الصلة بشكل أفضل.
RAG السياقي
RAG السياقي
يضيف RAG السياقي معلومات إضافية على مستوى المستند لكل جزء في الفهرس.
يمكن أن يساعد هذا خوارزمية البحث الهجينة في تحديد المصادر ذات الصلة بشكل أفضل.
دقة التضمين
دقة التضمين
يمكن ضبط دقة التضمين على إما
bfloat16 أو float.
ضبط الدقة على bfloat16 يمكن أن يقلل من استخدام الذاكرة للفهرس،
لكن قد يقلل قليلاً من دقة النتائج.البعد المخفض
البعد المخفض
ضبط هذه القيمة سيقلل من عدد الأبعاد في متجهات التضمين.
يمكن أن يقلل هذا من استخدام الذاكرة للفهرس، لكن قد يقلل من دقة النتائج.
