الانتقال إلى المحتوى الرئيسي

نظرة عامة

من صفحة إعدادات البحث، يمكنك تكوين نموذج التضمين، وإعادة الترتيب، ومجموعة متنوعة من خيارات البحث والفهرسة المتقدمة. Search settings overview page

نموذج التضمين

يُستخدم نموذج التضمين لتحويل مستنداتك إلى متجهات يتم تخزينها في Vespa. تُستخدم هذه المتجهات للبحث عن مستندات ذات صلة عندما يستعلم مستخدم عن Gorbit. يمكن لنموذج تضمين قوي أن يحسن بشكل كبير دقة نتائج البحث الخاصة بك، لكن ذلك يأتي على حساب استخدام إضافي للذاكرة والقرص. Embedding model configuration page
أفضل نماذج التضمين متاحة عمومًا من خلال مزود سحابي مثل Cohere أو Google.لاستخدام مزود سحابي، اختر النموذج الذي تريد استخدامه، قدم بيانات الاعتماد للمزود، وانقر على متابعة.
تعمل النماذج المستضافة ذاتيًا على بنيتك التحتية الخاصة وتضمن أن بياناتك لا تغادر حدودك.
تضمين البيانات على النطاق الذي يعمل به Gorbit يتطلب موارد حوسبة كبيرة. إذا كنت تريد استخدام نموذج مستضاف ذاتيًا، نوصي بشدة أن تجعل وحدة GPU متاحة لحاوية خادم نموذج الفهرسة في Gorbit.
في علامة تبويب مستضاف ذاتيًا، يمكنك اختيار نموذج مقترح أو اتباع التعليمات لتوصيل نموذجك الخاص.

تبديلات التضمين

إذا اخترت نموذج تضمين جديد، ستحتاج Gorbit إلى إعادة فهرسة جميع بياناتك. خلال هذه العملية، سيظل نموذج التضمين القديم متاحًا للبحث. أثناء التبديل قيد التقدم، سترى صفحة إعدادات البحث تعرض تفاصيل تقدم الفهرسة.
هذه العملية قد تستغرق وقتًا. بالإضافة إلى ذلك، يتم أيضًا إعادة فهرسة بيانات المستخدم الخاصة، لكنها لا تُعرض لصفحة إعدادات البحث للمسؤول.
Embedding swap in progress

إعادة الترتيب

إعادة الترتيب هي خطوة اختيارية يمكن استخدامها لتحسين دقة نتائج البحث الخاصة بك. سيقوم نموذج إعادة الترتيب بتقييم وإعادة تنظيم نتائج البحث الخاصة بك بناءً على صلة المستندات بالاستعلام. تضيف هذه العملية قدرًا صغيرًا من التأخير إلى نتائج البحث الخاصة بك. عمومًا، إعادة الترتيب مفيدة فقط إذا كان لديك عدد كبير جدًا من المستندات. Reranking configuration page

التكوينات المتقدمة

في الصفحة الأخيرة، يمكنك تكوين مجموعة متنوعة من إعدادات البحث المتقدمة.
يعيد التوسع متعدد اللغات صياغة استعلاماتك إلى اللغات الأخرى المحددة. يمكن أن يكون هذا مفيدًا للنتائج عبر اللغات.
تنشئ الفهرسة متعددة المراحل أجزاءً بأحجام متفاوتة وتخزنها في الفهرس. يمكن أن يساعد هذا خوارزمية البحث الهجينة في تحديد المصادر ذات الصلة بشكل أفضل.
يضيف RAG السياقي معلومات إضافية على مستوى المستند لكل جزء في الفهرس. يمكن أن يساعد هذا خوارزمية البحث الهجينة في تحديد المصادر ذات الصلة بشكل أفضل.
يمكن أن يكون RAG السياقي مكلفًا جدًا لأنه يضيف قدرًا كبيرًا من البيانات لكل استدعاء تضمين.
يمكن ضبط دقة التضمين على إما bfloat16 أو float. ضبط الدقة على bfloat16 يمكن أن يقلل من استخدام الذاكرة للفهرس، لكن قد يقلل قليلاً من دقة النتائج.
ضبط هذه القيمة سيقلل من عدد الأبعاد في متجهات التضمين. يمكن أن يقلل هذا من استخدام الذاكرة للفهرس، لكن قد يقلل من دقة النتائج.
البعد المخفض مدعوم فقط لنماذج تضمين OpenAI في الوقت الحالي.
Advanced search configurations page