Resourcing Overview
| Resource | Minimum | Preferred |
|---|---|---|
| CPU | 4 vCPU | 8+ vCPU |
| RAM | 10 GB | 16+ GB |
| Disk | 32 GB + ~2.5x indexed data | 500 GB for organizations <5000 users |
النشر المحلي (Docker)
يمكنك التحكم في الموارد المتاحة لـ Docker في قسم Resources من قائمة إعدادات Docker Desktop.غالبًا ما تشغل صور Docker القديمة غير المستخدمة مساحة قرص كبيرة. لتنظيف الصور غير المستخدمة،
قم بتشغيل
docker system prune --all.مزودو الخدمة السحابية (AWS، GCP، إلخ)
للنشرات الصغيرة إلى المتوسطة، نوصي بنشر Gorbit على مثيل واحد في مزود الخدمة السحابية الذي تختاره. عند تقييم مثيلك، اتبع الموارد المفضلة في الجدول أعلاه.| المزود | نوع المثيل الموصى به |
|---|---|
| AWS | m7g.xlarge |
| GCP | e2-standard-4 أو e2-standard-8 |
| Azure | D4s_v3 |
| DigitalOcean | تلبي الموارد المفضلة في الجدول أعلاه |
Vespa على المعالجات القديمة
Vespa على المعالجات القديمة
يتطلب Vespa معالجات Haswell (2013) أو أحدث.للمعالجات القديمة، استخدم صورة
vespaengine/vespa-generic-intel-x86_64 في ملف Docker Compose الخاص بك.
هذه الصورة العامة أبطأ.لمزيد من التفاصيل، راجع Vespa CPU Support.تخصيص الموارد حسب الحاوية
للتوسع بكفاءة أكبر، يمكنك تخصيص موارد لكل حاوية Gorbit باستخدام Kubernetes أو AWS EKS. راجع Gorbit Helm chartvalues.yaml للطلبات والحدود الافتراضية.
| المكون | المعالج | الذاكرة |
|---|---|---|
api_server | 1 | 2 Gi |
background | 2 | 8 Gi |
indexing_model_server | 2 | 4 Gi |
inference_model_server | 2 | 4 Gi |
postgres | 2 | 2 Gi |
vespa | >= 4 | >= 8 Gi |
nginx | 250m (1/4) | 128 Mi |
توصية
vespa هي الحد الأدنى لنشر الإنتاج. مع 50 جيجابايت من المستندات،
نوصي بما لا يقل عن 10 معالجات و 20 جيجابايت من الذاكرة.كيف تتغير متطلبات الموارد
المحرك الرئيسي لمتطلبات الموارد هو عدد المستندات المفهرسة. يؤثر هذا بشكل أساسي على مكون الفهرس في Gorbit (قاعدة بيانات المتجهات Vespa)، المسؤول عن تخزين المستندات المحولة إلى متجهات والتعامل مع طلبات البحث.متطلبات موارد Vespa تتغير خطيًا مع عدد المستندات.
- ~3 جيجابايت من الذاكرة لكل جيجابايت إضافي من المستندات
- ~1 معالج لكل 2 جيجابايت إضافية من المستندات
- نموذج التضمين
- ما إذا كان لديك تكميم وتقليل الأبعاد مفعّلًا
مثال على الموارد
لنشر مع 10 جيجابايت من المحتوى النصي، سيحتاج مكونindex الخاص بك إلى:
- المعالج: 4 + 10 * 0.5 = 9 نوى
- الذاكرة: 4 + 10 * 3 = 34 جيجابايت
= 13 معالج و >= 50 جيجابايت من الذاكرة.بناءً على هذه المتطلبات، سيكون مثيل EC2 من نوع
m7g.4xlarge أو c5.9xlarge مناسبًا.
إذا كان النشر باستخدام Kubernetes أو AWS EKS، فسيكون تخصيص الموارد لكل مكون كالتالي:
| المكون | المعالج | الذاكرة |
|---|---|---|
api_server | 1 | 2 Gi |
background | 2 | 8 Gi |
indexing_model_server | 2 | 4 Gi |
inference_model_server | 2 | 4 Gi |
postgres | 2 | 4 Gi |
vespa | 10 | 34 Gi |