في بيئة اليوم الرقمية، يعد ضمان توافر وأداء الخوادم أمرًا حاسمًا للحفاظ على حضور موثوق عبر الإنترنت. يساعد مراقبة وقت التشغيل للخوادم الشركات في اكتشاف المشكلات قبل أن تؤثر على المستخدمين، مما يضمن سير العمليات بسلاسة ورضا العملاء العالي. يوفر Prometheus، وهو أداة مفتوحة المصدر للمراقبة والتنبيه، إمكانيات قوية لمراقبة وقت التشغيل للخوادم، وقياسات الأداء، والتنبيهات. تستعرض هذه المقالة كيفية تنفيذ مراقبة وقت التشغيل والتنبيهات بشكل فعال باستخدام Prometheus.
فهم مراقبة وقت التشغيل للخوادم
ما هي مراقبة وقت التشغيل للخوادم؟
مراقبة وقت التشغيل للخوادم هي عملية فحص حالة تشغيل الخوادم بشكل مستمر للتأكد من أنها تعمل بسلاسة وقابلة للوصول. يتضمن ذلك تتبع مقاييس مثل وقت الاستجابة، والتوافر، واستخدام الموارد. الهدف هو اكتشاف أي شذوذ أو توقف في أقرب وقت ممكن، مما يسمح باتخاذ إجراءات فورية.
لماذا تعتبر مراقبة وقت التشغيل مهمة؟
- استمرارية الأعمال: قد يؤدي التوقف إلى فقدان الإيرادات وتضرر سمعة العلامة التجارية. تضمن المراقبة اكتشاف المشكلات وحلها بسرعة.
- تجربة المستخدم: يرتبط وقت التشغيل العالي بشكل مباشر مع تجربة مستخدم أفضل. ضمان أن الخوادم تعمل بشكل صحيح يبقي العملاء راضين.
- الإدارة الاستباقية: تتيح المراقبة لفرق تكنولوجيا المعلومات معالجة المشكلات المحتملة قبل أن تتصاعد إلى مشاكل خطيرة.
مقدمة في Prometheus
ما هو Prometheus؟
Prometheus هو نظام مراقبة مفتوح المصدر وقاعدة بيانات تسلسلات زمنية مصممة من أجل الاعتمادية وقابلية التوسع. تم تطويره بواسطة SoundCloud، وقد اكتسب شهرة بفضل لغته الاستعلامية القوية، وبنيته المرنة، والنظام البيئي الواسع للتكاملات.
الميزات الرئيسية لـ Prometheus
- نموذج بيانات متعدد الأبعاد: يسمح بتمثيل البيانات بشكل غني عبر التسميات.
- لغة الاستعلام القوية (PromQL): تمكن المستخدمين من إجراء استعلامات معقدة على المقاييس المجمعة.
- قدرات التنبيه: نظام تنبيه مدمج باستخدام Alertmanager لإدارة التنبيهات.
- جمع البيانات القائم على السحب: يقوم Prometheus بجمع المقاييس من النقاط النهاية المحددة في فترات زمنية محددة.
- التصور: يتكامل جيدًا مع Grafana لتصور المقاييس وإنشاء لوحات البيانات.
إعداد Prometheus
التثبيت
يمكن تثبيت Prometheus على أنظمة تشغيل مختلفة. إليك دليل سريع لتثبيته على خادم قائم على Linux:
- تنزيل Prometheus
wget https://github.com/prometheus/prometheus/releases/download/v2.33.1/prometheus-2.33.1.linux-amd64.tar.gz
- استخراج الملف
tar xvf Prometheus-2.33.1.linux-amd64.tar.gz
- الانتقال إلى الدليل المستخرج
cd prometheus-2.33.1.Linux-amd64
- بدء Prometheus
./prometheus config.file=prometheus.yml
التكوين
يتم تكوين Prometheus باستخدام ملف YAML. يسمى ملف التكوين الافتراضي prometheus.yml. إليك تكوين بسيط لمراقبة وقت التشغيل لخادم:
global:
scrape interval: 15s
scrape configs:
job name: 'server-uptime'
static configs:
targets: ['localhost:9090']
الوصول إلى واجهة الويب لـ Prometheus
بمجرد تشغيل Prometheus، يمكنك الوصول إلى واجهة الويب عن طريق الانتقال إلى http://localhost:9090. تتيح لك هذه الواجهة استعلام المقاييس، وتصوير البيانات، واستكشاف بيانات التسلسل الزمني المجمعة.
مراقبة وقت تشغيل الخادم باستخدام Prometheus
إعداد Node Exporter
لمراقبة وقت تشغيل الخوادم ومقاييس الأداء، يمكنك استخدام Node Exporter، الذي يجمع مقاييس الأجهزة ونظام التشغيل. إليك كيفية إعداده:
- التثبيت
استخراج الملف
tar xvf node exporter-1.3.1.linux-amd64.tar.gz
- بدء Node Exporter
cd node exporter-1.3.1.Linux-amd64
./node exporter &
تعريف المقاييس لمراقبة وقت التشغيل
يجمع Prometheus العديد من المقاييس من Node Exporter، بما في ذلك:
- uptime: مقدار الوقت الذي عمل فيه الخادم.
- node cpu seconds total: إجمالي الثواني التي كانت فيها وحدة المعالجة المركزية في وضع الخمول أو المستخدم أو النظام.
- node memory MemAvailable bytes: الذاكرة المتاحة على الخادم.
إنشاء التنبيهات لمراقبة وقت التشغيل
يحتوي Prometheus على نظام تنبيه مدمج عبر Alertmanager. لإنشاء تنبيهات لوقت تشغيل الخادم، اتبع هذه الخطوات:
إعداد Alertmanager
قم بتثبيت Alertmanager عن طريق تنزيل الإصدار الأخير من موقع Prometheus.
تصور المقاييس باستخدام Grafana
يمكن دمج Prometheus مع Grafana من أجل تصور أفضل للمقاييس.
الوصول إلى Grafana
افتح متصفح الويب وانتقل إلى http://localhost:3000. بيانات الدخول الافتراضية هي:
- اسم المستخدم: admin
- كلمة المرور: admin (سيُطلب منك تغييرها عند تسجيل الدخول لأول مرة)
إضافة Prometheus كمصدر بيانات
- انقر على التكوين (رمز الترس) في الشريط الجانبي الأيسر.
- اختر مصادر البيانات.
- انقر على إضافة مصدر بيانات واختر Prometheus.
- أدخل عنوان URL لخادم Prometheus (مثل http://localhost:9090) واحفظ التكوين.
إنشاء لوحات البيانات
قم بإنشاء لوحة بيانات جديدة لتصور مقاييس وقت تشغيل الخادم:
- انقر على إنشاء (رمز زائد) واختر لوحة البيانات.
- انقر على إضافة لوحة جديدة.
- استخدم PromQL لإنشاء استعلامات للمقاييس التي تريد تصورها (مثل up لمراقبة توافر الخادم).
- قم بتكوين خيارات التصور واحفظ لوحة البيانات.
أفضل الممارسات لمراقبة وقت التشغيل باستخدام Prometheus
- تحديد عتبات التنبيه الواقعية: تأكد من أن عتبات التنبيه تعكس مستويات التوقف المقبولة بالنسبة لشركتك.
- استخدام التسميات بفعالية: استخدم التسميات في المقاييس لتمييز بين البيئات (مثل الإنتاج مقابل التجريب).
- مراقبة الاعتمادات: تأكد من مراقبة الخوادم وكذلك الاعتمادات مثل قواعد البيانات والخدمات الخارجية.
- مراجعة التنبيهات بانتظام: راجع تكوينات التنبيه والمقاييس بشكل دوري لضمان بقائها ذات صلة مع تطور بنيتك التحتية.
- نسخ ملفات التكوين احتياطيًا: قم بنسخ ملفات التكوين لـ Prometheus و Alertmanager بانتظام لمنع فقد البيانات.
تعد مراقبة وقت التشغيل للخوادم أمرًا أساسيًا للحفاظ على التوافر والأداء العالي في بيئة اليوم الرقمية السريعة. يوفر Prometheus مجموعة أدوات قوية ومرنة لمراقبة وقت التشغيل للخوادم، مع إمكانيات استعلام غنية وميزات التنبيه. من خلال تنفيذ Prometheus جنبًا إلى جنب مع Node Exporter و Grafana، يمكن للمؤسسات الحصول على رؤى عميقة حول أداء الخوادم والاستجابة بسرعة للمشكلات. باتباع أفضل الممارسات الموضحة في هذه المقالة، يمكنك ضمان بقاء بنية السحابة الخاصة بك مرنة وموثوقة.