مستودع البيانات ( Data-Warehouse )هو نوع من قواعد البيانات، عبارة عن مجموعة من
عناصرِ البيانات المنطقية المرتبطة مع بعضها البعض بعلاقة رياضية،
وتتكون قاعدة البيانات من جدول واحد أو أكثر والتي تحتوي كمًّا هائلًا من البيانات
الموجهة للمساعدة في اتخاذ القرارات داخل المؤسسة.
ويتميز هذا النوع من قواعد البيانات بتطابق
بنيته الداخلية مع ما يحتاجه المستخدم من مؤشرات ومحاور التحليل في ما يعرف
بالنموذج النجمي (star schema)،
ومن تطبيقاته :نظم دعم القرارات والتنقيب في البيانات.
فـمستودعات البيانات عادة تحتوي على بيانات
تاريخية تم اشتقاقها واستخراجها من البيانات الموجودة في قواعد البيانات العادية
المستخدمة في التطبيقات والتي تجرى عليها الكثير من عمليات الإدخال والتحديث، كما
تحتوي مستودعات البيانات على بيانات من مصادر أخرى كالملفات النصية والوثائق
الأخرى.
ولمستودعات البيانات سمات وهي:
- البيانات موجهة حسب الموضوع Subject Oriented
- متكاملة Integrated
- مستقرة Nonvolatile
- تابعة للوقت (متغيرة حسب الوقت)
ولهذه المستودعات معمارية، فبنية مستودع
البيانات تحدد ترتيب البيانات وهيكل التخزين، لأنه يجب تنظيم البيانات وتنظيفها
لتكون ذات قيمة، لذلك فإن بنية مستودع البيانات الحديثة ترتكز على تحديد الأسلوب
الأكثر فاعلية لاستخراج المعلومات من البيانات الأولية في منطقة التدريج وتحويلها
إلى هيكل بسيط قابل للاستهلاك باستخدام نموذج الأبعاد الذي يوفر أعمالًا قيمة
الذكاء.
فعند تصميم مستودع بيانات الشركة هناك
ثلاثة أنواع رئيسية من الهندسة المعمارية يجب أخذها في الاعتبار:
·
معمارية أحادية الطبقة
تركز بنية مستودع البيانات أحادية المستوى على
إنتاج مجموعة كثيفة من البيانات وتقليل حجم البيانات المودعة.
على الرغم من أنها مفيدة للتخلص من التكرار، إلا
أن هذه البنية غير مناسبة للشركات ذات متطلبات البيانات المعقدة والعديد من تدفقات
البيانات.
·
معمارية من مستويين
تقوم هذه البنية بتقسيم مصادر البيانات الملموسة
من المستودع نفسه، وبالرغم من أنها أكثر كفاءة في تخزين البيانات وتنظيمها إلا أنها
غير قابلة للتطوير.
·
معمارية من ثلاث طبقات
هذا النوع هو الأكثر شيوعاُ من بنية مستودع
البيانات الحديثة، لأنه ينتج تدفقًا منظمًا للبيانات من المعلومات الأولية إلى
الأفكار القيمة.
و يتألف المستوى السفلي من خادم بنك البيانات
الذي ينشئ طبقة تجريدية على البيانات من مصادر عديدة مثل: بنوك بيانات المعاملات
المستخدمة في الاستخدامات الأمامية.
الطبقة الوسطى وتشمل المعالجة التحليلية
عبر الإنترنت (OLAP) الخادم من وجهة نظر المستخدم ، ويغيرهذا المستوى البيانات إلى ترتيب
يكون أكثر ملاءمة للتحليل والتحقيق متعدد الأوجه، لأنه يشمل على خادم OLAP مدمج مسبقا في البنية، و يمكننا تسميته مستودع البيانات المركز على OLAP.
المستوى الثالث والأعلى هو مستوى العميل الذي
يتضمن الأدوات وواجهة برمجة التطبيقات (API) المستخدمة لتحليل البيانات عالية المستوى
والاستعلام وإعداد التقارير.
الآن بعد أن ناقشنا معماريات مستودع البيانات
الثلاثة ، نلقي نظرة على المكونات الرئيسية لمستودع البيانات.
فـيتكون تصميم مستودع البيانات بشكل أساسي من
ستة مكونات رئيسية.
·
قاعدة
بيانات مستودع البيانات
المكون الرئيسي لهيكل تخزين البيانات هو بنك
معلومات يقوم بتخزين جميع بيانات المؤسسة ويجعلها قابلة للإدارة من أجل إعداد
التقارير، فيعتبراختيار نوع قاعدة البيانات التي ستستخدمها لتخزين البيانات في
المستودع الخاص بك امر ضروري.
·
أدوات الاستخراج والتحويل والتحميل (ETL)
تعتبر أدوات ETL أساسية في بنية مستودع البيانات، فهذه الأدوات
تساعد في استخراج البيانات من مصادر مختلفة وتحويلها إلى ترتيب مناسب، وتحميلها
إلى مستودع بيانات.
·
البيانات الوصفية
تلعب البيانات الوصفية دورًا مهمًا للشركات وكذلك الفرق الفنية لفهم
البيانات الموجودة في المستودع وتحويلها إلى معلومات، بحيث تصف البيانات الوصفية
مستودع البيانات وتقدم إطارعمل للبيانات يساعد في بناء وحفظ ومعالجة والاستفادة من
مستودع البيانات، و يمكن وصفها بنوعين:
البيانات الوصفية الفنية: والتي تتضمن معلومات يمكن للمطورين والمديرين
استخدامها عند تنفيذ مهام تطوير المستودعات وإدارتها.
البيانات الوصفية للأعمال: والتي تتضمن معلومات توفر وجهة نظر سهلة الفهم
للبيانات المخزنة في المستودع.
·
أدوات الوصول إلى مستودع البيانات
كأساس يستخدم مستودع البيانات قاعدة بيانات أو
مجموعة قواعد بيانات، ولا يمكن لمستخدمي الشركات بشكل عام العمل مع قواعد البيانات
بشكل مباشر، ولذلك يستخدمون العديد من الأدوات المساعدة. بعض هذه الأدوات:
أدوات الاستعلام وإعداد التقارير: والتي تساعد المستخدمين على إنتاج تقارير
الشركات، والتي يمكن أن تكون في شكل جداول بيانات أو حسابات أو صور تفاعلية.
أدوات تطوير التطبيقات: مما يساعد على إنشاء تقارير مخصصة وعرضها في
تفسيرات محددة لأغراض إعداد تقارير معينة.
أدوات استخراج البيانات: والتي تنظم إجراء تحديد المصفوفات والوصلات
بكميات ضخمة من البيانات باستخدام طرق النمذجة الإحصائية المتطورة.
أدوات OLAP: تساعد على بناء مستودع بيانات متعدد الأبعاد،
ويسمح بتحليل بيانات المؤسسة من وجهات نظر عديدة.
·
ناقل
مستودع البيانات
يحدد تدفق البيانات داخل بنية ناقل تخزين
البيانات ويتضمن سوق البيانات.
سوق البيانات هو مستوى وصول يستخدم لنقل
البيانات إلى المستخدمين، ويستخدم لتقسيم البيانات التي يتم إنتاجها لمجموعة معينة
من المستخدمين.
·
طبقة
التقارير
تسمح طبقة التقارير في مستودع البيانات
للمستخدمين بالوصول إلى واجهة BI أو BI هندسة قاعدة البيانات، والغرض من هذه الطبقة هو
العمل كلوحة معلومات لتصور البيانات وإنشاء التقارير وإخراج أي معلومات مطلوبة.
واخيرًا للاستفاده يجب التعرف على تقنيات مستودع
البيانات وهي:
1- مستودع البيانات الافتراضي: وهو
يتيح للمستخدم الوصول إلى البيانات لاستخدام بعض الأدوات عن طريق طبقة الوصول إلى
البيانات.
2- مستودع البيانات المركزية ويحتوي
على مصادر بيانات من مصادر وظيفيه معينه.
3- مستودع البيانات الموزعه، توزيع
قواعد البيانات الفيزيائية.
تعليقات
إرسال تعليق