المفاهيم الأساسية لقواعد البيانات العلائقية. نظرية قواعد البيانات العلائقية: التطبيع والعلاقات والانضمام إلى قواعد البيانات العلائقية

المفاهيم الأساسية لقواعد البيانات العلائقية. نظرية قواعد البيانات العلائقية: التطبيع والعلاقات والانضمام إلى قواعد البيانات العلائقية

يعتمد الجبر العلائقي على نظرية المجموعات وهو أساس منطق قاعدة البيانات.
عندما كنت أدرس فقط بنية قواعد البيانات وSQL، ساعد التعرف الأولي على الجبر العلائقي بشكل كبير على زيادة المعرفة لتتلاءم مع ذهني بشكل صحيح، وسأحاول أن أجعل هذه المقالة لها تأثير مماثل.

لذا، إذا كنت ستبدأ دراستك في هذا المجال أو كنت مهتمًا فقط، يرجى النقر على القطة.

قاعدة البيانات العلائقية

أولاً، دعونا نقدم مفهوم قاعدة البيانات العلائقية التي سنقوم بتنفيذ جميع الإجراءات فيها.

قاعدة البيانات العلائقية هي مجموعة من العلاقات التي تحتوي على كافة المعلومات التي يجب تخزينها في قاعدة البيانات. في هذا التعريف، نحن مهتمون بمصطلح العلاقة، لكننا الآن سنتركها دون تعريف صارم.
دعونا نتخيل جدول المنتجات بشكل أفضل.

جدول المنتجات

بطاقة تعريف اسم شركة سعر
123 بسكويت دارك سايد ذ.م.م 190
156 شاي دارك سايد ذ.م.م 60
235 أناناس OJSC "فروكتي" 100
623 طماطم أوه "الخضروات" 130

يتكون الجدول من 4 صفوف، الصف في الجدول عبارة عن صف في النظرية العلائقية. تسمى مجموعة من الصفوف المرتبة بالعلاقة.
قبل تحديد العلاقة، دعونا نقدم مصطلحًا آخر - المجال. المجالات المتعلقة بالجدول هي أعمدة.

من أجل الوضوح، نقدم الآن تعريفًا صارمًا للعلاقة.

دع N مجموعات D1، D2، ... تعطى. Dn (المجالات)، العلاقة R على هذه المجموعات هي مجموعة صفوف N المرتبة من النموذج ، حيث ينتمي d1 إلى D1، وما إلى ذلك. تسمى المجموعات D1، D2،..Dn مجالات العلاقة R.
يمثل كل عنصر من عناصر الصف قيمة إحدى السمات المقابلة لأحد المجالات.

مفاتيح في العلاقات
في العلاقة، الشرط هو أن جميع الصفوف يجب أن تكون متميزة. لتعريف الصف بشكل فريد، يوجد مفتاح أساسي. المفتاح الأساسي هو سمة أو مجموعة من الحد الأدنى لعدد السمات التي تحدد صفًا معينًا بشكل فريد ولا تحتوي على سمات إضافية.
المعنى الضمني هو أن جميع السمات الموجودة في المفتاح الأساسي يجب أن تكون ضرورية وكافية لتحديد صف معين، كما أن حذف أي من السمات الموجودة في المفتاح سيجعلها غير كافية لتحديد الهوية.
على سبيل المثال، في مثل هذا الجدول، سيكون المفتاح عبارة عن مجموعة من السمات من العمود الأول والثاني.

طاولة السائقين

يمكن ملاحظة أن المؤسسة يمكن أن يكون لديها العديد من برامج التشغيل، ومن أجل تحديد برنامج التشغيل بشكل فريد، تكون القيمة من عمود "اسم المؤسسة" ومن عمود "اسم السائق" مطلوبة. يسمى هذا المفتاح بالمفتاح المركب.

في قاعدة البيانات العلائقية، تكون الجداول مترابطة ومرتبطة ببعضها البعض كجداول رئيسية وتابعة. يتم الاتصال بين الجدولين الرئيسي والثانوي من خلال المفتاح الأساسي للجدول الرئيسي والمفتاح الخارجي للجدول الثانوي.
المفتاح الخارجي هو سمة أو مجموعة من السمات التي تمثل المفتاح الأساسي في الجدول الرئيسي.

ستكون هذه النظرية التحضيرية كافية للتعرف على العمليات الأساسية للجبر العلائقي.

عمليات الجبر العلائقي

العمليات الثمانية الأساسية للجبر العلائقي تم اقتراحها بواسطة E. Codd.
  • جمعية
  • تداخل
  • الطرح
  • المنتج الديكارتي
  • عينة
  • تنبؤ
  • مُجَمَّع
  • قسم
النصف الأول من العمليات مشابه لنفس العمليات على المجموعات. يمكن التعبير عن بعض العمليات من خلال عمليات أخرى. دعونا نلقي نظرة على معظم العمليات مع الأمثلة.

من أجل الفهم، من المهم أن نتذكر أن نتيجة أي عملية جبرية على العلاقات هي علاقة أخرى، والتي يمكن بعد ذلك استخدامها في عمليات أخرى.
لنقم بإنشاء جدول آخر سيكون مفيدًا لنا في الأمثلة.

جدول البائعين

بطاقة تعريف تاجر
123 أوو "دارت"
156 الشركة المساهمة المشتركة "فيدرو"
235 الشركة المساهمة المشتركة "بازا الخضار"
623 الشركة المساهمة "شركة"

دعنا نتفق على أن المعرف الموجود في هذا الجدول هو مفتاح خارجي مرتبط بالمفتاح الأساسي لجدول المنتجات.

أولاً، دعونا نلقي نظرة على أبسط عملية - اسم العلاقة. وستكون نتيجتها هي نفس العلاقة، أي أنه من خلال إجراء عملية المنتجات، سنتلقى نسخة من علاقة المنتجات.

تنبؤ
الإسقاط هو عملية يتم فيها استخراج السمات من العلاقة فقط من المجالات المحددة، أي يتم تحديد الأعمدة الضرورية فقط من الجدول، وإذا تم الحصول على عدة صفوف متطابقة، فسيبقى مثيل واحد فقط من هذا الصف في العلاقة الناتجة.
على سبيل المثال، لنقم بإجراء إسقاط على جدول المنتجات عن طريق تحديد المعرف والسعر منه.

بناء جملة العملية:
π (المعرف، السعر) المنتجات

في حالة العينة، يمكننا استخدام أي تعبير منطقي. فلنقم بتحديد آخر بسعر أكبر من 90 ومعرف منتج أقل من 300:

σ(السعر> 90^المعرف<300) PRODUCTS

عمليه الضرب
الضرب أو المنتج الديكارتي هو عملية تتم على علاقتين، ونتيجة لذلك نحصل على علاقة بجميع المجالات من العلاقتين الأوليتين. ستكون الصفوف في هذه المجالات عبارة عن جميع المجموعات الممكنة من الصفوف من العلاقات الأولية. سيكون أكثر وضوحا مع مثال.

نحصل على المنتج الديكارتي لجداول المنتجات والبائعين.
بناء جملة العملية:

المنتجات × البائعين
ستلاحظ أن هذين الجدولين لهما نفس مجال المعرف. في هذه الحالة، تكون المجالات التي لها نفس الاسم مسبوقة باسم العلاقة المقابلة، كما هو موضح أدناه.
للإيجاز، دعونا لا نضرب النسب الكاملة، بل العينات ذات معرف الشرط<235

(يتم تمييز نفس الصفوف بالألوان)

معرف المنتجات اسم شركة سعر معرف البائع تاجر
123 بسكويت دارك سايد ذ.م.م 190 123 أوو "دارت"
156 شاي دارك سايد ذ.م.م 60 156 الشركة المساهمة المشتركة "فيدرو"
123 بسكويت دارك سايد ذ.م.م 190 156 الشركة المساهمة المشتركة "فيدرو"
156 شاي دارك سايد ذ.م.م 60 123 أوو "دارت"

للحصول على مثال لاستخدام هذه العملية، تخيل الحاجة إلى تحديد البائعين بأسعار أقل من 90. بدون المنتج، سيكون من الضروري أولاً الحصول على معرفات المنتج من الجدول الأول، ثم استخدام هذه المعرفات من الجدول الثاني للحصول على المعلومات اللازمة أسماء البائعين، واستخدام المنتج سيكون الاستعلام التالي:

π (البائع) σ (RODUCTS.ID=SELLERS.ID ^ السعر<90) PRODUCTS × SELLERS

ونتيجة لهذه العملية نحصل على العلاقة:

تاجر
الشركة المساهمة المشتركة "فيدرو"
الاتصال والاتصال الطبيعي
عملية الانضمام هي عكس عملية الإسقاط وتنشئ علاقة جديدة من علاقتين موجودتين. يتم الحصول على علاقة جديدة عن طريق تسلسل صفوف العلاقات الأولى والثانية، بينما العلاقات التي تتطابق فيها قيم السمات المحددة تخضع للتسلسل. على وجه التحديد، إذا قمت بتوصيل علاقات المنتجات والبائعين، فإن هذه السمات هي سمات مجالات المعرفات.

ومن أجل الوضوح أيضًا، يمكنك تخيل اتصال نتيجة عمليتين. أولاً، يتم أخذ حاصل ضرب الجداول المصدر، ومن ثم من العلاقة الناتجة نقوم باختيار بشرط مساواة السمات من نفس المجالات. في هذه الحالة، الشرط هو المساواة بين Products.ID وSELLERS.ID.

دعونا نحاول ربط العلاقات بين المنتجات والبائعين والحصول على علاقة.

معرف المنتجات اسم شركة سعر معرف البائع تاجر
123 بسكويت دارك سايد ذ.م.م 190 123 أوو "دارت"
156 شاي دارك سايد ذ.م.م 60 156 الشركة المساهمة المشتركة "فيدرو"
235 أناناس OJSC "فروكتي" 100 235 الشركة المساهمة المشتركة "بازا الخضار"
623 طماطم أوه "الخضروات" 130 623 الشركة المساهمة "شركة"

تتلقى الصلة الطبيعية علاقة مماثلة، ولكن إذا كان لدينا مخطط تم تكوينه بشكل صحيح في قاعدة البيانات (في هذه الحالة، يرتبط المفتاح الأساسي لجدول معرف المنتجات بالمفتاح الخارجي لجدول معرف البائع)، فإن العلاقة الناتجة تحتوي على مجال معرف واحد فقط.

بناء جملة العملية:
المنتجات ⋈ البائعين.

تحصل على هذه العلاقة:

معرف المنتجات اسم شركة سعر تاجر
123 بسكويت دارك سايد ذ.م.م 190 أوو "دارت"
156 شاي دارك سايد ذ.م.م 60 الشركة المساهمة المشتركة "فيدرو"
235 أناناس OJSC "فروكتي" 100 الشركة المساهمة المشتركة "بازا الخضار"
623 طماطم أوه "الخضروات" 130 الشركة المساهمة "شركة"
التقاطع والطرح.
ستكون نتيجة عملية التقاطع علاقة تتكون من صفوف متضمنة بالكامل في كلتا العلاقتين.
ستكون نتيجة الطرح علاقة تتكون من صفوف هي صفوف من العلاقة الأولى وليست صفوف من العلاقة الثانية.
تشبه هذه العمليات نفس العمليات على المجموعات، لذلك أعتقد أنه ليست هناك حاجة لوصفها بالتفصيل.
مصدر المعلومات
  • أساسيات استخدام وتصميم قواعد البيانات - V. M. Ilyushechkin
  • دورة محاضرات مقدمة في قواعد البيانات - جنيفر ويدوم، جامعة ستانفورد

سأكون ممتنا للتعليقات المنطقية

1.2 نظرية قواعد البيانات العلائقية

قاعدة البيانات العلائقية هي مجموعة من العلاقات التي تحتوي على كافة المعلومات التي يجب تخزينها في قاعدة البيانات. أي أن قاعدة البيانات تمثل مجموعة من الجداول اللازمة لتخزين كافة البيانات. ترتبط جداول قاعدة البيانات العلائقية منطقيا ببعضها البعض

لذا، فإن الغرض من نظام المعلومات هو معالجة البيانات المتعلقة بالأشياء في العالم الحقيقي، مع مراعاة الروابط بين الكائنات. في نظرية قاعدة البيانات، غالبًا ما تسمى البيانات بالسمات وتسمى الكائنات بالكيانات. يعد الكائن والسمة والعلاقة من المفاهيم الأساسية لـ IS.

الكائن (أو الكيان) هو شيء موجود ويمكن تمييزه، أي أنه يمكن تسمية الكائن بذلك "الشيء" الذي يوجد له اسم وطريقة لتمييز كائن مشابه عن الآخر. لا يمكن أن تكون الأشياء أشياء مادية فحسب، بل قد تكون أيضًا مفاهيم أكثر تجريدًا تعكس العالم الحقيقي.

السمة (أو البيانات) هي بعض المؤشرات التي تميز كائنًا معينًا وتأخذ قيمة رقمية أو نصية معينة أو قيمة أخرى لمثيل محدد للكائن. يعمل نظام المعلومات مع مجموعات من الكائنات المصممة فيما يتعلق بموضوع معين، وذلك باستخدام قيم محددة من السمات (البيانات) لكائنات معينة.

بدأ تطوير قواعد البيانات العلائقية في أواخر الستينيات، عندما ظهرت الأعمال الأولى التي ناقشت؛ إمكانية استخدام الطرق المألوفة والطبيعية لعرض البيانات - ما يسمى بالنماذج البياناتية الجدولية - عند تصميم قواعد البيانات.

يعتبر مؤسس نظرية قواعد البيانات العلائقية هو أحد موظفي شركة آي بي إم، الدكتور إي كود، الذي نشر مقالة بعنوان "نموذج علائقي للبيانات لبنوك البيانات المشتركة الكبيرة" في 6 يونيو 1970. في هذه المقالة، كان أول من استخدم مصطلح "نموذج البيانات العلائقية". تتمتع نظرية قواعد البيانات العلائقية، التي طورها الدكتور إي كود في السبعينيات في الولايات المتحدة الأمريكية، بأساس رياضي قوي يصف قواعد التنظيم الفعال للبيانات. الإطار النظري الذي طوره إي. أصبح Codd الأساس لتطوير نظرية تصميم قاعدة البيانات.

E. Codd، كونه عالم رياضيات من خلال التدريب، اقترح استخدام جهاز نظرية المجموعة (الاتحاد، التقاطع، الفرق، المنتج الديكارتي) لمعالجة البيانات. وأثبت أن أي مجموعة من البيانات يمكن تمثيلها على شكل جداول ثنائية الأبعاد من نوع خاص، تعرف في الرياضيات باسم "العلاقات".

قاعدة البيانات العلائقية هي قاعدة يتم فيها تقديم جميع البيانات للمستخدم في شكل جداول مستطيلة لقيم البيانات، ويتم تقليل جميع العمليات على قاعدة البيانات إلى معالجة الجداول.

يتكون الجدول من أعمدة (حقول) وصفوف (سجلات)؛ له اسم فريد داخل قاعدة البيانات. يعكس الجدول نوع كائن (كيان) العالم الحقيقي، ويمثل كل صف من صفوفه كائنًا محددًا. كل عمود في الجدول عبارة عن مجموعة من القيم لسمة معينة لكائن ما. يتم تحديد القيم من مجموعة جميع القيم الممكنة لسمة الكائن، والتي تسمى المجال.

في صورته الأكثر عمومية، يتم تعريف المجال عن طريق تحديد بعض أنواع البيانات الأساسية التي تنتمي إليها عناصر المجال، وتطبيق تعبير منطقي عشوائي على عناصر البيانات. إذا قمت بتقييم شرط منطقي على عنصر بيانات وكانت النتيجة صحيحة، فإن هذا العنصر ينتمي إلى المجال. في أبسط الحالات، يتم تعريف المجال على أنه مجموعة محتملة صالحة من القيم من نفس النوع. على سبيل المثال، يشكل جمع تواريخ ميلاد كافة الموظفين "مجال تاريخ الميلاد" وتشكل أسماء كافة الموظفين "مجال اسم الموظف". يحتوي مجال تاريخ الميلاد على نوع بيانات نقطة زمنية، ويجب أن يحتوي مجال اسم الموظف على نوع بيانات حرف.

إذا جاءت قيمتان من نفس المجال، فيمكن إجراء مقارنة بين القيمتين. على سبيل المثال، إذا تم أخذ قيمتين من مجال تواريخ الميلاد، فيمكنك مقارنتهما وتحديد الموظف الأكبر سناً. إذا تم أخذ القيم من مجالات مختلفة، فلا يُسمح بمقارنتها، لأنها في جميع الاحتمالات غير منطقية. على سبيل المثال، لن يتم التوصل إلى شيء محدد عند مقارنة اسم الموظف وتاريخ ميلاده.

كل عمود (حقل) له اسم، والذي يُكتب عادة في أعلى الجدول. عند تصميم الجداول ضمن نظام إدارة قواعد بيانات معين، من الممكن تحديد نوعه لكل حقل، أي تحديد مجموعة من القواعد لعرضه، وكذلك تحديد العمليات التي يمكن إجراؤها على البيانات المخزنة في هذا الحقل. قد تختلف مجموعات الأنواع بين أنظمة إدارة قواعد البيانات المختلفة.

يجب أن يكون اسم الحقل فريدًا في الجدول، ولكن يمكن أن تحتوي الجداول المختلفة على حقول بنفس الاسم. يجب أن يحتوي أي جدول على حقل واحد على الأقل؛ توجد الحقول في الجدول وفقًا للترتيب الذي ظهرت به أسماؤها عند إنشائها. على عكس الحقول، لا تحتوي السلاسل على أسماء؛ لم يتم تحديد ترتيبها في الجدول، وعددها غير محدود منطقيا.

نظرًا لأن الصفوف في الجدول غير مرتبة، فمن المستحيل تحديد صف حسب موضعه - فلا يوجد بينها "الأول" أو "الثاني" أو "الأخير". يحتوي أي جدول على عمود واحد أو أكثر، تحدد قيمه كل صف من صفوفه بشكل فريد. يُسمى هذا العمود (أو مجموعة الأعمدة) بالمفتاح الأساسي. غالبًا ما يتم تقديم حقل اصطناعي لأرقام السجلات في الجدول. مثل هذا الحقل، على سبيل المثال، يمكن أن يكون حقله الترتيبي، والذي يمكن أن يضمن تفرد كل سجل في الجدول. يجب أن يتمتع المفتاح بالخصائص التالية:

التفرد. في أي وقت، لا يوجد مجموعتان مختلفتان من العلاقات لهما نفس القيمة لمجموعة السمات المضمنة في المفتاح. أي أنه لا يمكن أن يكون هناك صفين في الجدول لهما نفس رقم التعريف أو رقم جواز السفر.

تقليلية. لا يمكن استبعاد أي من السمات المضمنة في المفتاح من المفتاح دون انتهاك التفرد. وهذا يعني أنه لا ينبغي عليك إنشاء مفتاح يتضمن رقم جواز السفر ورقم الهوية. يكفي استخدام أي من هذه السمات لتحديد الصف بشكل فريد. يجب عليك أيضًا عدم تضمين سمة غير فريدة في المفتاح، أي أنه يُحظر استخدام مزيج من رقم التعريف واسم الموظف كمفتاح. ومن خلال استبعاد اسم الموظف من المفتاح، لا يزال من الممكن تحديد كل صف بشكل فريد.

تحتوي كل علاقة على مفتاح واحد محتمل على الأقل، حيث أن مجمل جميع سماتها يفي بشرط التفرد - وهذا ينبع من تعريف العلاقة ذاته.

يتم اختيار أحد المفاتيح المحتملة بشكل عشوائي ليكون المفتاح الأساسي. يتم أخذ المفاتيح المحتملة المتبقية، إن وجدت، كمفاتيح بديلة. على سبيل المثال، إذا قمت بتحديد رقم تعريف كمفتاح أساسي، فسيكون رقم جواز السفر هو المفتاح البديل.

تعد العلاقة بين الجداول أهم عنصر في نموذج البيانات العلائقية. وهو مدعوم بالمفاتيح الخارجية.

لا يمكن تخزين الجداول ومعالجتها إذا لم تكن هناك "بيانات حول البيانات" في قاعدة البيانات، مثل مقابض الجداول والأعمدة وما إلى ذلك. وتسمى عادة البيانات الوصفية. يتم أيضًا تقديم البيانات الوصفية في شكل جدول ويتم تخزينها في قاموس البيانات.

بالإضافة إلى الجداول، يمكن لقاعدة البيانات تخزين كائنات أخرى، مثل شاشات العرض والتقارير وطرق العرض وحتى برامج التطبيقات التي تعمل مع قاعدة البيانات.

بالنسبة لمستخدمي نظام المعلومات، لا يكفي أن تعكس قاعدة البيانات ببساطة كائنات العالم الحقيقي. من المهم أن يكون هذا التفكير واضحًا ومتسقًا. في هذه الحالة، يقال أن قاعدة البيانات تفي بشرط التكامل.

من أجل ضمان صحة البيانات واتساقها المتبادل، يتم فرض قيود معينة على قاعدة البيانات، والتي تسمى قيود تكامل البيانات.

في نموذج Codd العلائقي، هناك العديد من شروط القيد المستخدمة للتحقق من صحة البيانات في قاعدة البيانات وأيضًا لجعل بنية البيانات ذات معنى. من المعتاد تسليط الضوء على القيود التالية:

النزاهة الفئوية؛

النزاهة على المستوى المرجعي؛

التبعيات الوظيفية.

يعمل الجزء المتكامل من نموذج البيانات العلائقية على إصلاح اثنين من متطلبات التكامل الأساسية التي يجب دعمها في أي نظام إدارة قواعد بيانات علائقي. الشرط الأول يسمى متطلبات سلامة الكيان. كائن أو كيان من العالم الحقيقي في قواعد البيانات العلائقية يتوافق مع مجموعات من العلاقات. على وجه التحديد، الشرط هو أن أي صف من أي قيمة علاقة لأي متغير علاقة يجب تمييزه عن أي صف آخر من قيمة العلاقة تلك من خلال القيم المركبة لمجموعة محددة مسبقًا من سمات متغير العلاقة، أي بمعنى آخر، يجب أن يكون لأي متغير علاقة مفتاح أساسي. يتم استيفاء هذا المطلب تلقائيًا في حالة عدم انتهاك الخصائص الأساسية للعلاقات في النظام.

متطلبات تكامل الكيان هي كما يلي: يجب أن يحتوي أي متغير علاقة على مفتاح أساسي، ويجب ألا تحتوي قيمة المفتاح الأساسي في مجموعات قيمة العلاقة لمتغير العلاقة على قيم غير محددة. لجعل هذه الصيغة واضحة تماما، دعونا نناقش بإيجاز مفهوم القيمة الخالية (NULL).

بالطبع، من الناحية النظرية، يجب أن يحتوي أي صف تم إدخاله في علاقة مستمرة على جميع خصائص كيان العالم الحقيقي الذي نماذجه التي نريد تخزينها في قاعدة البيانات. ومع ذلك، من الناحية العملية، قد لا تكون كل هذه الخصائص معروفة في الوقت الذي يحتاج فيه الكيان إلى التسجيل في قاعدة البيانات.

اقترح إدغار كود استخدام قيم غير محددة في مثل هذه الحالات. لا تنتمي القيمة الخالية إلى أي نوع بيانات ويمكن أن تكون موجودة بين قيم أي سمة محددة في أي نوع بيانات (ما لم يحظرها تعريف السمة صراحةً).

لذا فإن أول المتطلبات - شرط سلامة الكيان - يعني أن المفتاح الأساسي يجب أن يحدد كل كيان بشكل كامل، وبالتالي لا يسمح بوجود قيم غير محددة في أي قيمة للمفتاح الأساسي. (في النموذج العلائقي الكلاسيكي، ينطبق هذا المتطلب أيضًا على المفاتيح المحتملة؛ في أنظمة إدارة قواعد البيانات الموجهة نحو SQL، لا يتم دعم مثل هذا المتطلب للمفاتيح المحتملة).

أما المتطلب الثاني، الذي يسمى التكامل المرجعي، فهو أكثر تعقيدًا. من الواضح أنه إذا تم تطبيع العلاقات، فسيتم تمثيل الكيانات المعقدة للعالم الحقيقي في قاعدة بيانات علائقية في شكل عدة صفوف من عدة علاقات. بالطبع، يمكن أن يكون المفتاح الخارجي مركبًا، أي أنه يمكن أن يتكون من عدة سمات. يُقال إن العلاقة التي يتم فيها تعريف المفتاح الخارجي تشير إلى علاقة مقابلة تكون فيها السمة نفسها هي المفتاح الأساسي.

متطلبات التكامل المرجعي، أو متطلبات تكامل المفتاح الخارجي، هي أنه لكل قيمة مفتاح خارجي تظهر في صف قيمة العلاقة لمتغير العلاقة المرجعية، أو في القيمة العلاقة لمتغير علاقة مرجعي، يجب أن يكون هناك صف مع ذلك نفس قيمة المفتاح الأساسي، أو يجب أن تكون قيمة المفتاح الخارجي غير محددة تمامًا (أي تشير إلى لا شيء).

تجدر الإشارة إلى أنه، مثل المفتاح الأساسي، يجب تحديد المفتاح الخارجي عند تعريف متغير العلاقة ويمثل قيدًا على القيم العلائقية المسموح بها لهذا المتغير. بمعنى آخر، تعريف المفتاح الخارجي هو تعريف قيد تكامل قاعدة البيانات.

يجب أن يدعم نظام إدارة قواعد البيانات قيود الكيان والتكامل المرجعي. للحفاظ على سلامة الكيان، يكفي التأكد من أن أي متغير علاقة لا يحتوي على قيم علاقة تحتوي على صفوف بنفس قيمة المفتاح الأساسي (ويحظر إدخال قيم غير محددة في قيمة المفتاح الأساسي). مع التكامل المرجعي الوضع أكثر تعقيدا إلى حد ما.

من الواضح أنه عند تحديث علاقة مرجعية (إدراج صفوف جديدة أو تعديل قيمة مفتاح خارجي في صفوف موجودة)، يكفي التأكد من عدم ظهور قيم مفاتيح خارجية غير صحيحة.

هناك ثلاثة أساليب، جميعها تدعم التكامل المرجعي. تتمثل الطريقة الأولى في عدم حذف الصف المرجعي على الإطلاق (أي إما حذف الصف المرجعي أولاً أو تغيير قيم المفاتيح الخارجية الخاصة به وفقًا لذلك). في الطريقة الثانية، عندما يتم حذف الصف المشار إليه، تصبح قيمة المفتاح الخارجي في جميع المجموعات المرجعية غير محددة تمامًا تلقائيًا. أخيرًا، النهج الثالث (الحذف المتتالي) هو أنه عندما يتم حذف صف من علاقة مرجعية، يتم حذف جميع المجموعات المرجعية تلقائيًا من العلاقة المرجعية.

في أنظمة إدارة قواعد البيانات العلائقية الناضجة، من الممكن عادةً اختيار كيفية الحفاظ على التكامل المرجعي لكل مثيل لتعريف المفتاح الخارجي. وبطبيعة الحال، لاتخاذ مثل هذا القرار، من الضروري تحليل متطلبات مجال تطبيق معين.

أي شركة تنتج أنظمة إدارة قواعد البيانات هذه تسميها أنظمة علائقية. من المهم جدًا أن نفهم بوضوح خصائص هذه الأنظمة التي تعتبر علائقية حقًا، وما الذي لا يتوافق تمامًا مع الأفكار الأصلية والواضحة والصارمة للنهج العلائقي بل ويتعارض معها. سيساعدك هذا على تنظيم قواعد البيانات بشكل أكثر صحة وبناء التطبيقات في بيئة DBMS الموجهة نحو SQL.

يتم كتابة قيم البيانات المخزنة في قاعدة البيانات العلائقية، أي أن نوع كل قيمة مخزنة معروف. يتوافق مفهوم نوع البيانات في نموذج البيانات العلائقية تمامًا مع مفهوم نوع البيانات في لغات البرمجة. يتكون التعريف التقليدي (المتساهل) لنوع البيانات من ثلاثة مكونات رئيسية: تعريف مجموعة من القيم لنوع معين؛ تحديد مجموعة من العمليات المطبقة على قيم النوع؛ تحديد طريقة التمثيل الخارجي لقيم النوع (الأحرف).

عادةً، تسمح قواعد البيانات العلائقية الحديثة بتخزين الأحرف والبيانات الرقمية (الدقيقة والتقريبية)، والبيانات الرقمية المتخصصة (مثل "المال")، بالإضافة إلى البيانات "الزمنية" الخاصة (التاريخ والوقت والفاصل الزمني). بالإضافة إلى ذلك، تدعم الأنظمة العلائقية قدرة المستخدمين على تحديد أنواع البيانات الخاصة بهم.

يعتبر مفهوم النطاق أكثر تحديدًا لقواعد البيانات، على الرغم من وجود تشابهات مع الأنواع الفرعية في بعض لغات البرمجة (في الواقع، في بيانهم الثالث، ألغى كريستوفر ديت وهيو داروين التمييز بين المجال ونوع البيانات تمامًا). بشكل عام، يتم تعريف المجال عن طريق تحديد بعض أنواع البيانات الأساسية التي تنتمي إليها عناصر المجال، ويتم تطبيق تعبير منطقي عشوائي على عنصر من نوع البيانات هذا (قيود المجال). يعد عنصر البيانات عنصر مجال إذا وفقط إذا تم تقييم تقييم هذا التعبير المنطقي على أنه صحيح. ويرتبط كل مجال باسم فريد من بين أسماء جميع المجالات في قاعدة البيانات المقابلة.

التفسير البديهي الأكثر صحة لمفهوم المجال هو تصوره كاحتمال مقبول، مجموعة فرعية محدودة من القيم من نوع معين. على سبيل المثال، في النوع الأساسي من سلاسل الأحرف، ولكن يمكن أن تتضمن قيمها فقط تلك السلاسل التي يمكن أن تمثل الأسماء (على وجه الخصوص، لتتمكن من تمثيل الأسماء الروسية، لا يمكن أن تبدأ هذه السلاسل بحرف ناعم أو صلب ولا يمكن أن تكون أطول، على سبيل المثال، 20 حرفًا). إذا تم تعريف سمة معينة للعلاقة على سمة معينة، فإن قيد المجال يلعب لاحقًا دور قيد التكامل المفروض على قيم هذه السمة.

في قواعد البيانات العلائقية الكلاسيكية، بمجرد تحديد مخطط قاعدة البيانات، يمكن تغيير قيم متغيرات العلاقة فقط. ومع ذلك، أصبح من الممكن الآن في معظم التطبيقات تغيير مخطط قاعدة البيانات: تحديد رؤوس جديدة وتغيير رؤوس متغيرات العلاقة الموجودة. وهذا ما يسمى عادة تطور مخطط قاعدة البيانات.

بحكم التعريف، المفتاح الأساسي لمتغير العلاقة هو مجموعة فرعية S من مجموعة سمات رأسه بحيث تكون قيمة المفتاح الأساسي في أي وقت (مركبة إذا كان المفتاح الأساسي يحتوي على أكثر من سمة واحدة) في أي مجموعة من نص تختلف العلاقة عن قيمة المفتاح الأساسي في أي جسم صفي آخر لهذه العلاقة، ولا توجد مجموعة فرعية مناسبة من S تمتلك هذه الخاصية.

إن وجود مفتاح أساسي لأي قيمة علاقة هو نتيجة لإحدى الخصائص الأساسية للعلاقات، وهي خاصية أن جسم العلاقة عبارة عن مجموعة من الصفوف.

تمثيل العلاقة في نموذج البيانات العلائقية هو جدول، رأسه هو مخطط العلاقة، والصفوف هي صفوف علاقة المثيل؛ في هذه الحالة، تتوافق أسماء السمات مع أسماء أعمدة الجدول المحدد. لذلك، يتحدث الناس أحيانًا عن "أعمدة الجدول"، أي "سمات العلاقة".

لا ينبغي أبدًا أن تحتوي العلاقات على صفوف مكررة؛ وهذا يتبع تعريف جسم العلاقة كمجموعة من الصفوف. في نظرية المجموعات الكلاسيكية، بحكم التعريف، أي مجموعة تتكون من عناصر مختلفة.

من هذه الخاصية، تحتوي كل قيمة علاقة على مفتاح أساسي - الحد الأدنى من مجموعة السمات، وهي مجموعة فرعية من رأس علاقة معينة، والتي تحدد قيمتها المركبة صف العلاقة بشكل فريد. في الواقع، بما أن جميع صفوف جسم أي علاقة تكون مختلفة في أي وقت، فإن المجموعة الكاملة لخصائصها على الأقل تتمتع بخاصية التفرد لأي قيمة علاقة. ومع ذلك، في التعريف الرسمي للمفتاح الأساسي، يلزم ضمان "الحد الأدنى" له، أي أن مجموعة سمات المفتاح الأساسي لا ينبغي أن تتضمن سمات يمكن التخلص منها دون المساس بالخاصية الرئيسية - التعريف الفريد للمفتاح الأساسي. مترابطة بيانية. سنوضح بعد قليل سبب أهمية خاصية الحد الأدنى للمفتاح الأساسي. ومن الواضح أنه إذا كانت أي علاقة تحتوي على مجموعة من السمات التي لها خاصية التفرد، فإن هناك أيضًا مجموعة دنيا من السمات التي لها خاصية التفرد.

قد تكون هناك قيم علاقات ذات مجموعات متعددة غير متطابقة من السمات التي لها خصائص فريدة. في هذه الحالة، يجب على مصمم قاعدة البيانات أن يقرر أي من مجموعات السمات البديلة التي سيتم استدعاء المفتاح الأساسي، وتسمى مجموعات السمات الدنيا المتبقية التي لها خاصية التفرد بمفاتيح مرشحة.

يعد مفهوم المفتاح الأساسي مهمًا للغاية فيما يتعلق بمفهوم تكامل قاعدة البيانات. لاحظ أنه على الرغم من أن وجود المفتاح الأساسي لقيمة العلاقة بشكل رسمي هو نتيجة لحقيقة أن جسم العلاقة عبارة عن مجموعة، إلا أن المفاتيح الأساسية (والمحتملة) لمتغيرات العلاقة تظهر في الممارسة العملية نتيجة لتعليمات صريحة من مصمم العلاقة. من خلال تحديد متغير العلاقة، يقوم المصمم بتصميم جزء من مجال الموضوع الذي ستحتوي قاعدة البيانات منه على بيانات. وبالطبع يجب على المصمم أن يعرف طبيعة هذه البيانات.

في نظام إدارة قواعد البيانات العلائقية، من المستحيل تخزين مجموعات العلاقات على المستوى المادي بالترتيب الذي يطلبه المطورون. إن غياب متطلبات الحفاظ على النظام في مجموعة مجموعات العلاقات يمنح نظام إدارة قواعد البيانات مرونة إضافية عند تخزين قواعد البيانات في الذاكرة الخارجية وعند تنفيذ استعلامات قاعدة البيانات. هذا لا يتعارض مع حقيقة أنه عند صياغة استعلام قاعدة بيانات، على سبيل المثال، في SQL، يمكنك أن تطلب فرز الجدول الناتج وفقا لقيم بعض الأعمدة. مثل هذه النتيجة، بشكل عام، ليست علاقة، ولكنها قائمة مرتبة من الصفوف، ويمكن أن تكون فقط النتيجة النهائية، والتي لم يعد من الممكن معالجة الاستعلامات لها.

وفقًا لتفسير ديت، يتكون النموذج العلائقي من ثلاثة أجزاء تصف جوانب مختلفة من النهج العلائقي: الجزء الهيكلي، وجزء التلاعب، والجزء الشمولي (K. Date, 2000).

ينص الجزء الهيكلي من النموذج على أن بنية البيانات العامة الوحيدة المستخدمة في قواعد البيانات العلائقية هي العلاقة الزوجية الطبيعية. يتم تعريف مفاهيم المجالات والسمات والصفوف والرأس والنص ومتغير العلاقة. في الواقع، كانت مفاهيم وخصائص المكون الهيكلي للنموذج العلائقي هي التي تم النظر فيها أعلاه.

يحدد جزء المعالجة من النموذج آليتين أساسيتين لمعالجة قواعد البيانات العلائقية - الجبر العلائقي وحساب التفاضل والتكامل العلائقي. تعتمد الآلية الأولى بشكل أساسي على نظرية المجموعات الكلاسيكية (مع بعض التحسينات والإضافات)، وتعتمد الثانية على الجهاز المنطقي الكلاسيكي لحساب التفاضل والتكامل المسند من الدرجة الأولى. تتمثل الوظيفة الرئيسية لجزء المعالجة في النموذج العلائقي في توفير مقياس لعلاقة أي لغة قاعدة بيانات علائقية محددة: تسمى اللغة علائقية إذا لم تكن أقل تعبيرًا وقوة من الجبر العلائقي أو حساب التفاضل والتكامل العلائقي.

من كل ما سبق، يترتب على أن النهج الكلاسيكي لتصميم هياكل قواعد البيانات العلائقية لديه المشاكل التالية:

1. تحديد التبعيات الوظيفية؛

2. تعقيد تحديد كافة التبعيات الوظيفية؛

3. اعتماد نتيجة التصميم النهائية على خبرة المصمم ووجهة نظره الذاتية، وليس على منهجية التصميم الرسمية.

4. مشكلة تحديد الكيانات وسمات الكيانات.

1.3 طرق تصميم DB IS

تتكون منهجية إنشاء نظم المعلومات من تنظيم عملية بناء نظام معلومات وإدارة هذه العملية من أجل ضمان تلبية متطلبات النظام نفسه وخصائص عملية التطوير.

المهام الرئيسية، التي ينبغي ضمان حلها من خلال منهجية إنشاء نظم المعلومات (IS) (بمساعدة مجموعة مناسبة من الأدوات)، هي:

امتثال نظام المعلومات الذي تم إنشاؤه لأهداف وغايات المؤسسة، بالإضافة إلى متطلباته لأتمتة العمليات المطلوبة وضمان إنشاء نظام بالمعلمات المحددة خلال فترة زمنية معينة في إطار متفق عليه مسبقًا ميزانية؛

سهولة صيانة النظام وتعديله وتوسيعه من أجل ضمان امتثاله لظروف التشغيل المتغيرة للمؤسسة وامتثال نظام المعلومات الذي تم إنشاؤه لمتطلبات الانفتاح وقابلية النقل وقابلية التوسع؛

القدرة على استخدام أدوات تكنولوجيا المعلومات التي تم تطويرها واستخدامها مسبقًا في النظام الذي تم إنشاؤه (البرامج وقواعد البيانات وأجهزة الكمبيوتر والاتصالات).

تشكل المنهجيات والتقنيات وأدوات التصميم (أدوات CASE) أساس أي تصميم لنظام معلومات. يتم تنفيذ المنهجية من خلال تقنيات محددة ومعايير وأساليب وأدوات داعمة تضمن تنفيذ عمليات دورة حياة أنظمة المعلومات.

1. تسلسل معين لعمليات التصميم التكنولوجي؛

2. المعايير والقواعد المستخدمة لتقييم نتائج العمليات التكنولوجية.

3. الأدوات الرسومية والنصية (التدوينات) المستخدمة لوصف النظام الذي يتم تصميمه.

علاوة على ذلك، يجب تزويد كل عملية تكنولوجية بالمواد والمعلومات والموارد البشرية المناسبة. (البيانات التي تم الحصول عليها من عملية سابقة (أو بيانات المصدر)، مقدمة في نموذج قياسي، والمواد المنهجية، والتعليمات، واللوائح والمعايير، والبرمجيات والأجهزة وفناني الأداء).

يجب تقديم نتائج العملية في شكل قياسي ما، مما يضمن تصورها المناسب عند إجراء العملية التكنولوجية التالية (والتي سيتم استخدامها كبيانات إدخال). يجب أن تستوفي تكنولوجيا تصميم وتطوير وصيانة نظم المعلومات عددًا من القواعد العامة:

دعم دورة الحياة الكاملة لنظام المعلومات؛

توفير القدرة على إدارة تكوين المشروع، والحفاظ على إصدارات المشروع ومكوناته، وإصدار وثائق المشروع تلقائيًا ومزامنة إصداراته مع إصدارات المشروع؛

ضمان تحقيق أهداف تطوير نظام بجودة معينة في وقت محدد وإمكانية تقسيم (تفكيك) المشاريع الكبيرة إلى عدد من الأنظمة الفرعية، كأجزاء مكونة، يتم تطويرها بواسطة مجموعات من فناني الأداء بعدد محدود، مع التكامل اللاحق لهذه الأجزاء.

توفير القدرة على تنفيذ العمل على تصميم الأنظمة الفرعية الفردية في مجموعات صغيرة، والتي يتم تحديدها من خلال مبادئ التحكم في الفريق وزيادة الإنتاجية عن طريق تقليل عدد الاتصالات الخارجية.

ضمان الحد الأدنى من الوقت للحصول على نظام العمل. (تنفيذ نظام المعلومات ليس ككل، ولكن تطوير وتنفيذ أنظمته الفرعية الفردية)؛

التأكد من استقلالية حلول التصميم المنفذة عن وسائل تنفيذ النظام – نظام إدارة قواعد البيانات ونظام التشغيل واللغة ونظام البرمجة.

في المرحلة الأولى من وجود أنظمة المعلومات الحاسوبية، تم تطويرها بلغات البرمجة التقليدية. ومع ذلك، مع زيادة تعقيد الأنظمة المتقدمة واحتياجات المستخدمين، بسبب التقدم التكنولوجي وظهور واجهات المستخدم الرسومية سهلة الاستخدام في برمجيات النظام. وظهرت منهجية لإنشاء نظم المعلومات، تعتمد على استخدام أدوات تطوير التطبيقات السريعة، والتي أصبحت منتشرة في الآونة الأخيرة وتسمى بمنهجية تطوير التطبيقات السريعة (RAD). تغطي هذه المنهجية جميع مراحل دورة حياة أنظمة المعلومات الحديثة وهي عبارة عن مجموعة من الأدوات الخاصة التي تسمح لك بالعمل مع مجموعة معينة من الكائنات الرسومية التي تعرض بشكل وظيفي مكونات المعلومات الفردية للتطبيقات.

تشير منهجية تطوير التطبيقات السريعة عادة إلى عملية تطوير نظم المعلومات التي تعتمد على ثلاثة عناصر رئيسية:

على فريق صغير من المبرمجين (عادة من 2 إلى 10 أشخاص)؛

وفقًا لجدول إنتاج تم إعداده بعناية، ومصمم لفترة تطوير قصيرة نسبيًا؛

في نموذج تطوير متكرر يعتمد على التفاعل الوثيق مع العميل، عندما يقوم المطورون، مع تقدم المشروع، بتوضيح وتنفيذ المتطلبات التي طرحها العميل في المنتج.

المبادئ الأساسية لمنهجية RAD هي أنها تستخدم نموذج تطوير تكراري (حلزوني). ليس من الضروري استكمال العمل في كل مرحلة من مراحل دورة الحياة. في عملية تطوير نظام المعلومات، التي يقوم بها فريق صغير ومُدار بشكل جيد من المحترفين، يتم ضمان التفاعل الوثيق مع العميل والمستخدمين المستقبليين. يتم استخدام أدوات CASE وأدوات تطوير التطبيقات السريعة، بالإضافة إلى أدوات إدارة التكوين التي تسهل إجراء تغييرات على المشروع والحفاظ على النظام النهائي. تُستخدم النماذج الأولية لفهم احتياجات المستخدم النهائي وتحقيقها بشكل أفضل. يتم إجراء اختبار المشروع وتطويره بالتزامن مع التطوير. يتم توفير الإدارة المختصة لتطوير النظام والتخطيط الواضح والتحكم في تنفيذ العمل.

أدوات CASE (من البرامج المدعومة بالكمبيوتر/هندسة الأنظمة) - تسمح لك بتصميم أي نظام على جهاز الكمبيوتر. تتيح لك أدوات CASE، باعتبارها عنصرًا ضروريًا في التحليل الوظيفي النظامي والهيكلي، نمذجة العمليات التجارية وقواعد البيانات ومكونات البرامج والأنشطة وهيكل المؤسسات

ينطبق في جميع مجالات النشاط تقريبًا. نتيجة استخدام أدوات CASE هي تحسين النظام، وخفض التكلفة، وزيادة الكفاءة، وتقليل احتمالية حدوث أخطاء.

أتاحت أدوات RAD تنفيذ تقنية مختلفة تمامًا لإنشاء التطبيقات مقارنة بالتطبيقات التقليدية. يتم تشكيل كائنات المعلومات كنماذج عمل معينة (نماذج أولية)، والتي يتوافق عملها مع المستخدم، ومن ثم يمكن للمطور البدء مباشرة في تكوين تطبيقات كاملة دون إغفال الصورة العامة للنظام المصمم.

إن القدرة على استخدام هذا النهج هي إلى حد كبير نتيجة لتطبيق مبادئ التصميم الموجه للكائنات (OOD). تساعد هذه المبادئ في التغلب على إحدى الصعوبات الرئيسية التي تتم مواجهتها عند تطوير الأنظمة المعقدة. فجوة هائلة بين العالم الحقيقي (مجال الموضوع) والبيئة المحاكاة.

كما أنها تسمح لك بإنشاء وصف (نموذج) لمجال الموضوع في شكل مجموعة من الكائنات - الكيانات التي تجمع بين البيانات وطرق معالجة هذه البيانات (الإجراءات). حيث يكون لكل كائن سلوكه الخاص ونماذج بعض كائنات العالم الحقيقي. من وجهة النظر هذه، يكون الكائن ملموسًا تمامًا ويظهر سلوكًا معينًا.

في النهج القائم على الكائن، يتم التركيز على الخصائص المحددة للنظام المادي أو المجرد الذي هو موضوع النمذجة البرمجية. الكائنات لديها سلامة لا يمكن انتهاكها. وبالتالي، فإن الخصائص التي تميز الكائن وسلوكه تظل دون تغيير. لا يمكن للكائن إلا أن يغير حالته، أو يتم التحكم فيه، أو يصبح في علاقة معينة مع كائنات أخرى.

أصبح التصميم الموجه للكائنات منتشرًا على نطاق واسع مع ظهور أدوات البرمجة المرئية التي توفر دمج (تغليف) البيانات مع الإجراءات التي تصف سلوك الكائنات الحقيقية في كائنات البرنامج التي يمكن عرضها بطريقة معينة في بيئة مستخدم رسومية. هذا جعل من الممكن البدء في إنشاء أنظمة برمجية تشبه الأنظمة الحقيقية قدر الإمكان وتحقيق أعلى مستوى من التجريد. في المقابل، تتيح لك البرمجة الموجهة للكائنات إنشاء تعليمات برمجية أكثر موثوقية لأن كائنات البرنامج لها واجهة محددة جيدًا ويتم التحكم فيها بإحكام.

يستخدم تطوير التطبيقات باستخدام أدوات RAD مجموعة متنوعة من الكائنات المعدة مسبقًا والمخزنة في وحدة التخزين المشتركة. ومع ذلك، هناك أيضًا إمكانية تطوير مرافق جديدة. وفي الوقت نفسه، يمكن تطوير كائنات جديدة إما على أساس الكائنات الموجودة أو من الصفر.

تحتوي أدوات RAD على واجهة مستخدم رسومية سهلة الاستخدام وتسمح لك بإنشاء تطبيقات بسيطة تعتمد على كائنات قياسية دون كتابة تعليمات برمجية برمجية. هذه ميزة كبيرة لـ RAD، لأنها تقلل بشكل كبير من العمل الروتيني لتطوير واجهات المستخدم (باستخدام الأدوات التقليدية، يعد تطوير الواجهات مهمة كثيفة العمالة إلى حد ما، ويستغرق حلها الكثير من الوقت). تتيح لك السرعة العالية لتطوير الواجهة الأمامية للتطبيق إنشاء نماذج أولية بسرعة وتبسيط التفاعل مع المستخدمين النهائيين.

وبالتالي، تتيح أدوات RAD للمطورين تركيز جهودهم على جوهر عمليات الإنتاج الحقيقية للمؤسسة التي يتم إنشاء نظام المعلومات من أجلها. مما يؤدي إلى زيادة جودة النظام المطور.

دعونا نفكر في نهج التصميم الهيكلي. يكمن جوهر النهج الهيكلي لتطوير نظم المعلومات في تحللها (تقسيمها) إلى وظائف آلية: ينقسم النظام إلى أنظمة فرعية وظيفية، والتي بدورها تنقسم إلى وظائف فرعية، وتنقسم إلى مهام، وما إلى ذلك. تستمر عملية التقسيم وصولاً إلى إجراءات محددة. وفي الوقت نفسه، يحافظ النظام الآلي على رؤية شمولية تكون فيها جميع المكونات مترابطة. عند تطوير نظام "من الأسفل إلى الأعلى" من المهام الفردية إلى النظام بأكمله، يتم فقدان السلامة، وتنشأ مشاكل في اتصال المعلومات للمكونات الفردية.

تعتمد جميع منهجيات النهج الهيكلي الأكثر شيوعًا على عدد من المبادئ العامة. يتم استخدام المبدأين الأساسيين التاليين:

مبدأ "فرق تسد" هو مبدأ حل المشكلات المعقدة عن طريق تقسيمها إلى العديد من المشكلات المستقلة الأصغر التي يسهل فهمها وحلها؛

مبدأ الترتيب الهرمي هو مبدأ تنظيم مكونات المشكلة في هياكل شجرة هرمية مع إضافة تفاصيل جديدة في كل مستوى.

إن إبراز مبدأين أساسيين لا يعني أن المبادئ المتبقية ثانوية، حيث أن تجاهل أي منهما يمكن أن يؤدي إلى عواقب لا يمكن التنبؤ بها (بما في ذلك فشل المشروع بأكمله). ومن أهم هذه المبادئ ما يلي:

مبدأ التجريد هو تسليط الضوء على الجوانب الأساسية للنظام والتجريد من غير المهم؛

مبدأ إضفاء الطابع الرسمي هو الحاجة إلى اتباع نهج منهجي صارم لحل المشكلة؛

مبدأ الاتساق – يكمن في صحة العناصر وتناسقها؛

مبدأ هيكلة البيانات هو أن البيانات يجب أن تكون منظمة ومنظمة بشكل هرمي.

يستخدم التحليل الهيكلي بشكل أساسي مجموعتين من الأدوات لتوضيح الوظائف التي يؤديها النظام والعلاقات بين البيانات. تتوافق كل مجموعة من الأدوات مع أنواع معينة من النماذج (الرسوم البيانية)، وأكثرها شيوعًا هي: ERD (مخططات علاقة الكيان) مخططات "علاقة الكيان".

في مرحلة تصميم نظم المعلومات، يتم توسيع النماذج وتحسينها وتكميلها برسوم بيانية تعكس هيكل البرنامج: بنية البرنامج، ومخططات كتلة البرنامج، ومخططات شكل الشاشة.

النموذج الدلالي (النموذج المفاهيمي، النموذج المعلوماتي) هو نموذج لمجال الموضوع مصمم لتمثيل دلالات مجال الموضوع على أعلى مستوى من التجريد. وهذا يعني أن الحاجة إلى استخدام المفاهيم "منخفضة المستوى" المرتبطة بالتمثيل المادي المحدد وتخزين البيانات قد تم التخلص منها أو التقليل منها.

كانت النمذجة الدلالية موضوع بحث مكثف منذ أواخر السبعينيات. كان الدافع الرئيسي لمثل هذا البحث (أي المشكلة التي كان الباحثون يحاولون حلها) هو الحقيقة التالية. والحقيقة هي أن أنظمة قواعد البيانات عادة ما تكون لديها معرفة محدودة جدًا بمعنى البيانات المخزنة فيها. في أغلب الأحيان، تسمح فقط بمعالجة البيانات من أنواع بسيطة معينة وتحدد بعض قيود التكامل البسيطة المفروضة على هذه البيانات. أي تفسير أكثر تعقيدا هو مسؤولية المستخدم. ومع ذلك، سيكون من الرائع أن تكون الأنظمة أكثر معرفة وأكثر ذكاءً في الاستجابة لاستفسارات المستخدم، بالإضافة إلى دعم واجهات المستخدم الأكثر تعقيدًا (أي ذات المستوى الأعلى).

يمكن أن تكون أفكار النمذجة الدلالية مفيدة كأداة لتصميم قاعدة البيانات حتى لو لم تكن مدعومة بشكل مباشر من قبل نظام إدارة قواعد البيانات.

أشهر ممثل لفئة النماذج الدلالية هو نموذج العلاقة بين الكيان (نموذج ER). تعتمد منهجية بناء قواعد البيانات على الأسس النظرية لتصميمها. لفهم مفهوم المنهجية، نعرض أفكارها الرئيسية على شكل مرحلتين يتم تنفيذهما عملياً تباعاً:

المرحلة الأولى - فحص كافة الأقسام الوظيفية بالشركة بهدف:

فهم تفاصيل وهيكل أنشطتها؛

إنشاء مخطط لتدفقات المعلومات:

تحليل النظام الحالي؛

تحديد كائنات المعلومات والتكوين المقابل للتفاصيل (المعلمات والخصائص) التي تصف خصائصها والغرض منها.

المرحلة الثانية - بناء نموذج المعلومات المفاهيمية والبيانات المنطقية لمجال النشاط الذي تم مسحه في المرحلة الأولى. في هذا النموذج، يجب إنشاء جميع الروابط بين الكائنات وتفاصيلها وتحسينها. النموذج المنطقي للمعلومات هو الأساس الذي سيتم إنشاء قاعدة البيانات عليه.

نموذج العلاقة بين الكيان (ERM) هو نموذج بيانات يسمح لك بوصف المخططات المفاهيمية. يوفر تدوينًا رسوميًا يعتمد على الكتل والخطوط التي تربط بينها، والتي يمكنك من خلالها وصف الكائنات والعلاقات بينها في بعض نماذج البيانات الأخرى. وبهذا المعنى، فإن نموذج ER هو نموذج بيانات وصفية، أي وسيلة لوصف نماذج البيانات.

تم اقتراح نموذج العلاقة بين الكيان في عام 1976 من قبل بيتر بين شين تشين، وهو أستاذ أمريكي لعلوم الكمبيوتر في جامعة ولاية لويزيانا. في الواقع، لم يخترع تشين النموذج، بل أخذ أفكارًا من أعمال سابقة لممارسين مثل أ. براون وآخرين. ومع ذلك، قام بيتر تشين أكثر من أي شخص قبله بإضفاء الطابع الرسمي على نموذج الطوارئ الإلكترونية وتعميمه، بالإضافة إلى إدخاله في الأدبيات العلمية.

نظرًا لوضوح عرض مخططات قاعدة البيانات المفاهيمية، أصبحت نماذج ER منتشرة على نطاق واسع في أنظمة CASE التي تدعم التصميم بمساعدة الكمبيوتر لقواعد البيانات العلائقية. من بين الرموز العديدة لنماذج ER، واحدة من أكثرها تطورًا هي لغة النمذجة الموحدة، abbr. UML – يستخدم في نظام CASE من ORACLE. يتم أيضًا استخدام تدوين UML و/أو دعمه بواسطة: Borland Software Corporation، جامعة بريمن، جامعة كينت، الجامعة.

المزايا الرئيسية لنماذج ER:

الرؤية؛

تتيح لك النماذج تصميم قواعد البيانات بعدد كبير من الكائنات والسمات؛

يتم تنفيذ نماذج التقارير الإلكترونية في العديد من أنظمة تصميم قواعد البيانات بمساعدة الكمبيوتر (على سبيل المثال، ERWin، وOracle Designer).

العناصر الأساسية لنماذج ER:

الكائنات (الكيانات)؛

سمات الكائن؛

الاتصالات بين الكائنات.

الكيان هو أي كائن مجال موضوع له سمات.

وتتميز العلاقة بين الكيانات بما يلي:

نوع الاتصال (1:1، 1:M، M:M)؛

فئة العضوية. يمكن أن يكون الفصل مطلوبًا أو اختياريًا. إذا كان كل مثيل كيان متضمنًا في علاقة، فستكون فئة العضوية إلزامية، وإلا فهي اختيارية.

التصميم المفاهيمي (المعلوماتي) – بناء نموذج رسمي لمجال الموضوع. يتم إنشاء مثل هذا النموذج باستخدام أدوات اللغة القياسية، والتي عادة ما تكون رسومية، مثل مخططات ER. تم إنشاء مثل هذا النموذج دون استهداف أي نظام إدارة قواعد بيانات محدد.

العناصر الرئيسية لهذا النموذج:

1. وصف كائنات مجال الموضوع والعلاقات بينها.

2. وصف احتياجات المستخدمين من المعلومات (وصف الاستعلامات الأساسية لقاعدة البيانات).

3. وصف تدفق الوثيقة. وصف المستندات المستخدمة كبيانات مصدر لقاعدة البيانات والمستندات المجمعة على أساس قاعدة البيانات.

4. وصف التبعيات الخوارزمية بين البيانات.

5. وصف قيود السلامة، أي. متطلبات قيم البيانات المقبولة والعلاقات بينها.

التصميم المنطقي (البياني) - تعيين نموذج معلومات على نموذج بيانات مستخدم في نظام إدارة قواعد بيانات محدد، على سبيل المثال، على نموذج بيانات علائقية. بالنسبة لأنظمة إدارة قواعد البيانات العلائقية، فإن نموذج البيانات عبارة عن مجموعة من الجداول، تشير عادةً إلى الحقول الرئيسية والعلاقات بين الجداول. إذا تم بناء نموذج المعلومات في شكل مخططات ER (أو وسائل رسمية أخرى)، فإن تصميم البيانات هو بناء الجداول وفقًا لقواعد رسمية معينة، بالإضافة إلى تسوية هذه الجداول. يمكن أن تكون هذه المرحلة آلية إلى حد كبير.

التصميم المادي هو تنفيذ نموذج بيانات باستخدام نظام إدارة قواعد البيانات (DBMS) محدد، بالإضافة إلى اختيار الحلول المتعلقة ببيئة تخزين البيانات الفعلية: اختيار طرق إدارة ذاكرة القرص، وطرق الوصول إلى البيانات، وطرق ضغط البيانات، وما إلى ذلك. – يتم حل هذه المهام بشكل أساسي عن طريق أدوات نظام إدارة قواعد البيانات (DBMS) وتكون مخفية عن مطور قاعدة البيانات.

في مرحلة تصميم المعلومات، أثناء جمع المعلومات حول مجال الموضوع، من الضروري معرفة:

1. الكائنات الرئيسية في مجال الموضوع (الكائنات التي يجب تخزين المعلومات عنها في قاعدة البيانات)؛

2. سمات الأشياء؛

3. الاتصالات بين الأشياء.

4. الاستعلامات الأساسية لقاعدة البيانات.

النموذج العادي هو خاصية العلاقة في نموذج البيانات العلائقية، وتميزها من وجهة نظر التكرار، والتي يمكن أن تؤدي إلى نتائج خاطئة منطقيا لأخذ العينات أو تغيير البيانات. يتم تعريف النموذج العادي على أنه مجموعة من المتطلبات التي يجب أن تلبيها العلاقة.

تسمى عملية تحويل قاعدة البيانات إلى نموذج يتوافق مع النماذج العادية بالتطبيع. تهدف التسوية إلى جلب بنية قاعدة البيانات إلى نموذج يوفر الحد الأدنى من التكرار، أي أن التسوية لا تهدف إلى تقليل إنتاجية العمل أو زيادتها أو تقليل حجم قاعدة البيانات أو زيادته. الهدف النهائي للتطبيع هو تقليل التناقض المحتمل للمعلومات المخزنة في قاعدة البيانات.

يتم التخلص من التكرار، كقاعدة عامة، عن طريق تحليل العلاقات بحيث يتم تخزين الحقائق الأولية فقط في كل علاقة (أي الحقائق التي لا يتم استنتاجها من الحقائق المخزنة الأخرى).


استنتاجات القسم 1

ناقش القسم الأول نظم المعلومات والمعلومات، وطرق معالجة البيانات، ومفاهيم معالجة البيانات الأساسية (مفهوم نظام الملفات، مفهوم قاعدة البيانات، مفهوم قاعدة البيانات الموجهة نحو الهدف)، والوظائف الأساسية لنظام إدارة قواعد البيانات. نماذج البيانات تعتبر: الشبكة، الهرمية، العلائقية. تم وصف نموذج البيانات العلائقية بالتفصيل.

يساهم استخدام نظم المعلومات في إيجاد حل أكثر فعالية لمشاكل الإدارة على أساس التوفير الفوري للمعلومات الكاملة التي تشكل أساس اتخاذ القرار. يجب أن يعتمد تصميم وبناء نظام المعلومات على تحليل شامل لمجال الموضوع. هناك طرق مختلفة لوصف مجال الموضوع، من بينها سلطنا الضوء على النهج الموجه للكائنات في النمذجة لأنه يوفر أفضل تنفيذ للسلوك الديناميكي لنظام المعلومات.

يحدد هذا القسم المشكلة ويشرح كيفية حلها بشكل عام. ومن أجل تقديم توصيات عملية، يجب اتباع الخطوات التالية:

حدد نموذجًا مفاهيميًا لبناء مخطط مفاهيمي به؛

إنشاء وصف دقيق للقيود الدلالية التي يدعمها نظام إدارة قواعد البيانات المحدد؛

إنشاء خريطة للنموذج المفاهيمي المحدد في نموذج بيانات يدعمه نظام إدارة قواعد البيانات.

حدد ماهية الدائرة الجيدة ووصف منهجية بنائها.

معلومات حول العمل "تصميم وتطوير وتنفيذ قاعدة بيانات نظام المعلومات في النشاط الاقتصادي للمؤسسة (على سبيل المثال المؤسسة الحكومية "Alushtalift")"

دورة حياة نظم المعلومات

أظهر تحليل الوضع (تعقيد تطوير نظم المعلومات، والاستخدام غير الفعال لنظم المعلومات) الذي أجراه العلماء أن هذا الموقف نتج عن حقيقة عدم استيفاء متطلبات مهمة للغاية أثناء تطوير البرمجيات:

· عدم وجود مواصفات كاملة لجميع المتطلبات.

· عدم وجود منهجية مقبولة (نظام الأساليب) لتطوير نظم المعلومات.

· عدم تقسيم المشروع العالمي الشامل إلى مكونات منفصلة يمكن التحكم فيها وإدارتها بشكل فعال.

دورة حياة أنظمة المعلومات (LC) هي نهج منظم لتطوير البرمجيات.

(بعض المخططات) بتاريخ 26/09/12

1. التخطيط لتطوير نظم المعلومات. الإجراءات التحضيرية التي تسمح لك بتنفيذ مراحل دورة حياة نظم المعلومات بأقصى قدر من الكفاءة. ثلاثة مكونات رئيسية: تقدير نطاق العمل؛ تقييم الموارد المطلوبة؛ تقدير التكلفة الإجمالية للمشروع.

2. تحديد متطلبات النظام. تحديد نطاق وحدود تطبيق قاعدة البيانات ووظائفها ومستخدميها ومجالات تطبيقها.

3. جمع وتحليل متطلبات المستخدم. جمع وتحليل المعلومات حول ذلك الجزء من المنظمة الذي سيتم دعم عمله بواسطة نظام المعلومات الذي تم إنشاؤه، وتحديد متطلبات المستخدم للنظام. المصادر: المسح والاستبيان؛ ملاحظة؛ دراسة الوثائق؛ خبرة سابقة.

4. تصميم قاعدة البيانات. إنشاء مشروع قاعدة بيانات. طريقتان رئيسيتان لتصميم أنظمة قواعد البيانات: " تنازلي" و " تصاعدي».

5. اختيار نظام إدارة قواعد البيانات المستهدف. تحديد النوع المناسب من نظام إدارة قواعد البيانات (DBMS) لدعم تطبيق قاعدة البيانات الذي يتم إنشاؤه.

6. تطوير التطبيقات. تصميم واجهة المستخدم والبرامج التطبيقية المصممة للعمل مع قاعدة البيانات.

7. إنشاء نموذج أولي. إنشاء نموذج عمل لتطبيق قاعدة البيانات.

8. التنفيذ. التنفيذ المادي لقاعدة البيانات والتطبيقات المطورة.

9. تحويل وتحميل البيانات. نقل البيانات الموجودة إلى قاعدة بيانات جديدة، وتحميل وتعديل التطبيقات الموجودة من أجل تنظيم التعاون مع قاعدة البيانات الجديدة.



10. الاختبار. عملية تنفيذ البرامج التطبيقية للعثور على الأخطاء. استراتيجيات الاختبار: الاختبار من أعلى إلى أسفل؛ اختبار من أسفل إلى أعلى؛ اختبار التدفق؛ اختبار مكثف.

11. التشغيل والصيانة. مراقبة النظام ودعم عمله الطبيعي: مراقبة الأداء؛ صيانة وتحديث التطبيقات.

نظرية قواعد البيانات العلائقية

المصطلح

في عام 1970، تم اقتراح النموذج العلائقي لأول مرة من قبل إي إف. كود.

في نظام إدارة قواعد البيانات العلائقية، من المفترض أن ينظر المستخدم إلى قاعدة البيانات على أنها مجموعة من الجداول (وليس غير ذلك).

العلاقات الرياضية.

تعتمد نظرية قواعد البيانات العلائقية على النظرية الرياضية للعلاقات.

دع D1، D2، ... Dn يكون بعض المجموعات.

المنتج الديكارتي D1 D2 … Dn = ((X1,X2,…,Xn) | X1 D1, X2 D2, … Xn Dn)

العلاقة – المجموعة الفرعية R D1*D2*…*Dn

على سبيل المثال، n=2، D1=(2,4) وD2=(1,3,5)، D1 * D2 = ((2,1)،(2,3)،(2,5)،(4) , 1),(4,3),(4,5)), ر=((2,1),(4,1))

مجموعة فرعية م.ب. محددة بشرط، على سبيل المثال:

R=((x1,x2) |x1 D1, x2 D2, X2=1), A1, A2, … An – أسماء السمات ذات المجالات D1, D2, … VTB ثم نكتب العلاقة بالشكل:

R(A1:D1,A2:D2,...An:Dn)

خصائص العلاقات:

· العلاقة لها اسم فريد.

· كل سمة لها اسم فريد (فيما يتعلق)؛

· تحتوي كل خلية علاقة على قيمة ذرية فقط ولا توجد مجموعات متكررة (تطبيع العلاقة)؛

د1 – الطلاب
D2 – التخصصات: الرياضيات، علوم الكمبيوتر

· ترتيب الصفات لا يهم؛

· ترتيب الصفوف تعسفي؛

· كل صف فريد من نوعه.

المفاتيح العلائقية

تعمل المفاتيح العلائقية على تحديد صف بشكل فريد يصف الروابط بين العلاقات.

النزاهة العلائقية.

الجبر العلائقي

يمكن استخدام نتيجة العملية كمعامل لعملية أخرى، مما يسمح لك بإنشاء تعبيرات متداخلة (إغلاق PA).

الجبر العلائقي هو لغة تتم فيها معالجة جميع الصفوف بواسطة أمر واحد.

خمس عمليات أساسية:

· أخذ العينات،

· تنبؤ،

· المنتج الديكارتي،

· جمعية

· اختلاف.

وبناء على هذه العمليات يمكن الحصول على عمليات أخرى:

· روابط،

· التقاطعات،

· الأقسام.

يمكن للمسند استخدام علامات التشغيل المنطقية ^(And)، v(Or)، ~(not).

مثال. احصل على قائمة بجميع الموظفين الذين تزيد رواتبهم عن 300.

تنبؤ.

يحدد العلاقة التي سماتها attr1، ...، atrn وتحتوي فقط على صفوف فريدة.

المنتج الديكارتي

ونادرا ما يستخدم المنتج الديكارتي، ويتم تطبيق أخذ العينات على النتيجة.

جمعية

اختلاف

عمليات الاتصال.

اتصال ثيتا

اتصال طبيعي

الانضمام الخارجي

بعد ذلك، باستخدام الصلة الخارجية اليسرى، يتم الاحتفاظ بجميع المعلومات الأصلية من العلاقة R. وبالمثل، يمكنك أيضًا تحديد صلة خارجية يمنى.

شبه الانضمام

يمكن تعريف عملية شبه الانضمام باستخدام مشغلي الإسقاط والانضمام.

تداخل

التمثيل

الغرض من التمثيلات:

· توفير آلية مرنة لحماية قاعدة البيانات من خلال إخفاء بعض أجزائها عن بعض المستخدمين.

· يسمح لك بتنظيم وصول المستخدم إلى البيانات بالطريقة الأكثر ملاءمة لهم.

· يسمح لك بتبسيط العمليات المعقدة من خلال العلاقات الأساسية.

القواعد التي يجب أن تلبي
نظم إدارة قواعد البيانات العلائقية

لتحديد ما إذا كانت SBA علائقية، اقترح Codd (1985) 13 قاعدة يجب أن تستوفيها.

قاعدة
القاعدة الأساسية. يجب أن يكون نظام إدارة قواعد البيانات العلائقية قادرًا على إدارة قواعد البيانات فقط باستخدام وظائفه العلائقية
عرض المعلومات. يتم تقديم جميع المعلومات الموجودة في قاعدة البيانات العلائقية بشكل صريح على المستوى المنطقي بطريقة واحدة فقط - في شكل قيم في الجداول. بما في ذلك البيانات الوصفية.
وصول مضمون. يجب ضمان حصول كل عنصر بيانات في قاعدة بيانات علائقية على وصول منطقي استنادًا إلى مجموعة اسم الجدول وقيمة المفتاح الأساسي واسم العمود.
دعم فارغ. يدعم نظام إدارة قواعد البيانات القيم الخالية.
دليل النظام العلائقي. يجب أن يتم تمثيل وصف قاعدة البيانات على المستوى المنطقي بطريقة مشابهة للبيانات العادية، مما يسمح للمستخدمين باستخدام نفس اللغة العلائقية للوصول إليها.
لغة فرعية شاملة للبيانات. يمكن لنظام إدارة قواعد البيانات العلائقية دعم لغات متعددة. ومع ذلك، يجب أن تكون هناك لغة واحدة على الأقل يسمح مشغلوها بأداء الوظائف التالية: 1. تعريف البيانات؛ 2. تعريف الإقرارات؛ 3. أوامر معالجة البيانات. 4. قيود النزاهة؛ 5. تفويضات المستخدم؛ 6. تنظيم المعاملات
عمليات الاستخراج والإدراج والحذف والتحديث عالية المستوى. قدرة نظام إدارة قواعد البيانات (DBMS) على إجراء عمليات استرجاع البيانات لأوامر الإدراج والحذف والتحديث كعملية واحدة.
استقلالية البيانات المادية. من طريقة التخزين
استقلالية البيانات المنطقية. استقلالية التطبيقات عن التغيرات في الجداول الأساسية.
استقلالية قيود النزاهة. يجب تحديد قيود التكامل في لغة فرعية للبيانات العلائقية وتخزينها في دليل النظام بدلاً من برامج التطبيقات.
الاستقلال عن توزيع البيانات.
لا توجد قاعدة التفاف. إذا كان نظام إدارة قواعد البيانات لديه لغة منخفضة المستوى (مع معالجة تسلسلية للصفوف)، فلا ينبغي أن يسمح بتجاوز قواعد التكامل والقيود الموضحة في اللغة العلائقية عالية المستوى.

نمذجة البيانات على أساس عملية التطبيع

الهدف من التطبيع.

تم اقتراح عملية التطبيع في عام 1972 من قبل E. F. Codd - ثلاثة أشكال عادية (NF): الأول (1NF)، والثاني (2NF)، والثالث (3NF).

التعريف الأكثر صرامة للـ NF الثالث (R. Boyce and E. F. Codd, 1974) هو الشكل العادي Boyce-Codd (BCNF).

تكرار البيانات ومعالجة الحالات الشاذة.

يؤدي عدم التطبيع إلى:

تكرار البيانات

· شذوذ الإدراج (غير قادر على إضافة سجلات)

· شذوذات الحذف (عندما يتم حذف المعلومات، يتم فقدان معلومات أخرى)

· تحديث الحالات الشاذة (العديد من السجلات تحتاج إلى تحديث)

· خصائص الحفاظ على الضياع والحفاظ على التبعية.

التبعيات الوظيفية

1.5.1. قواعد البيانات وأنظمة إدارة قواعد البيانات. لحل مشاكل استرجاع المعلومات، بدءًا من الستينيات والسبعينيات من القرن العشرين، تم استخدام عرض منظم للمعلومات المتعلقة بمجال الموضوع قيد النظر. يتم تنفيذ هيكلة المعلومات باستخدام نوع خاص من نماذج تمثيل البيانات التي تعكس خصائص كائنات المعلومات والاتصالات الموجودة بينها.

يتم وصف كائنات المعلومات والاتصالات بينها على المستوى المفاهيمي العلوي باستخدام مخططات ER (انظر القسم؟؟؟ في الملحق). يناقش هذا القسم بناء نماذج كائنات المعلومات نفسها (المشار إليها فيما يلي ببساطة بنماذج المعلومات)، والتي تتوافق مع المستوى المنطقي التالي لتصميم نظم المعلومات بعد المستوى المفاهيمي والمنطقي وهي الأساس لحل مشاكل استرجاع المعلومات وتحليل المعلومات وغيرها .

هناك ثلاثة أنواع من نماذج الهيكلة أو، كما يقولون، تمثيل البيانات: الشبكة، والتسلسل الهرمي، والعلائقية. يعد النموذج العلائقي لتمثيل البيانات هو الأكثر شيوعًا حاليًا نظرًا لبساطته وطبيعية إدراكه بالإضافة إلى توفر الأدوات الرياضية والبرمجية المتقدمة للعمل مع هذا النموذج والجوانب الأخرى. في المستقبل، سيتم النظر فقط في النماذج العلائقية لكائنات المعلومات.

أدى استخدام النماذج المنظمة سهلة الاستخدام لعرض المعلومات إلى تقسيم النماذج المخصصة لتخزين المعلومات في الكمبيوتر إلى دعابة الدماغنماذج و بدنيعارضات ازياء. وكان هذا هو السبب وراء ظهور نهج جديد بشكل أساسي لتنظيم تخزين المعلومات المنظمة، يسمى المفهوم قواعد بيانات. تعد قواعد البيانات حاليًا هي الطريقة الرئيسية (إن لم تكن الوحيدة) لتخزين المعلومات المستخدمة عمليًا.

النموذج المنطقييعكس البنية المنطقية للبيانات المدمجة في كائن معلومات واحد. بالإضافة إلى ذلك، فإن نموذج البيانات المنطقي يكمن وراء لغة معالجة البيانات، والتي من خلالها يقوم المستخدم بإنشاء طلبات البحث وتحديث المعلومات، وما إلى ذلك.

النموذج المادييعكس الموضع الفعلي للمعلومات على الوسائط المادية (أجهزة التخزين الخارجية: محرك الأقراص الثابتة، محرك الأقراص الضوئية، وما إلى ذلك). لوصفها، يتم استخدام نماذج الملفات، وهي عبارة عن سلاسل خطية منظمة من الرموز.

معيار فعالية النماذج المنطقية هو القدرة على تنفيذ مجموعة واسعة من الاستفسارات التي لها معاني مختلفة على أساسها. معيار فعالية النماذج المادية هو الاستخدام الرشيد للذاكرة الخارجية.

بفضل تقسيم نماذج تخزين المعلومات إلى منطقية ومادية، أصبح من الممكن النظر بشكل منفصل في مشكلة اختيار لغة معالجة البيانات ومشكلة الاستخدام الفعال للذاكرة الخارجية.

مثل هذا "الفصل" بين هذه المهام سمح بما يلي:

    استخدام لغات عالية المستوى لتكوين استعلامات غنية لغويًا لقواعد البيانات؛

    ضمان زيادة حجم المعلومات المخزنة على أجهزة التخزين الخارجية.

أدى النظر المنفصل للنماذج المنطقية والمادية للمعلومات في قواعد البيانات إلى حقيقة أن المستخدم، عند إنشاء نماذج معلومات لمجالات الموضوع، بدأ "العمل" فقط باستخدام نماذجه المنطقية. لوضع المعلومات على أجهزة تخزين خارجية وتنفيذ عمليات معالجة البيانات على المستوى المادي، تم إنشاء برامج وأدوات خاصة تسمى أنظمة إدارة قواعد البيانات (DBMS). إنهم بمثابة نوع من "الوسيط" بين نموذج البيانات المنطقي والمادي. وبهذا المعنى، فإن دور نظام إدارة قواعد البيانات يشبه دور أنظمة التشغيل.

وبالتالي، بمساعدة قواعد البيانات (DBs)، يتم تخزين المعلومات المنظمة (باستخدام نموذج بيانات منطقي) حول مجال الموضوع، وبمساعدة نظام إدارة قواعد البيانات (DBMS)، تتم إدارة هذه المعلومات، أو، كما يقولون، إدارة قاعدة البيانات. وهذا يجعل من الممكن:

    تزويد المستخدم بواجهة ملائمة لإنشاء:

    بنية البيانات المنطقية (مستوى التصميم المنطقي لقاعدة البيانات) باستخدام لغة المخططات الكتلية؛

    بنية البيانات المادية (مستوى التصميم المادي لقاعدة البيانات) باستخدام لغة خاصة تسمى لغة تعريف البيانات.

    التصميم باللغة طلبات، أو لغة معالجة البياناتالمعتمدة في نظام إدارة قواعد البيانات (DBMS) محدد، طلبات المستخدم المختلفة للبحث عن المعلومات ومعالجتها.

    ضمان تخزين كميات كبيرة من البيانات على المدى الطويل (تقاس بالجيجابايت أو أكثر)، وحمايتها من التلف العرضي أو الاستخدام غير المصرح به، مع ضمان تحديث المعلومات المخزنة في قاعدة البيانات.

    توفير الوصول الموزع إلى البيانات لعدة مستخدمين، مما يزيد بشكل كبير من كفاءة تخزين ومعالجة المعلومات في قاعدة البيانات مقارنة بأنظمة الملفات لتخزين ومعالجة المعلومات.

تعليق 1. يتم تطوير بنية البيانات على المستوى المنطقي بشكل مفهوم للمطور (يمكن استخدام الأدوات الرسومية) ولا يرتبط بالمستوى المادي لتنفيذ هياكل البيانات، أي. جنبا إلى جنب مع التمثيل الداخلي للأشياء، هناك تمثيلها الخارجي. يرى مستخدمو الكائن تعريفه الخارجي فقط ولا يفكرون في كيفية تعريفه ووظائفه. ومن مزايا هذا النهج وهي تجريد البيانات، هو أنه من الممكن تغيير التعريف الداخلي للكائن دون أي عواقب على مستخدميه، بشرط أن يظل التعريف الخارجي للكائن دون تغيير. وبالمثل، في نهج قاعدة البيانات، يتم فصل بنية البيانات عن التطبيقات وتخزينها في قاعدة البيانات. إن إضافة هياكل بيانات جديدة أو تغيير الهياكل الموجودة لا يؤثر على التطبيقات بأي شكل من الأشكال، بشرط ألا تعتمد بشكل مباشر على المكونات التي يتم تغييرها. على سبيل المثال، لن تؤثر إضافة حقل جديد إلى سجل أو إنشاء ملف جديد على التطبيقات الموجودة. ومع ذلك، فإن إزالة حقل من ملف يستخدمه أحد التطبيقات سيؤثر على هذا التطبيق وسيلزم تعديله وفقًا لذلك.

تعليق 2. إن استخدام لغة معالجة البيانات المبنية على جهاز رياضي يضمن صحة العمل مع البيانات أو، بمعنى آخر، القدرة على التنبؤ.

تعليق 3. يوفر استخدام نظام إدارة قواعد البيانات وصولاً متحكمًا إلى قاعدة البيانات بسبب وجود:

    أنظمة الأمان التي تمنع الوصول غير المصرح به إلى قاعدة البيانات من قبل المستخدمين؛

    أنظمة دعم سلامة البيانات التي تضمن حالة متسقة من البيانات المخزنة؛

    نظام استرداد يسمح لك باستعادة قاعدة بيانات إلى حالة متسقة سابقة تم تعطيلها بسبب فشل في الأجهزة أو البرامج.

تعليق 4. مع الاستخدام الواسع النطاق لشبكات الكمبيوتر، زادت أهمية أنظمة إدارة قواعد البيانات وإمكانية تطبيقها بشكل أكبر، وذلك بسبب حقيقة أن أنظمة إدارة قواعد البيانات تتمتع بقدرات التواصل. تتضمن أنظمة إدارة قواعد البيانات نظامًا لإدارة التشغيل المتوازي للتطبيقات، والذي يتحكم في عمليات وصولها المشترك إلى قاعدة البيانات. بالإضافة إلى ذلك، فإن الشرط الأساسي لتطوير الأنظمة التي تستخدم قواعد البيانات هو الرغبة في دمج جميع البيانات التي تتم معالجتها في المنظمة في وحدة واحدة وتوفير الوصول المتحكم إليها. في حين أن التكامل والتحكم في الوصول يمكن أن يعزز المركزية، إلا أنه ليس غاية في حد ذاته.

ومن الناحية العملية، يؤدي إنشاء شبكات الكمبيوتر إلى تحقيق اللامركزية في معالجة البيانات. يعكس النهج اللامركزي بشكل أساسي الهيكل التنظيمي للعديد من الشركات، والذي يتكون منطقيًا من أقسام وأقسام وفرق مشروع منفصلة وما إلى ذلك، والتي يتم توزيعها فعليًا بين المكاتب أو الأقسام أو المصانع أو الشركات التابعة المختلفة، حيث تتعامل كل وحدة إنتاج فردية مع مجموعتها الخاصة من البيانات المعالجة. إن تطوير قواعد البيانات الموزعة التي تعكس الهياكل التنظيمية للمؤسسات يجعل من الممكن إتاحة البيانات التي تحتفظ بها كل إدارة من الإدارات الحالية للجمهور، مع ضمان تخزينها في الأماكن التي يتم استخدامها فيها في أغلب الأحيان. يعمل هذا النهج على توسيع القدرة على مشاركة المعلومات مع زيادة كفاءة الوصول إليها.

في عملية البحث العلمي المكرسة لكيفية بناء نظام إدارة قواعد البيانات (DBMS)، تم اقتراح طرق تنفيذ مختلفة. وتبين أن أكثرها قابلية للتطبيق هو نظام تنظيم قاعدة البيانات ثلاثي المستويات الذي اقترحته لجنة المعايير الأمريكية ANSI (المعهد الوطني الأمريكي للمعايير)، كما هو موضح في الشكل. 3:

أرز. 3. نموذج قاعدة بيانات ثلاثي المستويات

مستوى النموذج الخارجي- أعلى مستوى، حيث يكون لكل نموذج "رؤيته" الخاصة للبيانات. يحدد هذا المستوى طريقة عرض قاعدة بيانات التطبيقات الفردية. يرى كل تطبيق ويعالج فقط البيانات التي يحتاجها هذا التطبيق المعين. على سبيل المثال، يستخدم نظام توزيع العمل معلومات حول مؤهلات الموظف، لكنه غير مهتم بالمعلومات حول راتب الموظف وعنوان المنزل ورقم الهاتف، والعكس صحيح، يتم استخدام هذه المعلومات في النظام الفرعي للموارد البشرية.

المستوى المفاهيمي- الرابط المركزي، هنا يتم عرض قاعدة البيانات بالشكل الأكثر عمومية، والذي يجمع البيانات المستخدمة من قبل جميع التطبيقات التي تعمل مع قاعدة البيانات هذه. في الواقع، يعكس المستوى المفاهيمي نموذجًا معممًا للموضوع (كائنات العالم الحقيقي) الذي تم إنشاء قاعدة البيانات من أجله. مثل أي نموذج، يعكس النموذج المفاهيمي فقط السمات المهمة للأشياء في العالم الحقيقي، من وجهة نظر المعالجة.

الطبقة المادية- البيانات الفعلية الموجودة في الملفات الموجودة على وسائط التخزين الخارجية.

تسمح هذه البنية بالاستقلال المنطقي (بين الطبقتين 1 و2) والمادي (بين الطبقتين 2 و3) عند العمل مع البيانات. يتضمن الاستقلال المنطقي القدرة على تغيير تطبيق واحد دون تعديل التطبيقات الأخرى التي تعمل مع نفس قاعدة البيانات. يتضمن الاستقلال المادي القدرة على نقل المعلومات المخزنة من وسائط إلى أخرى مع الحفاظ على وظائف جميع التطبيقات التي تعمل مع قاعدة بيانات معينة. هذا هو بالضبط ما كان مفقودًا عند استخدام أنظمة الملفات. إن تحديد المستوى المفاهيمي جعل من الممكن تطوير جهاز مركزي لإدارة قواعد البيانات.

1.5.2. مفهوم العلاقة وخصائصها وخصائصها الرئيسية. الكتلة الهيكلية الرئيسية البناءة والمكتملة لغويًا (أي وجود محتوى دلالي محدد فيما يتعلق بمجال الموضوع قيد النظر) لقواعد البيانات العلائقية هي سلوك.

البرمجة في بيئة دلفي 6

قاعدة البيانات. إنشاء تقرير باستخدام Word.

تمت الموافقة عليه من قبل مجلس التحرير والنشر

الجامعة بمثابة ورشة عمل مختبرية

فورونيج 2004


يو دي سي 681.3

Vorobyov E.I., Korotkevich D.E.. البرمجة في بيئة دلفي 6: ورشة عمل المختبر: الجزء 2: قواعد البيانات. إنشاء تقرير باستخدام Word. تيارات. فورونيج: فورونيج. ولاية تقنية. جامعة.، 2004. 107 ص.

الجزء الثاني من ورشة العمل المعملية يناقش المعلومات النظرية والعملية لكتابة البرامج في بيئة دلفي 6 حول موضوع: “تصميم قواعد البيانات وإنشاء التقارير في برنامج Word واستخدام الخيوط عند إنشاء تطبيقات عالية الأداء”.

يفي المنشور بمتطلبات المعيار التعليمي الحكومي للتعليم المهني العالي في الاتجاه 230100 "المعلوماتية وعلوم الكمبيوتر"، التخصص 230104 "أنظمة التصميم بمساعدة الكمبيوتر"، تخصص "البرمجة باللغات عالية المستوى".

طاولة 3.ايل. 19. قائمة المراجع: 7 عناوين.

المحرر العلمي: د.تك. العلوم، البروفيسور. نعم. لفوفيتش

المراجعون: قسم علوم الكمبيوتر، أكاديمية فورونيج للغابات (رئيس القسم، دكتوراه في العلوم التقنية، البروفيسور في.إي. ميزوف)؛

دكتور تك. العلوم، البروفيسور. يا يو ماكاروف

© فوروبيوف إي.إي.، كوروتكيفيتش دي.إي.، 2004

© التصميم. ولاية فورونيج

الجامعة التقنية، 2004


مقدمة

مفهوم قاعدة البيانات

تعتبر قواعد البيانات الميزة الرئيسية لدلفي. حتى اللغات المتخصصة للعمل مع قواعد البيانات (مثل MS Visual FoxPro) تكون أدنى بوضوح من حيث بساطة وقوة برمجة هذا النوع من التطبيقات. تخفي دلفي كل التعقيدات وفي نفس الوقت تمنحها القوة الأكبر. لم تكن هناك أبدًا مهمة لا يمكن تنفيذها في دلفي في فترة زمنية قصيرة. والشيء الرئيسي هو أن كل هذا يتم تنفيذه بشكل مريح للغاية وسهل الفهم. في دلفي يمكنك إنشاء تطبيقات بسيطة، حتى مع قواعد البيانات المعقدة، دون سطر واحد من التعليمات البرمجية. يغطي هذا البرنامج التعليمي المهام المعملية لإتقان تقنيات العمل مع قواعد البيانات المحلية.

نظرية قواعد البيانات العلائقية

قبل عشر سنوات، كانت برمجة قواعد البيانات مهمة صعبة للغاية. في الوقت الحاضر، من الصعب تخيل ذلك، لأنه بفضل دلفي، تم تبسيط عملية كتابة البرامج، وعدد أنواع قواعد البيانات بالفعل بالعشرات.

تنقسم قواعد البيانات إلى محلية (مثبتة على جهاز الكمبيوتر الخاص بالعميل، حيث يعمل البرنامج) وبعيدة (مثبتة على الخادم، وهو كمبيوتر بعيد). توجد قواعد بيانات الخادم على كمبيوتر بعيد ويتم تشغيلها تحت سيطرة برنامج الخادم. تشمل مزاياها الرئيسية القدرة على العمل مع قاعدة بيانات واحدة في وقت واحد من قبل العديد من المستخدمين، وفي نفس الوقت يكون هناك حد أدنى من التحميل على الشبكة. هناك أيضًا قواعد بيانات شبكية تؤدي إلى تحميل كبير جدًا على الشبكة وغير ملائمة للاستخدام لكل من المبرمج والمستخدم النهائي. عندما يتصل برنامج ما بقاعدة بيانات الشبكة، فإنه يقوم بتنزيل نسخة كاملة تقريبًا منه من الخادم. إذا أجريت تغييرات، فسيتم تنزيل نسختك بالكامل مرة أخرى. هذا غير مريح للغاية لأنه يخلق حملاً كبيرًا على الشبكة بسبب النقل الزائد للبيانات. في تقنية خادم العميل، يرسل برنامج العميل طلبًا نصيًا بسيطًا إلى الخادم لتلقي بعض البيانات. يقوم الخادم بمعالجتها وإرجاع الجزء المطلوب فقط من البيانات. عندما تحتاج إلى تغيير بعض البيانات، يتم إرسال طلب مرة أخرى إلى الخادم لتغييره، ويقوم الخادم بتغيير البيانات في قاعدة البيانات الخاصة به. وبالتالي، يتم نقل الطلبات النصية فقط عبر الشبكة بشكل أساسي، والتي تشغل عمومًا أقل من كيلو بايت. تتم معالجة جميع البيانات بواسطة الخادم، مما يعني أن جهاز العميل يتم تحميله بشكل أقل بكثير ولا يتطلب الكثير من الموارد. يرسل الخادم للعميل البيانات الضرورية فقط، مما يعني عدم وجود تنزيل غير ضروري لنسخة من قاعدة البيانات بأكملها. بفضل كل هذا، أصبحت قواعد بيانات الشبكة قديمة بالفعل ولم يتم استخدامها عمليا. يتم استبدالها بالكامل تقريبًا بتكنولوجيا خادم العميل. لكن قواعد البيانات المحلية ستظل موجودة دائمًا. قد يتغير تنسيق تخزينها أو قد تتم إضافة بعض الوظائف الجديدة، ولكن قواعد البيانات نفسها ستكون موجودة. لمزيد من الدراسة، نحن بحاجة إلى تحديد مفهوم جديد - طاولة. حتى الآن تمت مناقشة المبادئ العامة فقط، لذلك تم استخدام المفهوم العام قواعد بيانات. يشبه جدول قاعدة البيانات مصفوفة ثنائية الأبعاد حيث يتم ترتيب البيانات في عمود (المثال الرئيسي للجدول هو Excel). قاعدة البيانات هي، تقريبًا، مجرد ملف يمكن تخزينه من جدول واحد إلى عدة جداول. يمكن لمعظم قواعد البيانات المحلية تخزين جدول واحد فقط (dBase، Paradox، XML). ولكن هناك ممثلين لقواعد البيانات المحلية، حيث توجد عدة جداول في ملف واحد (على سبيل المثال، الوصول).

قواعد البيانات المحلية

من بين قواعد البيانات المحلية، دعونا نعتبر القواعد العلائقية هي الأكثر شيوعًا. ما هي قاعدة البيانات العلائقية؟ هذا جدول تكون فيه الأعمدة أسماء البيانات المخزنة فيه، ويقوم كل صف بتخزين البيانات نفسها. يشبه جدول قاعدة البيانات جدول بيانات Excel (لكي نكون أكثر دقة، يقوم Excel بتخزين بياناته بتنسيق خاص مبني على تقنية قاعدة البيانات). يمكن تخزين جداول قاعدة البيانات المحلية على محرك أقراص ثابت محلي أو تخزينها مركزيًا على محرك أقراص شبكة على خادم ملفات. يمكن نسخ هذه الملفات باستخدام الأدوات القياسية مثل أي ملف آخر، لأن جداول قاعدة البيانات نفسها غير مرتبطة بموقع محدد. الشيء الرئيسي هو أن البرنامج يمكنه العثور على الجدول. يجب أن يحتوي كل جدول على حقل واحد فريد يحدد الصف بشكل فريد. ويسمى هذا الحقل الحقل الرئيسي. تُستخدم هذه الحقول غالبًا لربط عدة جداول معًا. ولكن حتى لو لم يكن الجدول مرتبطًا، فسيظل حقل المفتاح مطلوبًا. يُنصح باستخدام نوع رقمي كمفتاح، وإذا كانت قاعدة البيانات تسمح بذلك، فسيكون من الأفضل أن يكون من النوع "autoincrement" (زيادة/تناقص الرقم أو العداد تلقائيًا). يجب أن تكون أسماء الأعمدة في جدول قاعدة البيانات فريدة أيضًا، ولكن في هذه الحالة ليس بالضرورة أن تكون رقمية. يمكنك تسميتها كما تريد، طالما أنها فريدة ومفهومة. يجب أن يكون لكل عمود (حقل قاعدة البيانات) نوع محدد. يعتمد عدد الأنواع وأصنافها على نوع قاعدة البيانات، على سبيل المثال، يدعم تنسيق dBASE (الملفات ذات ملحق DBF) 6 أنواع فقط، ويدعم Paradox بالفعل ما يصل إلى 15 نوعًا. يمكن تخزين قاعدة البيانات في ملف واحد (Access) ) أو في عدة (Paradox، dBase). وبشكل أكثر دقة، يتم دائمًا تخزين بيانات الجدول في ملف واحد، ولكن يمكن وضع المعلومات الإضافية في ملفات منفصلة. قد تتضمن المعلومات الإضافية فهارس أو قيودًا أو قائمة القيم الافتراضية لحقول معينة. إذا أصبح أحد الملفات على الأقل تالفًا أو تم حذفه، فقد تصبح البيانات غير متاحة للتحرير.

ماذا حدث المؤشرات؟ في كثير من الأحيان، تخضع البيانات من الجداول لبعض التغييرات، لذلك قبل تحرير أي صف، تحتاج إلى العثور عليه. وحتى الجداول الثابتة المستخدمة ككتب مرجعية تخضع أيضًا لعمليات البحث قبل عرض البيانات المطلوبة. يعد البحث عملية تستغرق وقتا طويلا، خاصة إذا كان الجدول يحتوي على الكثير من الصفوف. تهدف الفهارس إلى تسريع هذا الإجراء، ويمكن استخدامها أيضًا كنقطة بداية للفرز. في هذه المرحلة، يكفي معرفة أنه لا يمكن طلب حقل غير مفهرس.

إذا كنت بحاجة إلى بعض الجدول ليتم ترتيبها حسب الحقل " اسم العائلة"، فيجب أولاً فهرسة هذا الحقل. ثم تحتاج فقط إلى الإشارة إلى أن الجدول يجب أن يعمل الآن مع فهرس كذا وكذا، وسيتم فرزه تلقائيًا.

في قاعدة البيانات المصممة جيدًا، يتم التخلص من تكرار البيانات وتقليل احتمالية تخزين البيانات غير المتسقة. وبالتالي، فإن إنشاء قواعد البيانات له هدفان رئيسيان: تقليل تكرار البيانات وزيادة موثوقيتها.

تتكون دورة حياة أي منتج برمجي، بما في ذلك نظام إدارة قواعد البيانات، (إلى حد كبير) من مراحل التصميم والتنفيذ والتشغيل.

وبطبيعة الحال، فإن العامل الأكثر أهمية في دورة حياة تطبيق قاعدة البيانات هو مرحلة التصميم. يعتمد أداء النظام وثراء معلوماته، ومن ثم عمره، على مدى دقة التفكير في بنية قاعدة البيانات ومدى وضوح تحديد الروابط بين عناصرها.

متطلبات قاعدة البيانات

لذلك، قاعدة بيانات مصممة بشكل جيد:

1. يلبي جميع متطلبات المستخدم لمحتوى قاعدة البيانات. قبل تصميم قاعدة بيانات، من الضروري إجراء بحث مكثف حول متطلبات المستخدم لوظيفة قاعدة البيانات.

2. يضمن اتساق البيانات وسلامتها. عند تصميم الجداول، يجب عليك تحديد سماتها وبعض القواعد التي تحد من إمكانية قيام المستخدم بإدخال قيم غير صحيحة. للتحقق من البيانات قبل كتابتها مباشرة في الجدول، يجب أن تستدعي قاعدة البيانات قواعد نموذج البيانات وبالتالي التأكد من الحفاظ على سلامة المعلومات.

3. يوفر هيكلة طبيعية وسهلة الفهم للمعلومات. يتيح لك إنشاء قاعدة بيانات عالية الجودة جعل الاستعلامات في قاعدة البيانات أكثر "شفافية" وأسهل للفهم؛ وبالتالي، يتم تقليل احتمالية إدخال بيانات غير صحيحة وتحسين جودة صيانة قاعدة البيانات.

4. يلبي متطلبات أداء قاعدة بيانات المستخدمين. مع كميات كبيرة من المعلومات، قضايا الحفاظ على الإنتاجية

البدء في لعب الدور الرئيسي، على الفور "تسليط الضوء" على جميع أوجه القصور في مرحلة التصميم.

تمثل النقاط التالية الخطوات الأساسية لتصميم قاعدة البيانات:

1. تحديد احتياجات قاعدة البيانات من المعلومات.

2. تحليل كائنات العالم الحقيقي التي تحتاج إلى نمذجتها في قاعدة البيانات. من هذه الكائنات، تشكل كيانات وخصائص هذه الكيانات (على سبيل المثال، بالنسبة لكيان "الجزء"، يمكن أن تكون الخصائص "اسم"، "لون"، "وزن"، وما إلى ذلك) وتشكيل قائمة بها.

3. قم بمطابقة الكيانات والخصائص - الجداول والأعمدة (الحقول) في تدوين نظام إدارة قواعد البيانات الذي اخترته (Paradox، dBase، FoxPro، Access، Clipper، InterBase، Sybase، Informix، Oracle، وما إلى ذلك).

4. حدد السمات التي تحدد كل كائن بشكل فريد.

5. وضع القواعد التي من شأنها إنشاء والحفاظ على سلامة البيانات.

6. إنشاء اتصالات بين الكائنات (الجداول والأعمدة)، وتطبيع الجداول.

7. التخطيط لقضايا موثوقية البيانات، وإذا لزم الأمر، الحفاظ على سرية المعلومات.


معلومات ذات صله.