Мультимодельные СУБД: теоретические основы, модели данных и принципы проектирования

Тип работы: Курсовая работа
Бесплатно: Антиплагиат
Объем: 39 страниц
В избранное:

МИНИСТЕРСТВО ОБРАЗОВАНИЯ

И НАУКИ РЕСПУБЛИКИ КАЗАХСТАН

КАЗАХСКИЙ ЭКОНОМИЧЕСКИЙ УНИВЕРСИТЕТ

им. Т. Рысулова

Кафедра “Прикладная информатика”

Курсовая работа

по дисциплине “Системы баз данных”

на тему: Мультимодельные СУБД

Выполнила: студентка 3 курса,

группа ИС-306, Муратова Д. М.

Проверила: ст. преп. Неверова Е. Г.

Алматы 2008

Содержание

Введение . 3

1. Теоретическая часть: . . . 4

1. 1 Классификация БД 10

1. 2 Объектно-ориентированные СУБД . 13

2. Практическая часть:15

2. 1 Иерархическая модель базы данных . . . 15

2. 1. 1 Недостатки иерархической модели . . 18

2. 2 Реляционная модель базы данных . . . 20

2. 2. 1Реляционные датологические модели СУБД . . . 23

2. 3 Сетевые модели данных . . . 27

2. 4 Иерархические модели в реляционных БД . 31

3 . Аналитическая часть:. . 33

3. 1 Научные исследования в области системах 33

3. 2Основные возможности и организация СУБД иерархического,

сетевого, реляционного типов 37

Заключение 39

Список литературы . . . 40

Введение

Целью моей курсовой работы является описание мультимодельных СУБД. В связи с поставленной целью в курсовой работе решаются следующие задачи: рассмотреть модели СУБД в целом, процесс создания баз данных.

В теоретической части будут рассмотрены: общая информация рассматриваются основные концепции, понятия, черты и характеристики объектно-ориентированных систем управления БД.

В практической части будут рассмотрены: иерархических и реляционных моделей базы данных, возможности и преимущества моделей.

В аналитической части будут рассматриваться: вопросы о данных, исследования, связанные с разработками новых СУБД, развитие теории реляционных баз данных, СУБД с мультимодельным внешним уровнем.

1 Теоретическая часть

База данных - это именованная совокупность данных, адекватно отображающих состояние объектов и их взаимосвязей в некоторой предметной области и организованных таким образом, что данные могут использоваться для решения многих задач многими пользователями. Предметная область, в общем случае, складывается из множества реальных объектов, обладающих некоторым набором свойств, - атрибутов. Отображению в базе данных подлежать лишь существенные атрибуты, несущественными можно пренебречь.

База данных (БД) - совокупность взаимосвязанных данных хранящихся в памяти ЭВМ, вводятся, хранятся, просматриваются, обрабатываются, а также выводятся на экран.

Существует два способа создания базы данных:

а) Позадачный- каждая задача работает со своей совокупностью данных;

б) с использованием систем управления БД (СУБД) .

Имеем БД, СУБД, задачи (прикладная программа 1, 2, . . . , п) работает сразу со всеми задачами.

СУБД выполняет двоякую функцию:

а) является инструментальным средством (средой), создания, разработки,
программирование БД;

б) обеспечивает эксплуатацию БД.

Современные СУБД можно классифицировать на следующие классы:

а) электронные таблицы (Super Calc /MSDOS/, Excel /Windows/)
Первый класс СУБД используется для решения небольших по объему (V) и
несложных по выполнению задач.

Функциональные возможности электронных таблиц:

написание, корректировка и другая работа с текстом (т. е. имеют свой встроенный редактор) ;
проведение расчетов и вычислений с помощью общепринятых арифметических, логических операций и встроенных функций (sin, cos, tg, ctg) .
работа в режиме псевдографики, т. е. создание столбовых, прямоугольных, круговых, линейчатых, зонных и других диаграмм.
работа со встроенной БД реалиционного типа.

Электронные таблицы содержат һеір(помощь) ; встроенный пакет-справочник с примерами.

При работе с базой данных в электронных таблицах, исходную таблицу смещают вниз от левого верхнего угла, а вверху записывают условия нахождения данных, они же результирующие таблицы, которые отражают поиска.

б) Второй класс СУБД средство программирования баз данных оперативного
типа (Clipper, dbase, FoxBase) . Эти СУБД с точки зрения технологии создания
БД аналогичны стандартному языку программирования (Турбо-паскаль) .

в) СУБД комбинированного типа (на основе файловой структуры /Clarion/) .

г) СУБД со встроенными программами (генераторами) автоматизированного
программирования объектов БД (таблицу, форм входных документации,
меню с подключением механизма реорганизации данных в БД, запросов с
отчетами /форм входных документов/) . Paradox - язык Pal (Pal не уступает
Турбо-Паскалю 7. 0) . Он позволяет подключение подпрограмм, написанных
на любом языке программирования

Объекты базы данных:

1. а) Таблицы (взаимосвязанные или невзаимосвязанные) ;

б) логические (виртуальные) таблицы - связанные между собой с помощью ключевых атрибутов (нужна, чтоб не дублировать данные) .

Формы входных документов с которыми работает пользователь.
Система управляющего меню.
Запросы.
Формы входных документов (отчеты) .

Для полноценной работы БД создают или подключают механизм реорганизации данных в БД.

Жизненный цикл автоматизированной информационной системы:

"бумажное" программирование;
реализация;
эксплуатация (введение БД) . Различают 3 основных модели БД:
иерархическая;
сетевая (реализует технологию "Клиент-Сервер") ;
реляционную модель для IBM PC (локальная) . Существует два подхода к созданию базы данных:
сначала создаются таблицы и формы, а потом меню и запросы с отчетом;
создается меню, потом таблицы и формы, запросы с отчетами.

Элементы построения баз данных.

Номер. Буква алфавита. Ф. И. О. Место работы. Телефон. Адрес. printf("\n") ;

printf ("\п Номер Буква алфавита ФИО Место работы Телефон Адрес \п") ; printf(" \п") ;

В современных средствах программирования баз данных используется программа автоматизации программирования следующих объектов: таблиц, форм документов, систем управления меню и запросов с отчетами. Эти средства делятся на классы:

средства операторного типа;
средства, включающие комплекс программ автоматизированного построения указанных объектов электронной таблицы.

Для небольшого по V и несложных по вычислению баз данных используются электронные таблицы.

Структура базы данных.

Это взаимосвязь основных объектов БД (таблицы, формы, меню) с файловой структурой. В настоящее время для создания баз данных и других программных продуктов используются технологии "Клиент-Сервер". Рассмотрим применение этой технологии на примере разработки фирмы Staffware (Англия) . На протяжении последнего года эта фирма разрабатывает продукты вместе с ІВМ(США) и Microsoft (США) . Структура разработки фирмы Staffware:

Данная система предназначена для автоматизации управления документами в электронном офисе. Объем электронной текстовой информации (документа) станет в 3 раза больше. Например, в США ежедневно создается 900 млн. страниц информации, 76 млн. писем и 21 млн. других документов, храница І. Зтрл. документов на бумаге. Однако, получить доступ можно лишь к 10% этой информации.

Требования к СУБД:

Эффективность выполнения различных функций предметной области;
Минимизация избыточности;
Предоставление для процесса принятия решений непротиворечивой информации;
Обеспечение безопасности;
Отсутствие повышенных требований к персоналу, связанное с разработкой прикладных программ;
Реорганизация БД;
Централизованное управление;
Упрощение эксплуатации ЭВМ.

БД должна:

Удовлетворять актуальным требованиям внешних юзеров, обеспечивать хранение и модификацию больших объемов информации;
Обеспечивать заданный уровень достоверности хранимой информации и ее непротиворечивость;
Обеспечивать доступ к секретным данным только спец. юзерам;
Возможность поиска информации по ключу;
Удовлетворение требованиям по производительности обработки запросов;
Возможность реорганизации и расширения при замене границ ПО;
Различные виды выдачи информации;
Простота и удобство обращения к информации. ;
Обеспечивать возможность одновременного обслуживания большого числа юзеров.

Администратор БД (АБД) . АБД - лицо, ответственное за выполнение функции администрирования БД. АБД не обладатель БД, а ее хранитель. С усложнением предметной области усложняются процессы формирования информации, и принятия решения (расширение спектра функций администрирования БД. Главный принцип - непротиворечивость данных.

АБД должен: координировать все действия по сбору информации. Ее проектирование и ведение в целом. А также ЗИ. Независимость данных. Прикладному программисту для организации доступа к данным надо знать: 1) каков формат;

где располагаются;
как обратиться к ним.

Используя ту или иную БД и не зная ее внутреннего представления, этим достигается независимость данных. Возникают модернизации, связанные с ЭКСПОРТОМ и импортом файлов в БД (добавление и усечение БД) . Причины, порождающие необходимость независимости данных:

АБД должен проводить изменения содержания, расположения БД;
поставщик Hard & Soft обработки данных должен вводить новые технологии, не требуя

перепрограммирования программ клиента. Необходимо обеспечить разделение данных, представляя их по-разному ограниченно прикладным программистам. Защита АБД.

Два уровня независимости данных. Процесс проектирования БД начинается с установления концептуальных требований ряда юзеров. Эти требования интегрируются как единое обобщенное представление, из которого образуется концептуальная модель предметной области.

Транслирование концептуальной модели (адаптация) в совместимую область с выбранной СУБД.

База Данных (БД) - структурированный организованный набор данных, описывающих характеристики каких-либо физических или виртуальных систем.

«Базой данных» часто упрощённо или ошибочно называют Системы Управления Базами Данных (СУБД) . Нужно различать набор данных (собственно БД) и программное обеспечение, предназначенное для организации и ведения базы данных (СУБД) .

Структура БД

Организация структуры БД формируется исходя из следующих соображений:

1. Адекватность описываемому объекту/системе - на уровне концептуальной и логической модели.

2. Удобство использования для ведения учёта и анализа данных - на уровне так называемой физической модели.

Виды концептуальных (инфологических) моделей БД: «сущность-связь», семантические, графовые

Виды логических (даталогических) моделей БД:

1. Документальные (архивы) - ориентированные на формат документа, дескрипторные, тезаурусные.

2. Фактографические (картотеки)

теоретико-графовые: иерархическая модель, сетевая модель.

теоретико-множественные: реляционная модель (ER-модель), многомерная модель.

объектно-ориентированные: объектная модель.

основанные на инвертированных файлах.

Таким образом, по модели представления данных БД классифицируются:

* Картотеки

* Сетевые

* Иерархические

* Реляционные

* Многомерные

* Объектно-ориентированные

* Дедуктивные

На уровне физической модели электронная БД представляет собой файл или их набор в формате TXT, CSV, Excel, DBF, XML либо в специализированном формате конкретной СУБД. Также в СУБД в понятие физической модели включают специализированные виртуальные понятия, существующие в её рамках - таблица, табличное пространство, сегмент, куб, кластер и т. д.

В настоящее время наибольшее распространение получили реляционные базы данных. Картотеками пользовались до появления электронных баз данных. Сетевые и иерархические базы данных считаются устаревшими, объектно-ориентированные пока никак не стандартизированы и не получили широкого распространения. Некоторое возрождение получили иерархические базы данных в связи с появлением и распространением XML.

Этапы проектирования базы данных

1. Концептуальное проектирование - сбор, анализ и редактирование требований к данным. Для этого осуществляются следующие мероприятия:

* обследование предметной области, изучение ее информационной структуры

* выявление всех фрагментов, каждый из которых характеризуется пользовательским представлением, информационными объектами и связями между ними, процессами над информационными объектами

* моделирование и интеграция всех представлений

По окончании данного этапа получаем концептуальную модель, инвариантную к структуре базы данных. Часто она представляется в виде модели «сущность-связь».

2. Логическое проектирование - преобразование требований к данным в структуры данных. На выходе получаем СУБД-ориентированную структуру базы данных и спецификации прикладных программ. На этом этапе часто моделируют базы данных применительно к различным СУБД и проводят сравнительный анализ моделей.

3. Физическое проектирование - определение особенностей хранения данных, методов доступа и т. д.

Различие уровней представления данных на каждом этапе проектирования реляционной базы данных:

КОНЦЕПТУАЛЬНЫЙ УРОВЕНЬ - Представление аналитика (используется инфологическая модель «сущность-связь»)

* сущности

* атрибуты

* связи

ЛОГИЧЕСКИЙ УРОВЕНЬ - Представление программиста

* записи

* элементы данных

* связи между записями

ФИЗИЧЕСКИЙ УРОВЕНЬ - Представление администратора

* группирование данных

* индексы

* методы доступа

1. 1 Классификация БД.

БД являются сложными системами, объединяющими разнотипные компоненты и выполняющие различные функции. Классификация БД производится как с точки зрения системы в целом, так и по отдельным характеристикам подсистем в отдельности. По используемому языку общения с БД различают системы с базовым языком (открытые системы) и с собственным языком (замкнутые системы) .

В открытых системах для обращения к БД используется язык программирования, расширенный операторами ЯМД, что требует непосредственного знания языка при общении с БД. Основной целью на этом этапе ( автоматизация процесса написания программ для общения с БД (автоматический синтез программ для общения с БД) . Связи с применением открытых систем при большом разнообразии типов запросов эффективным является реализация не регламентированных по содержанию запросов. Системы с базовыми языками требуют от программиста знание логической структуры той части БД, к которой он имеет непосредственный доступ.

Замкнутые СУБД имеют собственные самостоятельные языки общения юзеров с БД. Они позволяют обходиться без прикладных программистов и обеспечивать непосредственное общение с БД в режиме вопрос - ответ или в диалоговом режиме. Жесткой границы между открытыми и замкнутыми системами не. В настоящее время в связи с широким развитием работ по автоматизации проектирования информационных систем с реализацией тенденции программирования без программистов все разработанные системы все больше наделяются свойствами замкнутых систем.

В зависимости от особенностей моделей поддерживаемых БД различают следующие системы: системы со структурированными, неструктурированными и частично структурированными БД. Системы со структурированной БД ориентированы на предварительную классификацию объектов реального мира на установление свойств и связей, которые будут фиксироваться в БД, а также на предварительное определение форматов для хранения данных. Структурированные БД называются также форматированными или БД с детерминированной схемой. БД с детерминированной схемой удается представить как массовые предсказуемые события в предметной области. В системах с неструктурированной БД совокупность видов свойств и видов взаимосвязей объекта с другими объектами определяется только в момент появления каждого реального объекта в поле знания СУБД. СУБД делятся:

универсальные (такие СУБД настраиваются на ту или иную предметную область путем создания соответствующей БД и прикладных программ) ;
проблемно-ориентированные системы.

Проблемная ориентация СУБД может быть обусловлена различными причинами:

особенностями использования языковых средств;
включение в СУБД процедур обработки данных, учитывающих предметную область.

Большинство СУБД являются универсальными с широким спектром применения.

По допустимым режимам работы различают системы с пакетной, местной и телеобработкой. Изначально многие СУБД обладали возможностью обеспечивать только пакетного режима работы.

По характеру хранимой информации выделяют БД для экономической, научно технической, социально-политической, технологической и др. информации.

По способу организации обработки данных различают:

локализованные (достаточно 1 ЭВМ) ;
распределенные БД (БД реализуется на нескольких ЭВМ) .

Распределенные БД (РБД) . Первоначально РБД отождествлялась с распределенной БД по узлам сети, однако распределяться могут и другие компоненты БД, поэтому здесь используется понятие РБД, которое в процессе использования (ее компоненты) должны быть разделены только физически, но не логическом уровне. Логическая интеграция РБД означает, -что вся РБД - потенциально доступна из узла. В системах с РБД кроме понятия "схема" вводится понятие "супер-схема" - описание РБД как логически целой информационной совокупности. В РБД функции АБД распределены между администратором интегрированной БД и администраторами локальных БД. ПО каждого узла сети кроме компонентов, используемых в локальных БД, содержат 2 дополнительных компонента: средства управления связью, сетевую систему управления БД. С помощью сетевого компонента выявляются сведения о нахождении данных в системе, определяется, куда послать запрос на обработку.

Преимущества и недостатки РБД.

Преимущества:

РБД позволяет совместить децентрализованные и централизованные системы, т. е. есть возможность распределения нагрузки между различными компонентами системы. РБД обладает лучшими адаптивными свойствами и меньшей чувствительностью к выходу из строя отдельных компонентов. Недостатки:

Сложность. В РСУБД больше функций, чем в обычной СУБД. Проблемы синхронизации при обработке поисковых и корректирующих запросов. Сложная задача проектирования БД, как на логическом, так и на физическом уровнях. В РБД часто появляются дополнительные уровни модели данных (увеличивается время обработки) . Сложнее стоит вопрос с ЗИ.

Классификация РБД. В зависимости от однородности компонентов РБД различают однородные (гомогенные) и разнородные (гетерогенные) чаще всего эта классификация производится относительно используемых ЭВМ и СУБД. Гомогенные системы являются более простыми как с точки зрения проектирования и эксплуатации, гетерогенные более сложные и гибкие. По распределяемым ресурсам различают: системы с распределенными БД и распределенными СУБД. Системы РБД могут быть как с распределенными, так и с едиными СУБД. Системы с распределенными СУБД обязательно являются системами с РБД. Наряду, с очевидными достоинствами распределенные системы с централизованной БД имеют и недостатки. Высокая стоимость передачи данных, низкая надежность, большое время реакции системы. В многомашинном комплексе технических средств могут эффективно распределятся отдельные функции системы обработки данных. Такая функция по управлению данными могут быть переданы отдельной ЭВМ, такие системы называются внутрикомплексные распределенные системы со специализированными ЭВМ . Машины выполняющие функции управления БД называют процессорами БД или файловыми процессорами. Их роль обычно несут универсальные ЭВМ. ЭВМ которые используются для выполнения всех остальных функций по обработке данных за исключением управления БД называются главными машинами . Кроме того аналогичное распределение функций может быть выполнено в рамках 1 -й ЭВМ такие машины называются би- функциональными. Применение таких машин отличает их от стандартного применения БД по способу организации процесса внутримашинной обработки данных. БД в системах с РБД могут: равноправными и неравноправными. Существует много способов распределения данных по узлам сети, крайним вариантом является полностью избыточные сети, в которых инфра дублируется в каждом узле сети. Распределенные системы - это системы, в которых ни какая информация хранится не более чем в 1-м узле. По способу адресации запроса системы с распределенными БД делятся на безадресные и с явной адресацией. В без адресных системах используются разные способы определения место нахождения нужных данных, а именно хранение справочников в каждом узле, а также последовательный опрос узлов. В соответствии с топологией выделяют: сетевые, иерархические, звездообразные. Различают физическая и логическая топология. Физическая топология определяет действующий путь прохождения запроса в сети. Логическая топология определяет связи БД с пользователем без деталей их физической реализации.

1. 2 Объектно-ориентированные СУБД (ООСУБД)

В настоящем параграфе рассматриваются основные концепции, понятия, черты и характеристики объектно-ориентированных систем управления БД (ООСУБД) в контексте рассмотренных объектно-ориентированных программирования и технологии. В последние годы в результате проникновения идеологии ООП в СУБД интенсивные разработки теоретического и прикладного характера ведутся по созданию различного назначения. ООСУБД. Ввиду не совсем устоявшейся в этом направлении терминологии отметим основные черты и характеристики, определяющие СУБД как объектно-ориентированную. При этом по мере необходимости проводятся сопоставления с рассмотренной выше концепцией ООП.

Характеристики ООСУБД подразделяются на три определяющие группы:

- базовые, определяющие принадлежность СУБД к объектно-ориентированному

классу;

... продолжение

Вы можете абсолютно на бесплатной основе полностью просмотреть эту работу через наше приложение.