Области применения баз данных: СУБД, даталогические модели и классификация по предметным областям

Тип работы: Курсовая работа
Бесплатно: Антиплагиат
Объем: 38 страниц
В избранное:

КУРСОВАЯ РАБОТА

На тему: Области применения баз данных

Алматы 2008

Содержание

Введение3

I. Системы управления базами данных (СУБД) и их структуры4

1. 1Основные положения4

1. 2 Иерархическая и сетевая даталогические модели СУБД7

1. 3 Сетевые структуры8

1. 3. 1 Файловая модель9

1. 4 Реляционные структуры11

1. 4. 1 Реляционные даталогические модели СУБД13

1. 4. 2 Объектно-ориентированные СУБД (ООСУБД) 15

1. 5 Иерархические структуры17

1. 5. 1 Иерархические структуры в реляционных базах данных18

1. 5. 2 Вложенные рекурсивные иерархические данные18

1. 5. 3 Отображение данных19

II. РАЗЛИЧНЫЕ КЛАССЫ БАЗ ДАННЫХ ПО ПРЕДМЕТНЫМ ОБЛАСТЯМ ИСПОЛЬЗОВАНИЯ21

2. 1 Документальные и документографические БД21

2. 2 Система баз данных о продукции24

2. 3 Экономическая и конъюнктурная информация27

2. 4 Фактографические базы социальных данных29

2. 5 Базы данных транспортных систем страны30

2. 6 Справочные базы для населения и организаций. 30

2. 7 Система ресурсных баз данных31

2. 8 Фактографические базы и банки научных данных32

2. 9 БД в области культуры и искусства34

2. 10 Лингвистические БД34

Заключение36

Список литературы38

Введение

В первых четырех параграфах первой главы рассматриваются основные системы управления базами данных, такие как иерархическая и сетевая даталогическая модели, реляционные даталогические модели, объектно-ориентированные СУБД. Обычно различают три класса СУБД, обеспечивающих работу иерархических, сетевых и реляционных моделей. Однако различия между этими классами постепенно стираются, причем, видимо, будут появляться другие классы, что вызывается прежде всего интенсивными работами в области баз знаний (БЗ) и объектно-ориентированной инфотехнологией. Поэтому традиционной классификацией пользуются все реже, но мы пока будем придерживаться именно ее, как наиболее устоявшейся. Каждая из указанных моделей обладает характеристиками, делающими ее наиболее удобной для конкретных приложений.

В пятом параграфе первой главы “Иерархические структуры” подробнее описываются положительные и отрицательные черты иерархической модели. Окружающий мир переполнен иерархическими данными. Любая группа объектов, в которой один объект может быть “родителем” для произвольного числа других объектов, организована в виде иерархического дерева. При работе с иерархиями используется “семейная” терминология (родители, внуки, предки, потомки), поскольку семья является самым распространённым примером объектов (в данном случае - людей), объединённых иерархическими отношениями. В то же время место объекта в иерархическом дереве - не более чем условное обозначение связи с другими объектами. Иерархическая структура всего лишь помогает сохранить и найти объект.

В данной работе я постаралась классифицировать существующие базы данных, а так же оценить перспективы их развития в нашей стране. Классификационным признаком является предметная область использования. Целью данной работы является так же анализ наиболее распространенных классов БД, получивших распространение и применение как в нашей стране, так и за рубежом. Этому посвящена вся вторая глава.

В данной работе не акцентируется проблема передачи данных между БД, а лишь исследуется архитектура и общая организация самих БД.

I. Системы управления базами данных (СУБД) и их структуры

Основные идеи современной информационной технологии базируются на концепции баз данных (БД) . Согласно данной концепции основой информационной технологии являются данные, организованные в БД, адекватно отражающие реалии действительности в той или иной предметной области и обеспечивающие пользователя актуальной информацией в соответствующей предметной области. Первые БД появились уже на заре 1-го поколения ЭВМ представляя собой отдельные файлы данных или их простые coвокупности. По мере увеличения объемов и структурной сложности хранимой информации, а также расширения круга потребителей; информации определилась необходимость создания удобных эффективных систем интеграции хранимых данных и управления ими. В конце 60-х годов это привело к созданию первых коммерческих систем управления базами данных (СУБД), поддерживающих opганизацию и ведение БД.

Основные положения

База данных (БД) в строгом смысле слова представляет собой совокупность взаимосвязанных файлов данных определенной организации. БД, как правило, включает целый ряд файлов, но может состоять и из единственного файла. Данные, составляющие БД, отражают характеристики объектов и их отношений в соответствующей прикладной области. Каждый файл, входящий в БД, содержит определенное число записей (изменяемое в процессе функционирования БД), отражающих ту или иную сторону предметной области, на которую ориентирована БД. Как правило, файлы БД содержат большое число однотипных записей. Записи, в свою очередь, состоят из полей, представляющих определенные типы информации об объектах. Поле является наименьшей информационной единицей, непосредственно доступной в записи. Если файл_1 БД (рис. 1) содержит п однотипных записей (имеющих одинаковую структуру полей и их смысловую нагрузку), то j-запись ( 1<j <n) файла состоит из фиксированного набора (кортежа полей А1-Ак), каждое из которых содержит в общем случае различного типа информацию. При наличии БД прикладные программы могут использовать ее информацию (записи и их поля) для решения конкретных задач в прикладной области, на которую ориентирована данная БД.

1: 1

Поле А1: Поле А1

Поле А2: Поле А2

…: …

Поле Ак: Поле Ак

…: …

Поле S1: Поле S1

Поле S2: Поле S2

…: …

Поле Sd: Поле Sd

1: 1

1: 2

Поле А1: Поле А1

Поле А2: Поле А2

…: …

Поле Ак: Поле Ак

…: …

Поле S1: Поле S1

Поле S2: Поле S2

…: …

Поле Sd: Поле Sd

1: 2

1: . . .

Поле А1: …

Поле А2: …

…: …

Поле Ак: …

…: …

Поле S1: …

Поле S2: …

…: …

Поле Sd: …

1: …

1: N

Поле А1: Поле А1

Поле А2: Поле А2

…: …

Поле Ак: Поле Ак

…: …

Поле S1: Поле S1

Поле S2: Поле S2

…: …

Поле Sd: Поле Sd

1: P

Поле А1:

Поле А2: Файл_1

…:

Поле Ак:

…:

Поле S1:

Поле S2: Файл_М

…:

Поле Sd:

Рис. 1 Файловая организация баз данных (файлы, записи, поля)

Пользователями БД являются четыре основные категории потребителей ее информации и/или поставщиков информации для нее: (1) конечные пользователи, (2) программисты и системные аналитики, (3) персонал поддержки БД в актуальном состоянии и (4) администратор БД. Хорошо спроектированные системы управления БД (СУБД), используют развитые графические интерфейсы и поддерживают системы отчетов, отвечающие специфике пользователей указанных четы рех категорий. В этом случае персонал поддержки БД и конечные пользователи могут легко осваивать и использовать СУБД для обеспечения своих потребностей без какой-либо специальной подготовки, т. е. специфика функционирования данных систем скрыта от пользователя. Более того, хорошо спроектированные СУБД предоставляют опытному пользователю средства для создания собственных БД-приложений, не требуя от него специальной программистской подготовки. Конечным пользователям для обеспечения доступа к информации БД предоставляется графический интерфейс, как правило, в виде системы окон с функциональными меню, позволяющими легко получать необходимую информацию на экран и/или принтер в виде удобно оформленных отчетов.

Программисты и системные аналитики используют СУБД совершенно в ином качестве, обеспечивая разработку новых БД-приложений, поддерживая и модифицируя (при необходимости) уже существующие. Для данной группы пользователей СУБД требуются средства, обеспечивающие указанные функции (создание, откладка, редактирование и т. д. ) . Пользователи третьей категории нуждаются в интерфейсе, как правило, графическом для обеспечения задач поддержания БД в актуальном состоянии. Эти пользователи состоят в штатах подразделений функциональных и/или обработки информации, обеспечивающих прикладную область, и отвечают за актуальное состояние соответствующей ей БД (контроль текущего состояния, удаление устаревшей информации, добавление новой и т. д. ) . Программисты выполняют своего рода посреднические функции между БД и конечными пользователями. И если на первых этапах развития БД-технологии они составляли весьма многочисленную группу пользователей, то в процессе развития СУБД и, прежде всего, массового использования ПК эта категория сходит на нет. Особую и ответственную роль выполняет администратор, отвечающий как за актуальность находящейся в БД информации, так и за корректность функционирования и использования БД и СУБД.

В случае больших БД может быть достаточно много конечных пользователей, ряд программистов и несколько администраторов БД; в случае небольших БД (что особенно характерно для ПК) все эти функции могут обеспечиваться одним человеком. Важные функции выполняет администратор БД, отвечающий за выработку требований к БД, ее проектирование, реализацию, эффективное использование и сопровождение. Необходимость в таком специалисте вытекает из принципа независимости данных, а также диктуется важностью БД в деятельности организаций и более крупных объединений - поставщиков и потребителей информации БД. Администратор БД взаимодействует с пользователями в определении требований к базе в процессе выработки требований к системе в целом, пользуется языком описания данных для определения БД в процессе проектирования системы, взаимодействует с программистами, которые создают ПС использующее доступ к БД, отвечает за загрузку БД информацией в процессе реализации системы, контролирует работоспособность БД, используя соответствующие программные и аппаратные средства, и определяет, когда следует реорганизовывать данные в базе или начать работы по созданию новой, более совершенной БД. В целом функции администратора БД сводятся к поддержанию целостности БД, необходимого уровня защиты ее данных и эффективности. Среди его наиболее важных обязанностей - согласование конфликтующих требований, которое требуется достаточно часто, ибо БД обслуживает, как правило, целый ряд различных прикладных процессов.

Как уже отмечалось, БД представляет собой совокупность логически взаимосвязанных файлов данных определенной организации; для определения и обращения к такой файловой совокупности используют средства системы управления БД (СУБД) . СУБД представляет собой со вокупность лингвистических и программных средств, предназначенных для создания, ведения и совместного использования БД многими пользователями. Тогда как под системой БД понимается СУБД с наполненной соответствующей информацией БД, управляемой ее средствами. Это означает, во-первых, что совокупность файлов БД определяется посредством схемы, не зависящей от программ, которые к ней обращаются, и, во-вторых, что она реализована на основе ВП прямого доступа. Использование СУБД обеспечивает лучшее управление данными, более совершенную организацию файлов и более простое обращение к ним по сравнению с обычными способами хранения информации. Вследствие более совершенных механизмов доступа БД, как правило, имеют более сложную организацию, чем обычные файлы, объединяя данные, ранее хранящиеся во многих отдельных файлах. Размер и сложность не являются определяющими характеристиками БД - наличие СУБД для ПК и даже в среде ряда пакетов (например, табличных процессоров, интегрированных и др. ) приводит к созданию большого числа относительно простых и небольших БД, достоинством которых (при наличии соответствующих СУБД) являются простота определения и доступа к данным. Под банком данных (БнД) понимается с ис тем а лингвистических, пр ограммных, аппаратных и организационных средств, основанная на БД-технологии и предназначенная для централизованного накоп лен ия и коллективного испо льзования данных в той или иной прикладной области. Тогда как система обработки информации (СОИ) реализует автоматизированный сбор, обработку и хранение информации, включая соответствующие лингвистические, программные, аппаратные, организационные средства и обслуживающий их персонал.

Под целостностью БД понимается актуальное состояние ее данных, отражающих состояние некоторой реальной прикладной области и подчиняющихся правилам непротиворечивости. Под языком БД понимается один или совокупность языков, обеспечивающих описание данных, манипулирование с данными. Конкретный язык БД всегда ассоциируется с конкретной СУБД. СУБД представляет собой средства обработки на языке базы данных, позволяющие обрабатывать обращения к БД, поступающие от прикладных программ и/или конечных пользователей, и поддерживать целостность БД. Таким образом, СУБД имеет свойства, характерные как для компиляторов, так и для ОС, однако по сравнению с первыми обеспечивается более высокий уровень абстрагирования, что оказывается очень полезным как для программистов, так и для конечных пользователей.

1. 2 Иерархическая и сетевая даталогические модели СУБД

Каждая БД содержит и обрабатывает информацию из конкретной прикладной области, представляющей интерес для определенных приложений. Описание предметной области без акцента на ее последующие БД-реализации определяет инфологическую модель предметной области. Инфологическая модель является исходной для построения даталогической модели БД и служит промежуточной моделью для специалистов предметной области (для которой создается БнД) и администратора БД в процессе проектирования и разработки конкретной БД.

Под даталогической понимается модель, отражающая логические взаимосвязи между элементами данных безотносительно их содержания и физической организации. При этом даталогическая модель разрабатывается с учетом конкретной реализации СУБД, также с учетом специфики конкретной предметной области на основе ее инфологической модели. Для конкретной реализации даталогической модели проектируется физическая модель, oтображающая первую на конкретные программные и аппаратные средства (ОС, внешняя память, работа с данными на физическом уровне и т. д. ) . Наполненная конкретной информацией физическая модель и составляет собственно БД. Система, обеспечивающая cоответствующее совместное функционирование указанных компонентов и составляет суть конкретной СУБД.

Современные СУБД допускают целый ряд классификаций в зави симости от уровня их рассмотрения (в целом либо по совокупности их функциональных характеристик) : по интерфейсу с пользователем в зависимости от поддерживаемых моделей, по назначению и режиму функционирования, по способу обработки информации и т. д. Мы кратко остановимся на моделях даталогического уровня, который берется за основу большинства современных классификаций СУБД.

Обычно различают три класса СУБД, обеспечивающих работу иерархических, сетевых и реляционных моделей. Однако различия между этими классами постепенно стираются, причем, видимо, будут появляться другие классы, что вызывается прежде всего интенсивными работами в области баз знаний (БЗ) и объектно-ориентированной инфотехнологией, о которой будет идти речь ниже. Поэтому традиционной классификацией пользуются все реже, но мы пока будем придерживаться именно ее, как наиболее устоявшуюся. Каждая из указанных моделей обладает характеристиками, делающими ее наиболее удобной для конкретных приложений. Одно из основных различий этих моделей состоит в том, что для иерархических и сетевых СУБД их структура часто не может быть изменена после ввода данных, тогда как для реляционных СУБД структура может изменяться в любое время. С другой стороны, для больших БД, структура которых остается длительное время неизменной, и постоянно работающих с ними приложений с интенсивными потоками запросов на БД-обслуживание именно иерархические и сетевые СУБД могут оказаться наиболее эффективными решениями, ибо они могут обеспечивать более быстрый доступ к информации БД, чем реляционные СУБД.

1. 3 Сетевые структуры

Если в отношении между данными порожденный элемент имеет более одного исходного элемента, то это отношение уже нельзя описать как древовидную или иерархическую структуру. Его описывают в виде сетевой структуры. Любая сетевая структура может быть приведена к более простому виду введением избыточности. “БД постоянно грозит опасность стать громоздкими, застывшими и слишком сложными системами. Новые приложения порождают новые виды запросов пользователей к базе, что увеличивает набор логических связей между ее элементами. В итоге многие системы БД оказываются очень сложными в построении и эксплуатации. Если разработчики не придумают ясные и простые схемы организации, эти системы будут подобны паутине” [К. Дейт. ] .

Сетевая модель более симметрична, чем иерархическая модель. Однако процедуры (обновления) значительно сложнее. Проблема состоит в следующем: всегда имеются две стратегии для определения места одного экземпляра записи, первая начинается с "владельца" и просмотра его цепочки для выбора звена, а другая начинается с "подчиненного звена" и просмотра его цепочки для выбора "владельца". Как пользователь может решить, какую стратегию принять? Выбор и здесь имеет большое значение. Как в иерархических, так и сетевых СУБД при описании данных обычно указываются характеристики записей каждого типа, способствующие более эффективному размещению данных во внешней памяти и более быстрому доступу к ним. К таким характеристикам относятся: размеры полей записи (минимальные, средние, максимальные), состав ключа, допустимый набор символов, интервалы значений и т. д.

Иерархические и сетевые базы данных часто называют базами данных с навигацией. Это название отражает технологию доступа к данным, используемую при написании обрабатывающих программ на языке манипулирования данными. При этом, очевидно, что доступ к данным по путям, не предусмотренным при создании базы данных, может потребовать неразумно большого времени. Повышая эффективность доступа к данным и сокращая таким образом время ответа на запрос, принцип навигации вместе с этим повышает и степень зависимости программ и данных. Обрабатывающие программы оказываются жестко привязанными к текущему состоянию структуры базы данных и должны быть переписаны при ее изменениях. Операции модификации и удаления данных требует переустановки указателей, а манипулирование данными остается записеориентированным. Кроме того, принцип навигации не позволяет существенно повышать уровень языка манипулирования данными, чтобы сделать его доступным пользователю-непрограммисту, или даже программисту-непрофессионалу. Для поиска записи-цели в иерархической или сетевой структуре программист должен вначале опеределить путь доступа, а затем просмотреть все записи, лежащие на этом пути, - шаг за шагом.

Насколько запутанной являются схемы представления иерархических и сетевых баз данных, настолько и трудоемким является проектирование конкретных прикладных систем на их основе. Как показывает, опыт длительные сроки разработки прикладных систем нередко приводят к тому, что они постоянно находятся в стадии разработки и доработки.

Указанные и некоторые другие проблемы, с которыми столкнулись разработчики и пользователи иерархических и сетевых систем послужили стимулом к созданию реляционной модели данных и реляционных СУБД.

1. 3. 1 Файловая модель

... продолжение

Вы можете абсолютно на бесплатной основе полностью просмотреть эту работу через наше приложение.