Введение в теорию баз данных
Другое направление связано с созданием информационных систем. В них необходимо не только обрабатывать, но и хранить большие объемы данных со сложной внутренней структурой, обеспечивать быстрый поиск нужной информации. Создание подобных систем стало возможным после появления надежных, емких и быстродействующих устройств энергонезависимой памяти: в первую очередь речь идет о накопителях на жестких… Читать ещё >
Введение в теорию баз данных (реферат, курсовая, диплом, контрольная)
Основные понятия
Исторически сложились два основных направления использования вычислительной техники, первое из которых связано с проведением сложных преобразований над относительно небольшими объемами данных с простой структурой. Здесь компьютеры позволили быстрее проводить расчеты по вычислительно сложным алгоритмам. Подобные задачи дали толчок к созданию первых ЭВМ, их актуальность не снижается и сейчас.
Другое направление связано с созданием информационных систем. В них необходимо не только обрабатывать, но и хранить большие объемы данных со сложной внутренней структурой, обеспечивать быстрый поиск нужной информации. Создание подобных систем стало возможным после появления надежных, емких и быстродействующих устройств энергонезависимой памяти: в первую очередь речь идет о накопителях на жестких магнитных дисках. Классическим примером систем подобного типа являются системы резервирования железнодорожных и авиационных билетов. Последовательность операций, выполняемых при каждом заказе, относительно проста, но для корректного функционирования всей системы необходимо хранить и постоянно актуализировать большие объемы данных, выполнять в них поиск и т. п.
Автоматизированная информационная система — это функционирующий на основе ЭВМ комплекс, обеспечивающий сбор, хранение, актуализацию и обработку информации в целях поддержки какого-либо вида деятельности, т. е. автоматизированная ИС разрабатывается для определенной предметной области.
Предметная область — часть реального мира, подлежащая изучению с целью организации управления и, в конечном счете, автоматизации. Создавая ИС, мы, в некотором смысле, формируем информационную модель, позволяющую описать значимые характеристики реальных объектов и их взаимосвязи.
Автоматизированная ИС может функционировать самостоятельно или служить компонентом более сложной системы, например автоматизированной системы управления предприятием. По типу хранимой и обрабатываемой информации выделяют два больших класса автоматизированных информационных систем — документальные и фактографические.
Документальные системы служат для работы с текстами на естественном языке — статьями, научными отчетами, текстами законодательных актов и т. д. Наиболее распространенным видом документальных систем являются информационно-поисковые системы, предназначенные для накопления и поиска документов на естественном языке. Их иногда еще называют полнотекстовыми базами данных.
Документы, хранящиеся в подобных системах, составляют поисковый массив документов системы. Для каждого документа формируется поисковый образ — некое формальное описание документа в терминах языка системы, которое отражает его содержание. Например, поисковый образ может быть сформирован указанием набора ключевых слов. Запрос пользователя представляется в виде поискового образа запроса, который сопоставляется с поисковыми образами хранимых документов. Отобранные в результате документы называются релевантными запросу.
Фактографические системы составляют другой большой класс автоматизированных информационных систем. Они оперируют фактическими данными, представленными в виде специальным образом организованных совокупностей записей. Именно им и посвящена основная часть данного курса, так как именно в фактографических системах в полной мере используются методы и инструменты теории БД. Фактографические системы, создаваемые средствами технологии БД, часто называют банками данных (см. определение ниже).
Иногда в дополнение к выделенным двум классам вводят понятие лексикографических баз данных и информационных систем, относя к ним различного рода словари и классификаторы.
В отечественных нормативных документах в сфере разработки БД даются следующие определения.
Банк данных [1, 2] - это система специальным образом организованных данных (баз данных), программных, технических, языковых, организационно-методических средств, предназначенных для обеспечения централизованного накопления и коллективного многоцелевого использования данных.
В англоязычной литературе понятие, по сути близкое к банку данных, обозначается термином система баз данных (англ. database system).
База данных — именованная совокупность данных, отражающая состояние объектов и их отношений в заданной предметной области.
Базу данных можно рассматривать как электронную картотеку, хранилище для некоторого набора занесенных в компьютер данных. Выполняют следующие операции над БД:
- • добавить новые данные в БД;
- • изменить существующие данные;
- • удалить данные из БД;
- • найти данные в БД и т. д.
Базы данных организуются на основе различных моделей данных. Пример фрагмента БД реляционного типа представлен в табл. 1.1. Данные в этом случае организуются в виде реляционных таблиц, строки таблиц называют записями, а столбцы — полями или атрибутами. Принципиально важной особенностью БД является то, что они содержат дополнительную служебную информацию о своей структуре, иначе говоря, являются самодокументируемыми.
Таблица 1.1
Фрагмент реляционной БД
StudID. | FIO. | Group. |
Иванов И.И. | ||
Петров П.П. |