domingo, 27 de junio de 2010

DISEÑO DE BASES DE DATOS

BASES DE DATOS


Las bases de datos no son tan sólo una colección de archivos. Más bien, una base de datos es
una fuente central de datos destinados a compartirse entre muchos usuarios para una diversidad
de aplicaciones. El corazón de una base de datos lo constituye el sistema de administración
de base de datos (DBMS, datábase management system), el cual permite la creación,
modificación y actualización de la base de datos, la recuperación de datos y la generación de
informes y pantallas.


Entidades Una entidad es cualquier objeto o evento sobre el cual alguien escoge recopilar
datos. Una entidad podría ser una persona, lugar o cosa (por ejemplo, un vendedor,
una ciudad o un producto).

Un subtipo de entidad es una relación especial uno a uno que representa los atributos
adicionales (campos) de otra entidad que podría no estar presente en cada registro de la primera
entidad. Los subtipos de entidades eliminan la posibilidad de que una entidad pueda
tener campos nulos almacenados en las tablas de la base de datos.

Un ejemplo es la entidad principal de un cliente. Los clientes preferidos podrían tener
campos especiales que contengan información de descuentos especiales, y esta información
estaría en un subtipo de entidad. Otro ejemplo son los estudiantes que tienen periodos de
prácticas profesionales.

Hay tres tipos principales de bases de datos estructuradas de forma lógica: jerárquica,
red y relacional. Los primeros dos tipos se pueden encontrar en sistemas heredados (antiguos).
Hoy en día, un analista típicamente diseñaría una base de datos relacional.

NORMALIZACIÓN
La normalización es la transformación de las vistas de usuario complejas y del almacén de
datos a un juego de estructuras de datos más pequeñas y estables. Además de ser más simples
y estables, las estructuras de datos normalizadas son más fáciles de mantener que otras
estructuras de datos.


El objetivo principal del proceso de la normalización es simplificar todos los datos
complejos que se encuentran a menudo en las vistas de usuario. Por ejemplo, si el analista
tomara la vista de usuario descrita arriba y hubiera intentado extender una tabla relacional
de ella.

La relación CLIENTE-VENDEDOR es una relación de primera forma normal, pero no
está en su forma ideal.

USO DEL DIAGRAMA ENTIDAD-RELACIÓN PARA DETERMINAR LAS CLAVES DEL REGISTRO
El diagrama entidad-relación se podría usar para determinar las claves necesarias para una
relación de un registro o de una base de datos. El primer paso es construir el diagrama entidad-
relación y etiquetar una clave (principal) única para cada entidad de datos.


RELACIÓN UNO A MUCHOS
una tabla de base de datos no puede contener un grupo repetitivo o tabla, pero podría tener
un archivo tradicional indexado de forma secuencial. El archivo en el extremo muchos
podría tener claves externas almacenadas en una tabla dentro del archivo en el extremo
uno. Por ejemplo, el MAESTRO DE CLIENTES podría diseñarse para contener una tabla
de números de pedidos sobresalientes.

RELACIÓN MUCHOS A MUCHOS
Cuando la relación es de muchos a muchos, se necesitan tres tablas: una para cada entidad
de datos y otra para la relación. Las entidades PEDIDO y ARTÍCULO de nuestro ejemplo
tienen una relación muchos a muchos. La clave primaria de cada entidad de datos se almacena
como una clave externa de la tabla relacional. Esta última podría contener simplemente las
claves primarias para cada entidad de datos o podría contener datos adicionales, tales como
la calificación recibida de un curso o la cantidad de un artículo pedido.


RESTRICCIONES DE INTEGRIDAD
Las restricciones de integridad son reglas que controlan el cambio y eliminación de registros,
y ayuda a mantener los datos en la base de datos exacta. En una base de datos se aplican
tres tipos de restricciones de integridad:

1. Integridad de identidad.
2. Integridad referencial.
3. Integridad de dominio.

PASOS EN LA RECUPERACIÓN Y PRESENTACIÓN DE DATOS
Hay ocho pasos en la recuperación y presentación de datos:

1. Escoja una relación de la base de datos.
2. Una dos relaciones.
3. Proyecte las columnas de la relación.
4. Seleccione filas de la relación.
5. Derive nuevos atributos.
6. Indexe o clasifique las filas.
7. Calcule los totales y medidas de desempeño.
8. Presente los datos.


DESNORMALIZACION
Una de las razones principales para la normalización es organizar los datos para reducir los
datos redundantes. Si no se le pide almacenar los mismos datos una y otra vez, puede ahorrar
mucho espacio. Dicha organización permite al analista reducir la cantidad necesaria de
almacenamiento, algo muy importante cuando el almacenamiento era caro.

La desnormalización es el proceso de tomar el modelo de datos lógicos y transformarlo
en un modelo físico que es eficaz para las tareas más comunes. Estas tareas pueden incluir
generación de informes, pero también pueden significar consultas más eficaces. Las consultas
complejas tales como el proceso analítico en línea (OLAP), así como también la minería
de datos y los procesos de descubrimiento de datos del conocimiento (KDD), también pueden
usar las bases de datos denormalizadas.


ALMACENES DE DATOS
Los almacenes de datos difieren de las bases de datos tradicionales. El propósito de un almacén
de datos es organizar la información para consultas rápidas y eficaces. De hecho,
almacenan datos denormalizados, pero van un paso más adelante. Dichos almacenes organizan
los datos en torno a los temas.

No hay comentarios:

Publicar un comentario