Solo teneis que seguirme en

http://www.elblognono.blogspot.com




Sistemas Gestores de Bases de Datos 2º Administración de Sistemas Informáticos
Tema 1
GESTIÓN DE DATOS Y SISTEMAS DE BASES DE DATOS
IES Francisco Romero Vargas
Departamento de Informática

Tema 1. Gestión de Datos y Sistemas de Bases de Datos.
Página 1 de 25

Sistemas Gestores de Bases de Datos 2º Administración de Sistemas Informáticos
1. Gestión de datos y bases de datos
En el mundo actual existe una cada vez mayor demanda de datos y, por tanto, más necesidad de gestionarlos. Esta demanda siempre ha sido patente en empresas y sociedades, pero en estos años la demanda todavía de ha disparado más debido al acceso multitudinario a las redes integradas en Internet y a la aparición de pequeños dispositivos (móviles y PDA) que también requieren esa información.
En informática se conoce como dato a cualquier elemento informativo que tenga relevancia para un usuario. Desde su nacimiento, la informática se ha encargado de proporcionar herramientas que faciliten la manipulación de los datos.
Antes de la aparición de las aplicaciones informáticas, las empresas tenían como únicas herramientas de gestión de datos a los cajones, carpetas y fichas en las que se almacenaban los datos. En este proceso manual, el tipo requerido para manipular estos datos eran enormes. Pero la propia informática ha adaptado sus herramientas para que los elementos que el usuario utiliza en cuanto a manejo de datos se parezcan a los manuales. Por eso en informática se sigue hablado de ficheros, formularios, carpetas, directorios,.... De esta forma, la clientela fundamental del profesional de la informática es la empresa. La empresa se puede entender como un sistema formado por diversos objetos: el capital, los recursos humanos, los inmuebles, los servicios que presta, etc. El sistema completo que forma la empresa se suele dividir en los siguientes subsistemas:
• Subsistema productivo. También llamado subsistema real o físico. Representa la parte de la empresa encargada de gestionar la producción de la misma.
• Subsistema financiero. Encargado de la gestión de los bienes económicos de la empresa.
• Subsistema directivo. Encargado de la gestión organizativa de la empresa.
Son los sistemas de información los encargados de manejar la gran cantidad de información que maneja cada uno de estos subsistemas empresariales.
Los sistemas de información actuales se basan en bases de datos y sistemas de bases de datos, que se han convertido en elementos imprescindibles de la vida cotidiana de la sociedad moderna.
Tema 1. Gestión de Datos y Sistemas de Bases de Datos. Página 2 de 25
Sistemas Gestores de Bases de Datos 2º Administración de Sistemas Informáticos
Cada día, la mayoría de nosotros nos encontramos con actividades que requieren algún tipo de interacción con una base de datos (ingreso en un banco, reserva de una entrada para el teatro, solicitud de una suscripción a una revista, compra de productos, ...). Estas interacciones son ejemplos de lo que se llama aplicaciones tradicionales de bases de datos (básicamente información numérica o de texto), aunque los avances tecnológicos han permitido que también existan: bases de datos multimedia, sistemas de información geográfica (GIS), almacenes de datos, sistemas de proceso analítico on-line, ...
Sin embargo, para entender los fundamentos de las tecnologías de bases de datos debemos empezar desde las bases de las aplicaciones tradicionales.
Una base de datos será, por tanto, una colección de datos relacionados. Por datos queremos decir hechos conocidos que pueden registrarse y que tienen un significado implícito. Una agenda con los nombres y teléfonos de un conjunto de personas conocidas es una base de datos, puesto que es una colección de datos relacionados con un significado implícito.
2. Sistemas de información
Según la RAE un Sistema es un “Conjunto de reglas o principios sobre una materia racionalmente enlazados entre sí” o bien un “Conjunto de cosas que relacionadas entre sí ordenadamente contribuyen a determinado objeto”.
Los sistemas que aglutinan los elementos que intervienen para gestionar la información que manejan los subsistemas empresariales es lo que se conoce como Sistemas de Información. Se suele utilizar las siglas SI o IS (de Information System) para referirse a ello.
Un sistema de información es un sistema dentro de la empresa que permite el uso y las transferencias de informaciones entre unos subsistemas y otros de la empresa.
Realmente un sistema de información sólo incluye la información que nos interesa de la empresa y los elementos necesarios para gestionar esa información.
Un sistema de información genérico está formado por los siguientes elementos:
Tema 1. Gestión de Datos y Sistemas de Bases de Datos. Página 3 de 25
Sistemas Gestores de Bases de Datos 2º Administración de Sistemas Informáticos
• Recursos físicos. Carpetas, documentos, equipamiento, discos,...
• Recursos humanos. Personal que maneja la información.
• Reglas. Normas que debe cumplir la información para que sea manejada (formato de la información, modelo para los documentos,...), es decir, las normas, métodos y protocolos determinados por la planificación de la empresa.
Las empresas necesitan implantar estos sistemas de información para obtener una mayor calidad en la organización de las actividades de los subsistemas empresariales.
Cuando parte o toda la gestión de un sistema de información se realiza con ordenadores se habla de sistema de información basado en ordenadores o sistema informático. En este caso a las reglas de la empresa se añaden las normas determinadas por el sistema operativo de los ordenadores y demás software instalado en ellos.
Componentes de un sistema informático
En el caso de una gestión electrónica de la información (lo que actualmente se considera un sistema de información), los componentes son:
• Datos. Se trata de la información relevante que almacena y gestiona el sistema de información. Esta información suele estar almacenada en bases de datos que cumplen con los requerimientos o normas de la empresa.
• Hardware. Equipamiento físico que se utiliza para gestionar los datos.
• Software. Aplicaciones que permiten el funcionamiento adecuado del sistema.
• Recursos humanos. Personal que maneja el sistema de información.
Tipos de sistemas informáticos
Según el propósito, los sistemas de información se pueden clasificar en:
● Transaccionales. Se ocupan de la automatización de las operaciones y transacciones que se realizan en la empresa, por ejemplo, las
Tema 1. Gestión de Datos y Sistemas de Bases de Datos. Página 4 de 25
Sistemas Gestores de Bases de Datos 2º Administración de Sistemas Informáticos
actividades que realizan los empleados de manera cotidiana (fichar a la hora de entrada del trabajo, firmar, ...)
● De Gestión. Se ocupan de los datos que se manejan en la empresa y su almacenamiento. Por ejemplo controlan cómo se almacenan los datos en las bases de datos, cómo se recupera esa información, cómo se obtienen listados, informes, etc.
● De soporte a la decisión. Su misión es ayudar a los directivos y personal con responsabilidad dentro de la empresa en la toma de decisiones estratégicas. Estos sistemas están emparentados con las técnicas de inteligencia artificial y los sistemas expertos y son cada vez más comunes e importantes dentro de las empresas.
● Ofimática, sistemas expertos y sistemas inteligentes son otros tipos de sistemas de información informáticos.
Tipos de sistemas de información de gestión de datos
Según el enfoque dado a los datos, los sistemas de información pueden diferenciarse en orientados al proceso (sistema clásico de ficheros) u orientados a los datos (sistema de bases de datos).
● Sistemas de información orientados al proceso: FICHEROS
En estos sistemas de información se crean diversas aplicaciones (software) para gestionar diferentes aspectos del sistema. Cada aplicación realiza unas determinadas operaciones.
Los datos de dichas aplicaciones se almacenan en archivos digitales dentro de las unidades de almacenamiento del ordenador (a veces en archivos binarios, o en hojas de cálculo, ...).
En estos sistemas, cada programa almacena y utiliza sus propios datos de forma un tanto caótica. La única ventaja que conlleva esto es que los procesos son independientes, por lo que la modificación de uno no afecta al resto. Pero tiene grandes inconvenientes:
Tema 1. Gestión de Datos y Sistemas de Bases de Datos. Página 5 de 25
Sistemas Gestores de Bases de Datos 2º Administración de Sistemas Informáticos
● Coste de almacenamiento elevado. Al almacenarse varias veces el mismo dato en distintas apliocaciones, se requiere más espacio en los discos.
● Datos redundantes. Ya que se repiten continuamente.
● Probabilidad alta de inconsistencia en los datos. Ya que un proceso cambia sus datos y no el resto. Por lo que el mismo dato puede tener valores distintos según qué aplicación acceda a él.
● Difícil modificación en los datos Debido a la probabilidad de inconsistencia, que ocurre cuando se produce una pérdida o hay incoherencia de datos. Para que ésta no exista, cada modificación se debe repetir en todas las copias del dato (algo que normalmente es imposible).
● Tiempos de procesamiento elevados. Al no poder optimizar el espacio de almacenamiento.
En la siguiente figura se muestra un sistema de información basado en ficheros. En ella se ve que la información aparece inconexa y redundante.
Tema 1. Gestión de Datos y Sistemas de Bases de Datos. Página 6 de 25
Sistemas Gestores de Bases de Datos 2º Administración de Sistemas Informáticos
• Sistemas de información orientados a los datos: BASES DE DATOS
En este tipo de sistemas los datos se centralizan en una base de datos común a todas las aplicaciones. Estos serán los sistemas que estudiaremos en este curso.
En esos sistemas los datos se almacenan en una única estructura lógica que es utilizable por las aplicaciones. A través de esa estructura se accede a los datos que son comunes a todas las aplicaciones.
ventajas
inconvenientes
Independencia de los datos y los programas y procesos. Esto permite modificar los datos sin modificar el código de las aplicaciones.
Menor redundancia. No hace falta tanta repetición de datos. Aunque, sólo los buenos diseños de datos tienen poca redundancia.
Integridad de los datos. Mayor dificultad de perder los datos o de realizar incoherencias con ellos.
Mayor seguridad en los datos. Al limitar el acceso a ciertos usuarios.
Datos más documentados. Gracias a los metadatos que permiten describir la información de la base de datos.
Acceso a los datos más eficiente. La organización de los datos produce un resultado más óptimo en rendimiento.
Menor espacio de almacenamiento. Gracias a una mejor estructuración de los
Instalación costosa. El control y administración de bases de datos requiere de un software y hardware poderoso
Requiere personal cualificado. Debido a la dificultad de manejo de este tipo de sistemas.
Implantación larga y difícil. Debido a los puntos anteriores. La adaptación del personal es mucho más complicada y lleva bastante tiempo.
Ausencia de estándares reales. Lo cual significa una excesiva dependencia hacia los sistemas comerciales del mercado. Aunque hay una buena parte de esta tecnología aceptada como estándar de hecho.
Tema 1. Gestión de Datos y Sistemas de Bases de Datos. Página 7 de 25
Sistemas Gestores de Bases de Datos 2º Administración de Sistemas Informáticos
datos.
En la siguiente figura se muestra un sistema de información basado en bases de datos. La información está relacionada y no es redundante.
3. Sistemas de ficheros
Un sistema de ficheros es un conjunto de programas que prestan servicio a los usuarios finales. Cada programa define y maneja sus propios datos.
Los sistemas de ficheros surgieron al tratar de informatizar el manejo de los archivadores manuales con objeto de proporcionar un acceso más eficiente a los datos.
En lugar de establecer un sistema centralizado en donde almacenar todos los datos de la organización o empresa, se escogió un modelo descentralizado en el que cada sección o departamento almacena y gestiona sus propios datos.
Tema 1. Gestión de Datos y Sistemas de Bases de Datos. Página 8 de 25
Sistemas Gestores de Bases de Datos 2º Administración de Sistemas Informáticos
Tipos de operaciones sobre ficheros
Sobre los ficheros se pueden realizar las siguientes operaciones:
• Abrir (open). Prepara el fichero para su proceso.
• Cerrar (close). Cierra el fichero impidiendo su proceso inmediato.
• Leer (read). Obtiene información del fichero.
• Escribir (write). Graba información en el fichero.
• Posicionarse (seek). Coloca el puntero de lectura en una posición concreta del mismo (no se puede realizar en todos los tipos de ficheros).
• Detectar la marca de final de fichero (eof). Indica si hemos llegado al final del fichero.
Tipos de ficheros según su estructura física
● Ficheros secuenciales
En estos ficheros, los datos se organizan secuencialmente en el orden en el que fueron grabados. Para leer los últimos datos hay que leer los anteriores.
ventajas
inconvenientes
• Rápidos para obtener registros contiguos
• No hay huecos en el archivo al grabarse los datos seguidos, datos más compactos
• Consultas muy lentas al tener que leer todos los datos anteriores al dato que queremos leer
• Algoritmos de lectura y escritura más complejos
• No se pueden eliminar registros del fichero (se pueden marcar de manera especial para que no sean tenidos en cuenta, pero no se pueden borrar)
• La ordenación de los datos requiere volver a
Tema 1. Gestión de Datos y Sistemas de Bases de Datos. Página 9 de 25
Sistemas Gestores de Bases de Datos 2º Administración de Sistemas Informáticos
crearle de nuevo
• Ficheros de acceso directo o aleatorio
Se puede leer una posición concreta del fichero, con saber la posición (normalmente en bytes) del dato a leer.
ventajas
inconvenientes
• Acceso rápido al no tener que leer los datos anteriores
• Actualización más cómoda de programar
• Se pueden borrar datos (aunque quedarán huecos)
• Permiten acceso secuencial
• Permiten leer y escribir a la vez
• En términos de base de datos no se utiliza la posición de los datos en bytes, sino respecto a una determinada clave. Por lo que habrá que convertir esa clave a bytes, lo que dificulta su manejo
• No generan ficheros compactos ya que se crean huecos al borrar
• Las consultas sobre multitud de registros son más lentas que en el caso anterior.
• Ficheros secuenciales encadenados
Son ficheros secuenciales gestionados mediante punteros, datos especiales que contienen la dirección de cada registro del fichero. Cada registro posee ese puntero que indica la dirección del siguiente registro y que se puede modificar en cualquier momento.
ventajas
inconvenientes
• El fichero mantiene un determinado orden
• La ordenación no requiere grabar nuevo fichero, sino modificar los punteros
• Las mismas ventajas que
• No se borran los registros, sino que se marcan para ser ignorados. Por lo que se malgasta espacio
• Más rápidos que los secuenciales, pero más
Tema 1. Gestión de Datos y Sistemas de Bases de Datos. Página 10 de 25
Sistemas Gestores de Bases de Datos 2º Administración de Sistemas Informáticos
el acceso secuencial
lentos que los aleatorios
• Ficheros secuenciales indexados
Se utilizan dos ficheros para los datos, uno posee los registros almacenados de forma secuencial, pero que permite su acceso aleatorio. El otro posee una tabla con punteros a la posición ordenada de los registros. Ese segundo fichero es el índice que es una tabla con la ordenación deseada para los registros y la posición que ocupan en el archivo.
El archivo de índices posee unas cuantas entradas sólo en las que se indica la posición de ciertos valores claves en el archivo (cada 10, 15 ,20,... registros del archivo principal se añade una entrada en el de índices).
El archivo principal tiene que estar siempre ordenado y así cuando se busca un registro, se busca su valor clave en la tabla de índices, la cual poseerá la posición del registro buscado. Desde esa posición se busca secuencialmente el registro hasta encontrarlo.
Existe un archivo llamado de desbordamiento y overflow en el que se colocan los archivos que se van añadiendo los nuevos registros (para no tener que ordenar el archivo principal cada vez que se añade un nuevo registro) este archivo está desordenado. Se utiliza sólo si se busca un registro y no se encuentra en el archivo principal. En ese caso se recorre todo el archivo de overflow hasta encontrarlo.
Para no tener demasiados archivos en overflow (lo que restaría velocidad), cada cierto tiempo se reorganiza el archivo principal.
ventajas
inconvenientes
• Se mantiene un orden concreto
• La búsqueda de datos es rapidísima
• Permite la lectura secuencial
• Para un uso óptimo hay que reorganizar el archivo principal y esta operación es muy costosa ya que hay que reescribir de nuevo y de forma ordenada todo el archivo.
• La adición de registros
Tema 1. Gestión de Datos y Sistemas de Bases de Datos. Página 11 de 25
Sistemas Gestores de Bases de Datos 2º Administración de Sistemas Informáticos
requiere más tiempo que en los casos anteriores
• No se pueden borrar los datos, se marcan para no ser leídos
• Ficheros indexado-encadenados
Utiliza punteros e índices, es una variante encadenada del caso anterior. Hay un fichero de índices equivalente al comentado en el caso anterior y otro fichero de tipo encadenado con punteros a los siguientes registros. Cuando se añaden registros se añaden en un tercer registro llamado de desbordamiento u overflow. En ese archivo los datos se almacenan secuencialmente, se accede a ellos si se busca un dato y no se encuentra en la tabla de índices.
ventajas
inconvenientes
• Las mismas que los anteriores más la posibilidad de borrar registros (aunque se generan huecos)
• La reorganización del archivo principal es más rápida al tener que cambiar sólo los punteros del encadenamiento
• Requieren compactar los datos a menudo para reorganizar índices y quitar el fichero de desbordamiento.
Tipos de ficheros según su uso
• Permanentes. Quedan grabados de forma permanente en los sistemas de disco.
• Maestros. Ficheros que se cambian muy poco a menudo. Son los principales en los sistemas de información. Contienen los datos fundamentales.
• Constantes. Contienen información que apenas varía a lo largo del tiempo.
Tema 1. Gestión de Datos y Sistemas de Bases de Datos. Página 12 de 25
Sistemas Gestores de Bases de Datos 2º Administración de Sistemas Informáticos
• Históricos. Contienen los últimos cambios realizados sobre los datos. Después de un determinado tiempo esos cambios se llevan al fichero maestro.
• De movimiento. Almacenan cambios a realizar en los ficheros maestros. Se eliminan tras realizar esos cambios.
• De maniobra. Ficheros auxiliares utilizados por el software que gestiona los datos. Son destruidos en cuanto las aplicaciones finalizan.
4. Sistemas de Bases de Datos
Un Sistema de Bases de Datos es un sistema basado en ordenadores, cuyo propósito general es registrar y mantener datos mediante un sistema gestor de BD. Permite a los usuarios y aplicaciones la consulta y manipulación de estos datos - almacenados en bases de datos - usando un lenguaje de consulta estructurado: SQL (Structured Query Language).
Como se ha comentado anteriormente, cuando los datos de un sistema de información se almacenan en una única estructura, se llama base de datos. Se presentan a continuación dos definiciones:
Una base de datos es una colección de datos almacenados en un soporte informático permanente de forma que sea posible obtener la relación entre los datos a través de un esquema conceptual que oculte la física real de los datos.
Una base de datos es una colección de datos estructurados según un modelo que refleje las relaciones y restricciones existentes en el mundo real. Los datos, que han de ser compartidos por diferentes ususarios y aplicaciones, deben mantenerse independientes de ésta, y su definición y descripción han de ser únicas estando almacenados junto a los mismos. Por último, los tratamientos que sufran estos datos tendrán que conservar la integridad y seguridad de éstos.
El objetivo es que las aplicaciones puedan acceder a los datos sin necesidad de conocer exactamente cómo están almacenados los datos. Esto se consigue con un esquema conocido como esquema conceptual. Cualquier desarrollador que conozca ese esquema puede acceder a los datos desde cualquier aplicación.
Tema 1. Gestión de Datos y Sistemas de Bases de Datos. Página 13 de 25
Sistemas Gestores de Bases de Datos 2º Administración de Sistemas Informáticos
Componentes de un sistema de base de datos
Los elementos de un sistema de base de datos son los mismos que los de un sistema de información. Se comentan a continuación para concretar un poco más la información que ya poseíamos:
• Hardware. Máquinas en las que se almacenan las bases de datos. Se compone de los volúmenes de almacenamiento secundario (discos, cintas, ...) donde reside la BD, junto con los dispositivos asociados como unidad de control, tarjetas, memoria, ...
• Software. Es el sistema gestor de bases de datos, es decir, la aplicación que permite el manejo de la base de datos. Entre la BD física y los usuarios del sistema, existe un nivel de software que recibe el nombre de SGBD. Este maneja todas las solicitudes de acceso a la BD y registra y mantiene de forma controlada los datos almacenados. Asimismo pueden existir uno o varios programas para permitir elo acceso a las BD realizando consultas. Estas aplicaciones accederán a las BD usando el lenguaje de consultas SQL mediante los servicios ofrecidos por el SGBD.
• Datos. Incluyen los datos que se necesitan almacenar y los metadatos que son datos que sirven para describir lo que se almacena en la base de datos. Los datos almacenados en el sistema se dividen en una o más bases de datos. Una BD es integrada, ya que puede considerarse como una unificación de varios archivos de datos independientes, donde se eliminan cualquier redundancia entre los mismos. Una BD es compartida, en el sentido en que partes individuales de la BD pueden compartirse entre varios usuarios distintos, de tal forma que cada uno de ellos puede tener acceso a la misma parte de la BD. Hay que considerar que aunque dos usuarios compartan el mismo subconjunto de la BD, sus percepciones o vistas de ese conjunto pueden diferir mucho a nivel de detalle. La palabra “compartida” a menudo se amplia para abarcar no sólo al comportamiento entes descrito, sino también al acceso concurrente, es decir, la posibilidad de que varios usuarios accedan a la misma BD (tal vez incluso a la misma parte) al mismo tiempo. Un SBD que admite esta forma de acceso se llama Sistema de Usuarios Múltiples.
• Usuarios. Personas que manipulan los datos del sistema. Hay cuatro grupos de personas que intervienen en el entorno de una base de datos: el administrador de la base de datos, los diseñadores de la base de datos, los programadores de aplicaciones y los usuarios.
Tema 1. Gestión de Datos y Sistemas de Bases de Datos. Página 14 de 25
Sistemas Gestores de Bases de Datos 2º Administración de Sistemas Informáticos
• El administrador de la base de datos (ABD o DBA) se encarga del diseño físico de la base de datos y de su implementación, realiza el control de la seguridad y de la concurrencia, mantiene el sistema para que siempre se encuentre operativo y se encarga de que los usuarios y las aplicaciones obtengan buenas prestaciones. El administrador debe conocer muy bien el SGBD que se esté utilizando, así como el equipo informático sobre el que esté funcionando. El DBA, en resumen, autoriza el acceso a la BD, coordina y vigila su utilización, adquiere los recursos de software y hardware necesarios y es el responsable ante los problemas de violaciones de seguridad o respuesta lenta del sistema.
• Los analistas o diseñadores de la base de datos realizan el diseño lógico de la base de datos, debiendo identificar los datos, las relaciones entre datos y las restricciones sobre los datos y sus relaciones. El diseñador de la base de datos debe tener un profundo conocimiento de los datos de la empresa y también debe conocer sus reglas de negocio. Las reglas de negocio describen las características principales de los datos tal y como las ve la empresa. Para obtener un buen resultado, el diseñador de la base de datos debe implicar en el desarrollo del modelo de datos a todos los usuarios de la base de datos, tan pronto como sea posible. El diseño lógico de la base de datos es independiente del SGBD concreto que se vaya a utilizar, es independiente de los programas de aplicación, de los lenguajes de programación y de cualquier otra consideración física. El diseñador, en resumen, identifica los datos que se van a almacenar en la BD, elije las estructuras apropiadas, se comunica con los futuros usuarios de la BD con el fin de comprender sus necesidades y requerimientos.
• Una vez se ha diseñado e implementado la base de datos, los programadores de aplicaciones se encargan de implementar los programas de aplicación que servirán a los usuarios finales. Estos programas de aplicación son los que permiten consultar datos, insertarlos, actualizarlos y eliminarlos. Estos programas se escriben mediante lenguajes de tercera generación o de cuarta generación. El programador, en resumen, implementa las especificaciones realizadas por los analistas/diseñadores en forma de programas y luego prueba, depura, documenta y mantiene estas transacciones programadas, debiendo conocer a la perfección toda la gama de capacidades del SGBD.
Tema 1. Gestión de Datos y Sistemas de Bases de Datos. Página 15 de 25
Sistemas Gestores de Bases de Datos 2º Administración de Sistemas Informáticos
• Los usuarios finales son los clientes de la base de datos: la base de datos ha sido diseñada e implementada, y está siendo mantenida, para satisfacer sus requisitos en la gestión de su información. Podríamos separar en cuatro categorías a estos usuarios:
• Usuarios ocasionales. Acceden de vez en cuando a la BD, pero es posible que requieran información diferente en cada ocasión. Utilizan un lenguaje de consulta de BD avanzado para especificar sus solicitudes. Suelen ser gerentes de nivel medio o alto.
• Usuarios simples. Constituyen una porción apreciable de la totalidad de los usuarios finales. La función principal de su trabajo gira en torno a consultas y actualizaciones constantes de la BD, utilizando tipos estándar de consultas y actualizaciones, llamadas transacciones programadas. Por ejemplo, el cajero de un banco consultando saldos, el empleado de una compañía aérea revisando disponibilidad para una reserva, el trabajador de una oficina de correos introduciendo el código de barras de los paquetes enviados/recibidos, ...
• Usuarios avanzados. Ingenieros, científicos, analistas de negocios que están familiarizados con los recursos del SGBD.
• Usuarios autónomos. Mantienen BD personales mediante la utilización de paquetes de programas comerciales, que cuentan con interfaces de fácil uso, basados en menus o en gráficos. Un ejemplo es el usuario de un paquete fiscal que almacena diversos datos financieros personales para fines fiscales.
Hay que tener en cuenta que las necesidades de los usuarios son muy diferentes en función del tipo de usuario que sean: a los finales les interesa la facilidad de uso, a los desarrolladores la potencia y flexibilidad de los lenguajes incorporados del sistema de bases de datos y a los administradores herramientas de gestión avanzada para la base de datos.
Estructura de una base de datos
Las bases de datos están compuestas (como ya se han comentado), de datos y de metadatos. Los metadatos son datos (valga la redundancia) que sirven para especificar la estructura de la base de datos; por ejemplo qué tipo de Tema 1. Gestión de Datos y Sistemas de Bases de Datos. Página 16 de 25
Sistemas Gestores de Bases de Datos 2º Administración de Sistemas Informáticos
datos se almacenan (si son texto o números o fechas ...), qué nombre se le da a cada dato (nombre, apellidos,...), cómo están agrupados, cómo se relacionan,....
De este modo se producen dos visiones de la base de datos:
• Estructura lógica o conceptual. Indica la composición y distribución teórica de la base de datos. La estructura lógica sirve para que las aplicaciones puedan utilizar los elementos de la base de datos sin saber realmente cómo se están almacenando.
• Estructura física. Es la estructura de los datos tan cual se almacenan en las unidades de disco. La correspondencia entre la estructura lógica y la física se almacena en la base de datos (en los metadatos).
Niveles de descripción de datos
Tema 1. Gestión de Datos y Sistemas de Bases de Datos. Página 17 de 25
Sistemas Gestores de Bases de Datos 2º Administración de Sistemas Informáticos
5. Modelos de datos
Una de las características fundamentales de los sistemas de bases de datos es que proporcionan cierto nivel de abstracción de datos, al ocultar las características sobre el almacenamiento físico que la mayoría de usuarios no necesita conocer. Los modelos de datos son el instrumento principal para ofrecer dicha abstracción.
Un modelo de datos es un conjunto de conceptos que sirven para describir la estructura de una base de datos: los datos, las relaciones entre los datos y las restricciones que deben cumplirse sobre los datos.
Los modelos de datos contienen también un conjunto de operaciones básicas para la realización de consultas (lecturas) y actualizaciones de datos. Además, los modelos de datos más modernos incluyen conceptos para especificar comportamiento, permitiendo especificar un conjunto de operaciones definidas por el usuario.
Los modelos de datos se pueden clasificar dependiendo de los tipos de conceptos que ofrecen para describir la estructura de la base de datos. Los modelos de datos de alto nivel, o modelos conceptuales, disponen de conceptos muy cercanos al modo en que la mayoría de los usuarios percibe los datos, mientras que los modelos de datos de bajo nivel, o modelos físicos, proporcionan conceptos que describen los detalles de cómo se almacenan los datos en el ordenador. Los conceptos de los modelos físicos están dirigidos al personal informático, no a los usuarios finales. Entre estos dos extremos se encuentran los modelos lógicos, cuyos conceptos pueden ser entendidos por los usuarios finales, aunque no están demasiado alejados de la forma en que los datos se organizan físicamente. Los modelos lógicos ocultan algunos detalles de cómo se almacenan los datos, pero pueden implementarse de manera directa en un ordenador.
● Los modelos conceptuales utilizan conceptos como entidades, atributos y relaciones. Una entidad representa un objeto o concepto del mundo real como, por ejemplo, un jugador de un club deportivo. Un atributo representa alguna propiedad de interés de una entidad como, por ejemplo, el nombre o el salario del empleado. Una relación describe una interacción entre dos o más entidades, por ejemplo, la relación Tema 1. Gestión de Datos y Sistemas de Bases de Datos. Página 18 de 25
Sistemas Gestores de Bases de Datos 2º Administración de Sistemas Informáticos
“jugar en” entre un jugador y su club. Un ejemplo de representación del modelo conceptual sería el siguiente:
Diseño conceptual: modelo entidad-interrelación
● Cada SGBD soporta un modelo lógico, siendo los más comunes el relacional, el de red y el jerárquico. Estos modelos representan los datos valiéndose de estructuras de registros, por lo que también se denominan modelos orientados a registros. Hay una nueva familia de modelos lógicos, son los modelos orientados a objetos, que están más próximos a los modelos conceptuales.
Será el modelo relacional el que será caso de estudio durante este curso.
Las sigueintes figuras muestran tres modelos lógicos del mismo modelo conceptual.
Tema 1. Gestión de Datos y Sistemas de Bases de Datos. Página 19 de 25
Sistemas Gestores de Bases de Datos 2º Administración de Sistemas Informáticos
Modelo relacional
Modelo en red
Tema 1. Gestión de Datos y Sistemas de Bases de Datos. Página 20 de 25
Sistemas Gestores de Bases de Datos 2º Administración de Sistemas Informáticos
Modelo jerárquico
● Los modelos físicos describen cómo se almacenan los datos en el ordenador: el formato de los registros, la estructura de los ficheros (desordenados, ordenados, etc.) y los métodos de acceso utilizados (índices, etc.).
A la descripción de una base de datos mediante un modelo de datos se le denomina esquema de la base de datos. Este esquema se especifica durante el diseño, y no es de esperar que se modifique a menudo. Sin embargo, los datos que se almacenan en la base de datos pueden cambiar con mucha frecuencia: se insertan datos, se actualizan, etc. Los datos que la base de datos contiene en un determinado momento se denominan estado de la base de datos u ocurrencia de la base de datos.
La distinción entre el esquema y el estado de la base de datos es muy importante. Cuando definimos una nueva base de datos, sólo especificamos su esquema al SGBD. En ese momento, el estado de la base de datos es el “estado vacío", sin datos. Cuando se cargan datos por primera vez, la base datos pasa al “estado inicial". De ahí en adelante, siempre que se realice una operación de actualización de la base de datos, se tendrá un nuevo estado. El SGBD se encarga, en parte, de garantizar que todos los estados de la base de datos sean estados válidos que satisfagan la estructura y las restricciones especificadas en el esquema. Por lo tanto, es muy importante que el esquema que se especifique al SGBD sea correcto y se debe tener muchísimo cuidado al diseñarlo. El SGBD almacena el esquema en su catálogo o diccionario de datos, de modo que se pueda consultar siempre que sea necesario.
Tema 1. Gestión de Datos y Sistemas de Bases de Datos. Página 21 de 25
Sistemas Gestores de Bases de Datos 2º Administración de Sistemas Informáticos
6. Arquitectura de los sistemas de bases de datos
Hay tres características importantes inherentes a los sistemas de bases de datos: la separación entre los programas de aplicación y los datos, el manejo de múltiples vistas por parte de los usuarios y el uso de un catálogo para almacenar el esquema de la base de datos.
En 1975, el comité ANSI-SPARC (American National Standard Institute - Standards Planning and Requirements Committee) propuso una arquitectura de tres niveles para los sistemas de bases de datos, que resulta muy útil a la hora de conseguir estas tres características.
El objetivo de la arquitectura de tres niveles es el de separar los programas de aplicación de la base de datos física. En esta arquitectura, el esquema de una base de datos se define en tres niveles de abstracción distintos:
● En el nivel interno se describe la estructura física de la base de datos mediante un esquema interno. Este esquema se especifica mediante un modelo físico y describe todos los detalles para el almacenamiento de la base de datos, así como los métodos de acceso.
● En el nivel conceptual se describe la estructura de toda la base de datos para una comunidad de usuarios (todos los de una empresa u organización), mediante un esquema conceptual. Este esquema oculta los detalles de las estructuras de almacenamiento y se concentra en describir entidades, atributos, relaciones, operaciones de los usuarios y restricciones. En este nivel se puede utilizar un modelo conceptual o un modelo lógico para especificar el esquema.
● En el nivel externo se describen varios esquemas externos o vistas de usuario. Cada esquema externo describe la parte de la base de datos que interesa a un grupo de usuarios determinado y oculta a ese grupo el resto de la base de datos. En este nivel se puede utilizar un modelo conceptual o un modelo lógico para especificar los esquemas. Tema 1. Gestión de Datos y Sistemas de Bases de Datos. Página 22 de 25
Sistemas Gestores de Bases de Datos 2º Administración de Sistemas Informáticos
● La mayoría de los SGBD no distinguen del todo los tres niveles. Algunos incluyen detalles del nivel físico en el esquema conceptual. En casi todos los SGBD que se manejan vistas de usuario, los esquemas externos se especifican con el mismo modelo de datos que describe la información a nivel conceptual, aunque en algunos se pueden utilizar diferentes modelos de datos en los niveles conceptual y externo.
La arquitectura de tres niveles es útil para explicar el concepto de independencia de datos que podemos definir como la capacidad para Tema 1. Gestión de Datos y Sistemas de Bases de Datos. Página 23 de 25
Sistemas Gestores de Bases de Datos 2º Administración de Sistemas Informáticos
modificar el esquema en un nivel del sistema sin tener que modificar el esquema del nivel inmediato superior. Se pueden definir dos tipos de independencia de datos:
• La independencia lógica es la capacidad de modificar el esquema conceptual sin tener que alterar los esquemas externos ni los programas de aplicación. Se puede modificar el esquema conceptual para ampliar la base de datos o para reducirla. Si, por ejemplo, se reduce la base de datos eliminando una entidad, los esquemas externos que no se refieran a ella no deberán verse afectados.
• La independencia física es la capacidad de modificar el esquema interno sin tener que alterar el esquema conceptual (o los externos). Por ejemplo, puede ser necesario reorganizar ciertos ficheros físicos con el fin de mejorar el rendimiento de las operaciones de consulta o de actualización de datos. Dado que la independencia física se refiere sólo a la separación entre las aplicaciones y las estructuras físicas de almacenamiento, es más fácil de conseguir que la independencia lógica.
En los SGBD que tienen la arquitectura de varios niveles es necesario ampliar el catálogo o diccionario de datos, de modo que incluya información sobre cómo establecer la correspondencia entre las peticiones de los usuarios y los datos, entre los diversos niveles. El SGBD utiliza una serie de procedimientos adicionales para realizar estas correspondencias haciendo referencia a la información de correspondencia que se encuentra en el catálogo. La independencia de datos se consigue porque al modificarse el esquema en algún nivel, el esquema del nivel inmediato superior permanece sin cambios, sólo se modifica la correspondencia entre los dos niveles. No es preciso modificar los programas de aplicación que hacen referencia al esquema del nivel superior.
Por lo tanto, la arquitectura de tres niveles puede facilitar la obtención de la verdadera independencia de datos, tanto física como lógica. Sin embargo, los dos niveles de correspondencia implican un gasto extra durante la ejecución de una consulta o de un programa, lo cual reduce la eficiencia del SGBD. Es por esto que muy pocos SGBD han implementado esta arquitectura completa.
7. Estructuras operacionales
Actualmente casi todos los sistemas gestores de base de datos poseen también la idea operacional en la que se entiende que la base de datos se almacena en
Tema 1. Gestión de Datos y Sistemas de Bases de Datos. Página 24 de 25
Sistemas Gestores de Bases de Datos 2º Administración de Sistemas Informáticos
un servidor y hay una serie de clientes que pueden acceder a los datos del mismo. Las posibilidades son:
● Cliente-Servidor. Estructura clásica, la base de datos y su SGBD están en un servidor al cual acceden los clientes. El cliente posee software que permite al usuario enviar instrucciones al SGBD en el servidor y recibir los resultados de estas instrucciones. Para ello el software cliente y el servidor deben utilizar software de comunicaciones en red.
● Cliente Multi-servidor. Ocurre cuando los clientes acceden a datos situados en más de un servidor. También se conoce esta estructura como base de datos distribuida. El cliente no sabe si los datos están en uno o más servidores, ya que el resultado es el mismo independientemente de dónde se almacenan los datos. En esta estructura hay un servidor de aplicaciones que es el que recibe las peticiones y el encargado de traducirlas a los distintos servidores de datos para obtener los resultados.
● Cliente/Servidor Web/Servidor de datos, el cliente se conecta a un servidor mediante un navegador web y desde las páginas de este ejecuta las consultas. El servidor web traduce esta consulta al servidor (o servidores) de datos.


Si quereis mas comentar seguire subiendo temas de las bases de datos



Solo teneis que seguirme en

http://www.elblognono.blogspot.com