Facultad de Estadística e Informática
Manejadores de Bases de DatosBASES DE DATOS NO ESTRUCTURADAS - PARTE I
Facultad de Estadística e Informática
Bases de datos no estructuradasHistoria y definiciónAparecieron en los años 90 con el nombre “open-source
relational database” por Carlo Strozzi, no usaba SQL como lenguaje de consulta, sino que se accedía a través de scripts.
El término NoSQL surgió en el año 2009, ideado por el desarrollador Eric Evans.
Aunque el término no es oficial, responde a las bases de datos con las siguientes características:
Open-source, distributed, nonrelational databases
Facultad de Estadística e Informática
Bases de datos no estructuradasBases de datos NoSQL
Facultad de Estadística e Informática
Bases de datos no estructuradasCaracterísticas
No tienen Schemas.
No permiten JOIN’s.
No intentan garantizar ACID (Atomicidad, Consistencia, Aislamiento y Durabilidad).
Escalan horizontalmente.
Siguen el modelo BASE
Facultad de Estadística e Informática
Bases de datos no estructuradasCarácterísticas
Modelo BASEBasic Availability. El almacén funciona la mayoría del tiempo,
incluso ante fallos, gracias al almacenamiento distribuido y replicado.
Soft-state. Los almacenes pueden no ser consistentes en todo momento. (El programador puede verificar esta consistencia).
Eventual consistency. La consistencia es eventual.
Facultad de Estadística e Informática
Bases de datos no estructuradasCarácterísticas
Tienen una estructura distribuida, es decir, los mismos datos son guardados en distintos servidores (redundancia).
Sus estructuras de datos son sencillas (arreglos de datos o pares clave-valor)
Facultad de Estadística e Informática
Bases de datos no estructuradasBD relacionales vs BD no estructuradasLa principal diferencia radica en la manera de guardar los datos.
Las bases de datos no estructuradas o NoSQL (Not Only SQL) no almacenan tablas ni usan un lenguaje de consulta.
Los datos se almacenan ‘de un recibo’.
Facultad de Estadística e Informática
Bases de datos no estructuradasPorqué bases de datos no estructuradasLos sistemas Web y sistemas de información actuales pesentan
diferentes desafío a los sistemas tradicionales:Datos a gran escala.
Lectura y escritura con gran frecuencia.
Cambios en el esquema de datos con frecuencia.
Las aplicaciones sociales no necesitan el mismo nivel ACID.
Facultad de Estadística e Informática
Bases de datos no estructuradasPor qué bases de datos no estructuradasAlgunos de estos desafíos son:El costo para mantener el rendimiento de la base de datos
relacional es muy alto.
Se generan muchos datos temporales, por ejemplo, carritos de compra, personalización de portales.
El almacén de datos contiene mucho texto, imágenes, etc.
Facultad de Estadística e Informática
Bases de datos no estructuradas
¿Cómo se clasifican?
Facultad de Estadística e Informática
Bases de datos no estructuradasUn modelo de datos es un conjunto de conceptos que sirven para describir la estructura de una base de datos: los datos, las relaciones entre los datos y las restricciones que deben cumplirse sobre los datos.
“El modelo a través del cuál percibimos y manipulamos los datos”
Facultad de Estadística e Informática
Bases de datos no estructuradasModelos de datos de:Documentos.
Clave-valor.
Grafos.
Orientados a columnas.
Orientados a objetos.
Lenguaje de marcado de documentos:eXtensible Markup Language (XML)
Facultad de Estadística e Informática
Facultad de Estadística e Informática
Modelo de datos de Grafos
Facultad de Estadística e Informática
Modelo de datos de Clave-Valor
Facultad de Estadística e Informática
Modelo de datos de Columnas
Facultad de Estadística e Informática
Bases de datos No estructuradas – Parte IeXtensible Markup Language(XML)
Facultad de Estadística e Informática
eXtensible Markup Language (XML)Sus antecesores son:
GML (Generalized Markup Language)
Posteriormente SGML (Standard Generalized Markup Languge)
Facultad de Estadística e Informática
eXtensible Markup Language (XML)
XML eXtensible Markup Language, se convirtió en lenguaje estándar con la publicación XML 1.0 Recomendación W3C, 10 de febrero 1998.
https://www.w3.org/TR/1998/REC-xml-19980210
Facultad de Estadística e Informática
eXtensible Markup Language (XML)¿Qué es la W3c?World Wide Web Consortium.Es una comunidad internacional donde las organizaciones miembro y la comunidad, trabajan en conjunto para desarrollar estándares Web.
https://www.w3.org/Consortium/
Facultad de Estadística e Informática
eXtensible Markup Language (XML)
XML es un lenguaje para marcado de documentos.Al igual que SGML y HTML, se basa en el uso de marcas o etiquetas para diferenciar los elementos de un documento.
Facultad de Estadística e Informática
eXtensible Markup Language (XML)XML es un Lenguaje de Etiquetado Extensible muy simple, pero estricto.Fundamental en el intercambio de una gran variedad de datos. Su función principal es describir datos y no mostrarlos como es el caso de HTML. XML es un formato que permite la lectura de datos a través de diferentes aplicaciones.
Facultad de Estadística e Informática
eXtensible Markup Language (XML)
No utiliza etiquetas predefinidas (eXtensible).
Usado para estructurar, almacenar e intercambiar información.
Facultad de Estadística e Informática
Ejemplo documento XML
Facultad de Estadística e Informática
eXtensible Markup Language (XML)
Qué es un Documento bien formado
Facultad de Estadística e Informática
eXtensible Markup Language (XML)1. < + ‘etiqueta’ + >. Ejemplo: <nombre>.
2. Etiqueta de cierre. < + / +‘etiqueta’ + >. Ejemplo: </nombre>
3. No superponer o solapar etiquetas con otras.
4. No solapar elementos contenedores con elementos contenidos.
Facultad de Estadística e Informática
eXtensible Markup Language (XML)
catalogo item
duracion
genero
anio
nombre
fecha
responsable
Facultad de Estadística e Informática
Línea de Prólogo
Nodos
Elemento Raíz
Estructura en forma
de árbol
Facultad de Estadística e Informática
Visto desde el navegador Mozilla Firefox
Facultad de Estadística e Informática
eXtensible Markup Language (XML)
Ejercicio:
Elabora el archivo XML de acuerdo al siguiente árbol:
Facultad de Estadística e Informática
eXtensible Markup Language (XML)
bailes baile
nombre
precio
comienzo
fin
profesor
Facultad de Estadística e Informática
Manejadores de Bases de Datos
Gracias por su atención
Top Related