¿qué es un data warehouse?

23 08 2007

almacen

Para aquellos que les haya tocado la época en donde todas las consultas se resolvían con reportes o queries se acordarán de los problemas más comunes de aquellos tiempos.

  • Cientos de tablas de donde sacar la información ¿cuál era la buena?
  • El reporte solo se podía ejecutar por las noches o los fines de semana
  • 20 sistemas diferentes en diferentes lenguajes y diferentes bases de datos
  • la información estaba en 20 servidores distintos
  • varias versiones de la verdad
  • mil problemas más

Ahora cuando recuerdo las petición “necesito un reporte consolidado de las operaciones de la empresa” puedo entender mi stress.

Debo corregir el texto. Esos problemas no forman parte del pasado. Como consultor de BI me los encuentro cada día en cada una de las empresas que visito.

Alguien sugirió para resolver todos esos problemas relacionados con la consulta y análisis de información crear una base de datos que contuviera toda la información histórica de la compañía. De esta forma si necesitaba un dato, ese dato estaría ahí. En un solo lugar. En un solo sistema. En una sola marca de base de datos. En un solo lenguaje de consulta y con una sola verdad.

Regresando a la pregunta ¿qué es un data warehouse o bodega de información? Pues es eso, una base de datos o bodega e información que almacena los datos históricos de los diferentes sistemas en un solo lugar. Y sirve, están diseñado y está hecho para ser consultado y para analizar información. Todo esto de una manera fácil.

—¿base de datos histórica?¿ Entonces si levanto un respaldo de mi sistema en otro servidor es un data warehouse?

No se emocione Nerd. Si usted levanta el respaldo de los 5 años anteriores del sistema de facturación en otro servidor eso NO es un datawarehouse.

Así como en las bodegas tradicionales se utilizan tarimas de varios niveles, carritos y grúas para acomodar grandes cantidades de artículos, en un data warehouse las tablas que almacenan información se diseñan de una manera especial pensando en que almacenarán cantidades gigantescas de información.

Esas maneras especiales o modelos son el copo de nieve y estrella. Cada uno tiene sus ventajas y desventajas.

He visto data warehouses diseñados como si fueran el sistema de facturación o el de producción. Desde mi punto de vista son inservibles todos ellos. Hay un excelente documento llamado Drawing the line between Dimensional Modeling and ER Modeling Techiques by Ralph Kimball que pinta la línea perfectamente.

¿y los cubos? Eso es punto y aparte. No són la misma cosa, se complementan y a menudo se traslapan. He estado en empresas con data warehouses explotados con SQL y Excel, sin cubos. Lo platicamos después.

Otro punto que debe de considerar es que la información que contiene por lo general debe estar trasformada y limpia ( usted no tiene una columna total_documentos; en el DWH tiene métricas que se llaman Ventas, Ventas en dólares, Devoluciones, mermas, etc.).

Todavía hay más cosas como los agregados, pero creo que con todo lo anterior queda un poco más claro qué es un data warehouse.

Technorati tags:
About these ads

Acciones

Información

23 respuestas

25 08 2007
Alexander

Quisiera saber donde consigo el software Artus para desarrollar Cubos, ó es un producto solo y exclusivo de BITAM?
Saludos.,

27 08 2007
Adrian

Hola Alexander

BITAM es la empresa fabricante del Software.

Con todo gusto te puedo ayudar ¿pudieras decirme en qué país estás?

así sería más fácil conseguir un teléfono o dirección que pudieras contactar.

saludos

10 09 2007
Alexander

Soy de Venezuela, gracias por la información si me la puedes referir.

12 09 2007
Adrian

Hola Alexander,

te envié los datos a tu correo.

Saludos

30 10 2007
Adela Garcìa

quisiera saber que tan complicado puede ser realizar BI con herramientas solo de SQL server 2005, “mineria de datos”.

30 10 2007
Adrian

Todo es posible en esta vida, SQLSErver 2005 es un excelente motor con muy buenas herramientas.

En mi opinión creo que necesictas complementar ese motor y esas herramientas con un buén frente. Si estamos hablando de mucho analisis, con mas razón lo requieres.

Saludos

16 04 2008
Federico Gonzalez

Hola, tengo qeu hacer un tp para la facultad de Datawarehouse, puedo tomar info de tu blog? me podrias recomendar algun sitio bueno donde expliquen un poco que es y para que se usa? muchas gracias

16 04 2008
Adrian

Hola Federico,

con todo gusto. Sientete libre de incluir en tu trabajo el material que aquí encuentres. No olvides mencionarnos :D

un sitio buenisimo que te recoemdaria:

http://www.tdwi.org/

saludos !

3 05 2008
carlos eduardo

buenas se mira interesante este blog necesitaba ayuda ya qe en mi clase de sistema de informacion me mandaron a investigat acerca de data warehouse con implementacion de cubo de datos en excel. pero hay algo qe no entiendo por qe dijo que ocupariamos excel a y otra cosita tendria que trabajar en el S.O linux si alguien me podria explicar le agradeceria mucho por qe no entiendo casi nda acerca de eso ehh estado leyendo pero solo cosas acerca de data ware house. solamente eso gracias si alguien me podria introducir en esto me ayudaria mucho de verdad ya qe este lunes tengo la defensa

5 05 2008
Adrian

Hola Carlos,

lo que pasa es que excel es uno de los clientes más socorridos para consultar la información del DWH. Pero nada que no puedas hacer con open office.

Entonces, no requieres excel para hacer el datawarehouse. Me explico?

saludos

18 05 2008
Orlando

Hola felicitaciones por este interesante blog estoy realizando un DW para mi Universidad en el momento estoy diseñando el modelo estrella pero no estoy seguro en implementarla con oracle o sql server, cual me recomendarias?

19 05 2008
Adrian

Hola Orlando,

Mil gracias por tus comentarios. Todo depende, en mi opinión Oracle es muy poderoso, SQLServer se me hace muy práctico.

Otra pregunta importante es ¿con que planeas explotar la información? Si es con productos de Microsoft te conviene Microsoft, si no es así me iria por ORacle.

Saludos
Adrian

29 06 2008
Dave

hola estoy desarrollando un datawarehouse para un trabajo e n la Universidad, ya tengo desarrollado mis estrellas el paso siguiente es crear los cubo que herramienta me recomientas lo mismo para los reportes

30 06 2008
Adrian

hola Dave,

te sugiero usar Artus. Puedes contactar a alguien de ventas usando la página de bitam.

http://www.bitam.com

saludos

25 07 2008
Elard

hola quisiera saber que softwares libres puedo utilizar para un data warehouse… gracias por la respuesta..

20 05 2010
Carlos

hola adrian no se si puedas ayurdarme con esta duda…
en la empresa me han pedido que hague un sistema de estadistica para diferentes areas en este caso estoy empezando hacer un datamart con la de recursos humanos no se si puedas ejemplos de diagramas multidimensionales para ese tema ya q no encuentro muxo de eso…o los datawarehouse no se aplican para este tipo de trabajo de dar cuadros y graficos estadisticos.???..

21 05 2010
Susana

Hola, saludos!. no se si me puedas ayudar, si si te lo agradeceria muchisimo, en mi escuela tengo que entregar un data warehouse, y la verdad no tengo ni idea de como hacerlo puesto que este profesor no me enseña nada, pero si nos pide las cosas, si me podrías compartir un ejemplo aunque sea de lo más simple, plis.

12 10 2011
Pamela

Hola,

Soy reclutadora y actualmente tengo vacantes en Guadalajara para personas con 2 años de experiencia o más utilizando Informatica power center.
Si están interesados, por favor envíen un correo a pamela.grey@tcs.com

¡Saludos!

12 01 2012
Naldo

Hola.

¿Cuál es la diferencia entre “cubo de datos en Excel” y “Tablas dinámicas”?

Sí hay alguna diferencia, me podrías hacer el favor de enviarme a mi correo algún tutorial para hacer Cubos de Datos en Excel 2007.

Gracias.

23 01 2012
Adrian

Hola Naldo,

para propositos prácticos pudieras decir que el cubo de datos es el almacen de la información y las tablas dinamicas es la visualizacion o cliente.

Saludos

27 02 2012
Gabriela

Hola Adrian, como puedo justificar tecnicamente que la cantidad de cubos en un DWH depende de la etapa de diseño y de los requerimientos que se presente por parte de los usuarios.

2 03 2012
Leonardo Campos

Excelente informacion,

Bastante util sencilla y clara como la necesita un ingeniero (camino a ser…)

Muchas gracias

11 04 2012
caro

muchas gracias por la ayuda pero no me queda claro como lo adquiero?

Deja un comentario

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión / Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión / Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión / Cambiar )

Conectando a %s




Seguir

Recibe cada nueva publicación en tu buzón de correo electrónico.

Únete a otros 29 seguidores