visitas
1481
votos
8
votos++Votar positivamente esta entrada :)
+34
votos--Votar negativamente esta entrada :(
-26
Data Warehouses y minería de datos para predecir el futuro
La mayoría de empresas, al menos las que son competitivas, tienen sistemas informáticos de bases de datos relacionales para mantener actualizado el trasiego diario de información. Las bases de datos multidimensionales son distintas a las relacionales, ya que guardan información histórica. Veámoslo más fácilmente con un ejemplo: la compra y devolución de un producto en una tienda dejaría intacta la cantidad de stock del producto en la base de datos relacional, sin embargo, en la base datos multidimensional, tendríamos como ha evolucionado el stock a lo largo del tiempo, registrándose la salida y reentrada del producto. Así que los almacenes de datos manejan información histórica y las bases de datos relacionales permiten que la empresa pueda hacer su trabajo diario.
Los almacenes de datos suelen necesitar varios cientos de GB para almacenar toda esa información. Su diseño es muy diferente al de las bases de datos relacionales, ya que con este cambio de diseño ahorramos mucho tiempo a la hora de consultar todos esos GB de datos. La información la obtienen de las bases de datos relacionales, utilizando los llamados procesos ETL (extracción, transformación y carga), que son lanzados automáticamente a altas horas de la madrugada cuando se supone que nadie esta usando la base datos.
Mediante herramientas OLAP se hacen consultas al almacén de datos para extraer resultados que, además, después pueden tratarse con algoritmos de inteligencia artificial y técnicas estadísticas para obtener nueva información y hacer predicciones. De esta manera podemos plantear preguntas como por ejemplo: ¿qué tipo de cliente compra este producto?, ¿qué productos se venden más junto a otros y cuales son?, ¿qué descuento hay que aplicar para obtener el máximo beneficio con las ventas?, ¿cual es la tendencia de las ventas según la época del año y el tipo de producto?, etc.
De esta manera podemos encontrar extrañas relaciones que nunca hubiésemos imaginado, como por ejemplo que los que compran pañales en los supermercados suelen comprar también cervezas, por eso lo normal es que coloquen estratégicamente estos dos productos juntos.
Con toda seguridad estas herramientas también las usan Facebook, Google, Hotmail y otras, para crear perfiles de nuestra personalidad, con el fin de dirigirnos campañas de anuncios a medida. De hecho algunas herramientas de minería de datos usan como fuente de información blogs y redes sociales como Twitter, Facebook, LinkedIn, etc.
Al final las empresas terminarán sabiendo más de nosotros que nosotros mismos.
Entradas relacionadas:
¿Por qué una base de datos no puede ser diseñada por cualquiera?