22 de Junio- Big Data

Visualización

Es el proceso de mostrar datos o información en diagramas gráficos, cifras y barras. Es un medio para presentar informes visuales a los usuarios sobre el rendimiento, las operaciones o las estadísticas generales de una aplicación, red, hardware o prácticamente cualquier recurso de TI.

La visualización de datos generalmente se logra extrayendo datos del sistema de TI subyacente. Estos datos son generalmente en forma de números, estadísticas y actividad general. Los datos se procesan utilizando un software de visualización de datos y se muestran en el tablero del sistema.

Por lo general, se realiza para ayudar a los administradores de TI a obtener información rápida, visual y fácil de entender sobre el rendimiento del sistema subyacente. La mayoría de las aplicaciones de supervisión del rendimiento de TI utilizan técnicas de visualización de datos para proporcionar información estadística sobre el rendimiento del sistema supervisado.

Se necesita la capacidad de representar los datos en tablas, gráficos y diagramas. Igual que una imagen vale más que mil palabras, una visualización vale más que mil puntos de datos. La visualización correcta le ayudará a obtener una mejor comprensión en un tiempo mucho menor. Antes de optar por crear un gráfico, debe decidir lo que desea mostrar o transmitir. Los gráficos transmiten uno de los siguientes tipos de información: Indicadores clave de rendimiento (KPI), relaciones, comparaciones, distribuciones y composiciones.

Indicadores clave de rendimiento: Suele ser un único valor relacionado con un área o función en particular y es un reflejo de sus resultados en esa área o función.
Relaciones: Intenta establecer o probar si existe una relación entre 2 o más variables.
Comparaciones: rata de mostrar o examinar cómo cambian las diferentes variables a lo largo del tiempo o proporcionar una instantánea estática de la comparación de diferentes variables.
Distribuciones: Trata de mostrar cómo se distribuyen los datos a intervalos determinados
Composiciones: Cuando quiere resaltar los distintos elementos que conforman sus datos, es decir, su composición.

Streaming

El streaming de datos es el proceso de transferir un stream de datos desde un lugar a otro, del remitente al destinatario o a través de alguna trayectoria de red, se aplica en múltiples formas con varios protocolos y herramientas que ayudan a proporcionar seguridad, entrega eficaz y otros resultados de datos. Los datos de streaming son datos generados de forma continua por miles de orígenes de datos, que suelen enviar registros de datos de manera simultánea y en tamaños pequeños (del orden de kilobytes).

Incluyen una amplia variedad de datos, como los archivos de registro generados por los clientes usando sus aplicaciones web o móviles, compras de e-commerce, actividad de jugadores en partidas, información de redes sociales, parqués de los mercados de valores o servicios geoespaciales.

Comparación entre procesamiento por lotes y procesamiento de streaming

El procesamiento por lotes se puede utilizar para procesar las consultas arbitrarias en diferentes conjuntos de datos. Por lo general, se procesan los resultados que provienen de todos los datos que abarca y permite el análisis profundo de conjuntos de Big Data.

En cambio, el procesamiento de streaming requiere la ingesta de una secuencia de datos y actualizar incrementalmente las métricas, los informes y las estadísticas de resumen en respuesta a cada registro de datos que llega.

Buscar este blog

Bitácora de Estadía (Moreno Reyes Luis Adrian)