Por Capacitación Dfacture hace 8 años

​BIG DATA: LA NUEVA FRONTERA

Creado el 30 Oct, 2015 por Ramón Flores.

En la actualidad, el rápido avance de las tecnologías ha traído como consecuencia, la necesidad de guardar más información de aún mayor volumen. Las redes sociales y la automatización de procesos, son unas de las causas principales de la cantidad exorbitante de información que manejamos hoy en día.

Uno de los ejemplos más influyentes se encuentra a disposición de una gran parte de la población del mundo: un Smartphone. Un Smartphone permite enviar mensajes a través de diversas aplicaciones (WhatsApp, BBM, Line, etc), permite la carga de todo tipo de información (imágenes, música, videos, etc) a sitios web, permite acceder a aplicaciones que se actualizan en tiempo real (Facebook, Twitter, portales de noticias). Dicho esto, si tomamos en consideración la gran cantidad de información que cada persona podría estar enviando, multipliquemos ese número por los 122 millones de habitantes que se encuentran en México, y a una aún mayor escala, por todos los habitantes del planeta. Es una cantidad titánica, ¿cierto? En el siguiente enlace https://pennystocks.la/internet-in-real-time/ se puede visualizar la cantidad de información y registros que guardan las páginas más importantes en tiempo real.

El presente artículo tiene como propósito introducir al lector en el concepto de Big Data y describir algunas características de los componentes principales que constituyen una solución de este tipo.

Pero ¿qué es Big Data y que tiene que ver con todo esto?, pues debido a que la cantidad de información crece de manera exponencial, diferentes empresas han estado desarrollando diversas tecnologías para guardar la información de tal manera que, su acceso y el resguardo de la misma sea más fácil de manejar. En pocas palabras, Big Data, hace posible que tengas siempre tu información de Facebook disponible y que no tarde en cargarse, o que puedas encontrar algún video en YouTube por muy antiguo que este sea.

El modelo de Big Data es muy eficiente, sin embargo, para el resguardo de la información se deben utilizar gestores de base de datos especiales que sean capaces de soportar toda esa carga. Antes de este “boom” de datos se utilizaban gestores Relacionales, ahora para Big uno de los gestores empleados más comunes son aquellos basados en modelos No Relacionales, los llamados NoSQL. Estos modelos, a diferencia de los relacionales, tienen ciertas desventajas y ventajas a comparación, la ventaja principal siendo el acceso a la información. Estos gestores se adaptan a lo que cada empresa busca en su crecimiento y manejo de Big Data, a continuación ejemplificamos algunos:

  • Orientados a documentos. Son aquellos que gestionan datos semi-estructurados, es decir, documentos. Estos datos son almacenados en algún formato estándar.
  • Ejemplos:
  • oMongoDB es probablemente la base de datos NoSQL más famosa del momento. Algunas compañías que actualmente utilizan MongoDB son Foursquare, eBay y DFacture.
  • oCouchDB es la base de datos orientada a documentos de Apache. Este sistema es utilizado por compañías como Credit Suisse y la BBC.
  • Orientados a columnas. Este tipo de bases de datos están pensadas para realizar consultas y agregaciones sobre grandes cantidades de datos. Funcionan de forma parecida a las bases de datos relacionales.

Ejemplos:

  • oCassandra, incluida en esta sección, aunque en realidad sigue un modelo híbrido entre orientada a columnas y clave-valor. Es utilizada por Facebook y Twitter (aunque dejaron de usarla para almacenar tweets).
  • oHBase, la cual está desarrollada en Java y mantenida por el Proyecto Hadoop de Apache, se utiliza para procesar grandes cantidades de datos. La utilizan Facebook, Twitter y Yahoo.
  • -En grafos. Basadas en la teoría de grafos utilizan nodos y aristas para representar los datos almacenados. Son muy útiles para guardar información en modelos con muchas relaciones, como redes y conexiones sociales.
  • Ejemplos:
  • oInfinite Graph, escrita en Java y C++ por la compañía Objectivity. Tiene dos modelos de licenciamiento: uno gratuito y otro de pago.
  • oNeo4j es un gestor de base de datos de código abierto, escrito en Java por la compañía Neo Technology. Utilizada por compañías como HP, Infojobs o Cisco.

En conclusión, estas nuevas tecnologías están en su pleno apogeo y es importante recalcar que, así como las tecnologías de la información avanzan, también las compañías deben avanzar incluyendo este tipo de tecnologías y no atrasarse, una empresa que se queda con tecnología obsoleta se le hará cada día más complicado actualizarse, es por eso que en DFacture siempre estamos a la vanguardia utilizando tecnologías como BigData y usando un gestor NoSQL, en este caso, MongoDB.

Artículo creado en:
Creado por Redes sociales hace 4 años

Riesgos graves para tu empresa con la nueva reforma fiscal 2020 de Lista Negra del SAT

​Ante los agresivos esquemas de fiscalización actuales y las más aún agresivas sanciones para empresas, socios o representantes que entran en vigor a partir de 2020, no se puede actuar con displi...

Creado por Capacitación hace 5 años

​¿Cuándo debes realizar un CFDI de nómina?

Según la ley tendrías que generar el CFDI de nómina en la fecha en la que se pague el salario; sin embargo, para facilitar el proceso puedes generarlo antes o después de realizar el pago. Si gener...

message