ties

Publicación semestral • ISSN 2683-2968 • Abril 2021 • Número de revista 3 https://doi.org/10.22201/dgtic.26832968e.2021.3



Universidad de Guadalajara: un referente tecnológico en el uso y la aplicación de tecnología vanguardista para respaldos de información

  DOI: https://doi.org/10.22201/dgtic.26832968e.2021.3.1


 

1/6

Introducción


Aplicación de la Tecnología para el respaldo de datos

En un mundo cada vez más globalizado, en que las tecnologías superan las barreras físicas y las personas utilizan con mayor frecuencia dispositivos para realizar tareas como el almacenamiento de grandes cantidades de información, se vuelve fundamental contar con uno o más respaldos de ella [1].

El respaldo de información es la copia de los datos importantes de un dispositivo primario en uno o varios dispositivos secundarios, ello para que en caso de que el primer dispositivo sufra una avería electromecánica o un error en su estructura lógica, sea posible contar con la mayor parte de la información necesaria para continuar con las actividades rutinarias y evitar pérdida generalizada de datos [2].

La Universidad de Guadalajara está obligada a observar la Ley de información Pública del Estado de Jalisco y sus Municipios (LIPEJM), que en su artículo 24, apartado XV, señala como obligación: “Proteger la información pública en su poder contra acceso, utilización, sustracción, modificación, destrucción, eliminación no autorizados”. En el apartado XVII del mismo artículo, la Universidad se obliga a “Utilizar adecuada y responsablemente la información pública reservada y confidencial” [3].

Actualmente existen tres tipos de almacenamiento: el primero es el físico, cuya información es accesible y la posee el usuario sin necesidad de que haya red externa [8]; el segundo es el alojamiento en la nube, que permite que la información sea consultada desde cualquier lugar del mundo [9], y el tercero es el híbrido en la nube. Este último es utilizado en servicios privados, que implican las operaciones más críticas. Ejemplo de ello es el almacenamiento de información confidencial y los servicios públicos, cuando la privacidad no es necesaria, como al compartir documentos en red, entre otras aplicaciones [10].


2/6

Herramienta de respaldo VERITAS, almacenamiento físico


El cúmulo de información que genera la Universidad de Guadalajara a través de diversas plataformas digitales, ha crecido con el paso del tiempo. VERITAS NetBackup es la herramienta que operaba con anterioridad, misma que con los años se volvió obsoleta, debido al creciente uso de las TIC (Tecnologías de la Información y la Comunicación) y la incursión de la sociedad en el mundo informático. Es por ello que la Universidad de Guadalajara se vio obligada a investigar, comparar y adquirir una nueva solución tecnológica, que se denominaría EMC Data Domain, que garantiza el cumplimiento de los estándares de seguridad expuestos con anterioridad, lo que la convierte en vanguardista.

Problemas que denotó la herramienta VERITAS Netbackup

Veritas Netbackup ya presentaba carencias, como:

  • Ser una tecnología insuficiente para la cantidad de equipos e información que se almacenaba.
  • Tiempo prolongado al realizar el respaldo de los datos, ya que aproximadamente tardaba 8 horas en respaldar 920 gigabytes.
  • No existía documentación de procesos.
  • Las cintas se dañaban al momento de respaldar, debido a que se reciclaban y reutilizaban.
  • No existía documentación acerca del proceso de respaldo. Al no existir un orden, era latente la posibilidad de duplicar o borrar la información.

El equipo utilizaba una librería física modelo L700 de Sun Microsystem (Figura 1), con capacidad para albergar 330 cintas y 5 dispositivos de escritura. Primero se tenía que respaldar a disco local y posteriormente se enviaba a la librería [4]. La conectividad LAN era a 1gb, 6 interfaces de fibra de canal conectadas a la red de almacenamiento, capaz de tener comunicación a los espacios asignados en los 31 servidores críticos que se respaldaban.

tipos tic

Figura 1.  Esquema de la infraestructura veritas. [Consultado julio 18, 2020].

 


En el reporte estadístico (Tabla 1) se puede observar la cantidad de información a respaldar, la versión del sistema operativo, el crecimiento anual, el tiempo de retención, el tipo de respaldo y el tiempo para guardar los datos.

tipos tic

Tabla 1.  Información de esquema de respaldos. Fuente: elaboración propia.

 


La gráfica correspondiente a la figura 2, fue obtenida del software VERITAS Netbackup. En ella se observa la cantidad máxima de información almacenada, que fue de 180 terabytes.

tipos tic

Figura 2.  Gráfica de capacidad de almacenamiento. [Consultado julio 18, 2020].

 

3/6

Análisis FODA utilizado en la comparativa de tecnologías de respaldo EMC Data Domain vs HP StoreOnce

Debido a los cambios tecnológicos y la implementación de sistemas para dar solución a las constantes demandas de la transformación digital, la información se ha incrementado de manera exponencial. Para esta casa de estudios resulta imperante la actualización y la adquisición de nueva tecnología de respaldo, que permita responder a esos requerimientos de forma expedita y preventiva, además de dar cumplimiento a los acuerdos de nivel de servicio establecidos por la Institución y con ello mantenerse a la vanguardia en este tipo de soluciones. Es con este fin que se utilizó la matriz FODA (Fortalezas, Oportunidades, Debilidades y Amenazas), para recabar información tanto del entorno (externo) como de la propia Universidad (interno). Es así como se definieron las fortalezas y las oportunidades inherentes al tipo de área y al personal que la conforma (tabla 2). De igual forma, se identificaron las debilidades y las amenazas para evitar que la implementación del proyecto no fracasara.

tipos tic

Tabla 2.  Tabla 2. Análisis FODA. Fuente: elaboración propia.

 


Con base en el diagnóstico realizado, se procedió a elaborar una licitación, en la que participaron solo dos proveedores EMC y HP.

A continuación, se especifican las características de las dos soluciones.

SOLUCIÓN 1

HP StoreOnce 2900

  1. Ofrece escalabilidad de 2U de 15.5 a 31.5 terabytes de capacidad utilizable (24 a 48 terabytes en bruto), con velocidad de hasta 5.8 terabytes/h con HP StoreOnce Catalyst.
  2. Federated Catalyst permite a los almacenes Catalyst extender nodos, lo que implica la gestión de copias de seguridad y la optimización del sistema de almacenamiento disponible en entornos más grandes.
  3. Catalyst sobre FC proporciona todo el control de los proveedores del servicio de Internet y los beneficios de deduplicación de StoreOnce Catalyst, su estructura Fiber Channel [5].

SOLUCIÓN 2

EMC Data Domain DD640

  1. Es el modelo de introducción de la serie DD600, especializada en soluciones de archivo, respaldo y recuperación.
  2. Capaz de albergar más de 400 petabytes de datos a una tasa de rendimiento de más de 5 terabytes por hora a tasas agregadas.
  3. Ayuda a reducir el tamaño del almacenamiento central entre 10 y 30 veces.
  4. Asegura la calidad de los datos y la partición adecuada, todo dentro de una sola unidad.
  5. Green-amigable para las empresas con conciencia ambiental.
  6. Priorización de almacenamiento para una mejor gestión [6].

tipos tic

Tabla 3.  Comparativa de infraestructura de almacenamiento. Fuente: elaboración propia.

 


Con base en la tabla 3, “Comparativa de infraestructura de almacenamientos”, se visualiza que los parámetros de la solución HP StoreOnce 2900 son menores en desempeño de escritura máxima, expansión, Opciones de I/O y no cumple en conectividad externa de almacenamiento, por lo que la Institución optó por la solución EMC Data Domain DD640.

Características de EMC Data Domain

El sistema de respaldo EMC Data Domain ostenta un almacenamiento físico de 70 terabytes, lo que permite acumular lógicamente más de 1.5 petabytes. Esto es posible debido a que cuenta con tecnología de deduplicación de datos en línea, es decir, que los datos son deduplicados antes de ser almacenados en el disco físico del sistema. Los tipos de respaldos que se manejan son completos (full), diferencial e incremental.

Este software permite realizar verificaciones automáticas de los datos respaldados, para garantizar la integridad de los mismos al momento de las restauraciones. Además, posee una funcionalidad para el envío de alertas a través del correo electrónico. Se debe contar con una alternativa de respaldo en cinta, el cual es utilizado para almacenar la información histórica, que por ley es necesario resguardarla por 10 años [4] [7].

Beneficios del sistema de respaldo EMC Data Domain vs VERITAS Netbackup

Las mejoras otorgadas por la solución de respaldo EMC Data Domain, en comparación con VERITAS Netbackup, superaron y duplicaron los tiempos de respuesta en procesamiento y conectividad.

A continuación, se anexa la tabla 4, en la cual se comparan ambas tecnologías.

tipos tic

Tabla 4.  Comparativa de soluciones de respaldo. Fuente: elaboración propia.

 


En la figura 3 se graficaron los niveles de almacenamiento de la herramienta EMC Data Domain.

tipos tic

Figura 3.  Gráfica de almacenamiento actual. [Consultado julio 18, 2020].

 


4/6

Acciones implementadas por la Universidad de Guadalajara para garantizar la seguridad y disponibilidad de la información

Para garantizar la seguridad y la disponibilidad de la información en la Universidad de Guadalajara, se pusieron en marcha las siguientes acciones:

  • Acceso a servidores de información solo a través de IP o nombre de dominio.
  • Limitar roles y responsabilidades, es decir, que sólo personal autorizado administre la información.
  • Contar con un firewall habilitado y llevar un control del tipo de privilegio que se le otorga al usuario final.
  • Manejo de administración de usuarios autorizados.
  • Bloqueo de las IP a nivel host [7].

En el diagrama contenido en la figura 4 se visualiza el esquema de la infraestructura actual:

tipos tic

Figura 4.  Diagrama de respaldo actual. [Consultado julio 18, 2020].

 

Procedimiento de solicitud de respaldos y recuperación de datos definidos al interior de la Coordinación de Operaciones

Para dar continuidad a la operación de servicios y cumplir con los niveles de seguridad, los altos mandos definieron los procesos y lineamientos aplicados en la Coordinación de Operaciones y con ello ofrecer una mejor calidad de servicio. La puesta en producción del sistema de respaldo EMC Data Domain, evolucionó los tiempos de conectividad y respuesta en un 100%, debido a la conexión a los equipos y canales dedicados para este fin.


Políticas de operación

  • El medio oficial para recibir solicitudes de respaldo y recuperación de información, es el Service Desk (mesa de servicio).
  • Es responsabilidad del cliente proporcionar en su solicitud la información necesaria para respaldar o recuperar datos.
  • Si al analizar los recursos de almacenamiento disponibles no es posible cubrir la petición, ésta se cancelará o se pospondrá hasta reunir los requerimientos y se notificará al cliente.
  • Los dispositivos de almacenamiento son de uso exclusivo para albergar la información crítica de la Institución. Esta política es definida por la Coordinación de Operaciones con el cliente y queda prohibido su uso para otras actividades que no contribuyan a este propósito.

Es importante señalar que solo se respaldan equipos productivos y se ejecuta el proceso cuando la actividad de éstos es menor y el tráfico de la red es mínimo. El objetivo principal es garantizar la operación óptima del servicio, en cuanto a respaldo de información se refiere.


Flujo de actividades


tipos tic

Figura 5.  Procedimiento de solicitud de respaldo o recuperación de datos. [Consultado julio 18, 2020].

 

Formato de solicitud de respaldos de información


tipos tic

Figura 6.  Formato de solicitud de respaldo de información. [Consultado julio 18, 2020].>

 

Tendencias

El 77% de los usuarios ha perdido información por no realizar respaldos, por lo que difundir este tema a través de las redes sociales o plataformas digitales, contribuiría a disminuir en gran medida esta cifra. Es importante mencionar que las copias de seguridad deben ser guardadas en un lugar distinto al equipo de donde provienen los datos [11]. Las soluciones de respaldo en la nube están cambiando la falta de dinamismo y dispersión, con que se habían percibido tradicionalmente los sistemas de respaldo de almacenamiento físico sobre demanda. El respaldo en la nube se está convirtiendo en un nuevo modo de solucionar las necesidades y los desafíos que presenta el respaldo de todo tipo de información (tanto la data actual como la más antigua). Incluso va más allá, porque aporta soluciones que agregan agilidad, economía y flexibilidad a las antiguas operaciones basadas en disco o en cinta física. Son tecnologías cada vez más ágiles y eficientes [12].

5/6


Conclusiones

Actualmente la globalización tecnológica permite que diversas empresas ofrezcan servicios de respaldos locales, híbridos o en la nube. Lo destacable es crear conciencia para que disminuya el porcentaje de empresas que pierden su información por no contar con equipos especializados para este fin o por el desconocimiento de cómo, para qué o cuál es la importancia de realizar copias periódicas.

No se recomienda el uso de herramientas gratuitas, que proliferan en la red como apoyo para los respaldos, porque posiblemente no cuentan con un contrato de confidencialidad, lo que puede llevar al uso de la información con fines de explotación y venta. Asimismo, se sugiere incluir el día mundial del backup como fecha importante.

Es trascendental iniciar con paso firme, así como analizar y concientizar en el uso de herramientas para respaldar la información. Debemos cambiar la tendencia. Es mejor asegurar nuestra información en dispositivos ajenos a nuestra institución y acceder a ella en caso de un desastre no previsto o una eventualidad que lamentemos por no contar con una copia de seguridad. Esto se traduciría en afectaciones económicas, laborales, emocionales y personales. No obstante, es recomendable realizar respaldos de manera local, cuando, por políticas de la empresa, no sea posible que la información sea alojada en un sitio alterno (nube) o cuando la mayor parte de tus servicios críticos están alojados de forma nativa en alguna nube pública.

Es primordial la utilización de un sistema de gestión de respaldos, aunado a una infraestructura que cumpla y se adapte a las necesidades propias de una institución, para garantizar que la información está protegida.

A través de su personal altamente calificado, la Universidad de Guadalajara y la Coordinación General de Tecnologías, sugieren el modelo híbrido en la nube, por su adaptación a la constante demanda tecnológica, el ahorro en recursos, el manejo de datos sensibles a nivel local y la flexibilidad al contar con una mayor gama de opciones al momento de seleccionar qué servicio es mejor para cada necesidad, considerando que la solución sea compatible con el sector público o privado, los lineamientos con los que éstos cuentan e, incluso, el capital asignado para este rubro.

6/6

Bibliografía

[1] Welivesecurity, “31 de marzo: Día Mundial del Respaldo,” Welivesecurity by eset, marzo 31, 2012. [En línea]. Disponible en: https://www.welivesecurity.com/la-es/2012/03/31/31-marzo-dia-mundial-respaldo/ [Consultado en julio 17, 2020]

[2] Multicomp, “Respaldo de Información,” Multicomp, 1998-2020. [En línea]. Disponible en: https://multicomp.com.mx/seguridad-informatica/respaldo-de-informacion/ [Consultado en julio 11, 2020].

[3] Gobierno del Estado de Jalisco, Ley de Transparencia y Acceso a la Información Pública del Estado de Jalisco y sus Municipios. 2013. [En línea]. Disponible en: https://transparencia.info.jalisco.gob.mx/sites/default/files/Ley%20de%20Transparencia%20y%20Acceso%20a%20la%20Informaci%C3%B3n%20P%C3%BAblica%20del%20Estado%20de%20Jalisco%20y%20sus%20Municipios_15.pdf [Consultado en julio 17, 2020].

[4] Universidad de Guadalajara, “Evolución en respaldos de información,” Gaceta UdeG, febrero 04, 2019. [En línea]. Disponible en: http://www.gaceta.udg.mx/Evolucion-en-respaldos-de-informacion/ [Consultado en julio 12, 2020].

[5] Hewlett Packard Enterprise Centro de Soporte, “HP StoreOnce 2900 Backup - Overview,” Hewlett Packard Enterprise Centro de Soporte, febrero, 2015. [En línea]. Disponible en: https://support.hpe.com/hpesc/public/docDisplay?docId=emr_na-c04622672 [Consultado en julio 17, 2020].

[6] Dell EMC, “Data Domain Operating System 6.2 Guía de administración,” Dell EMC, diciembre, 2018. [En línea]. Disponible en: https://www.delltechnologies.com/es-mx/collaterals/unauth/technical-guides-support-information/products/data-protection/docu91804.pdf [Consultado en julio 17, 2020].

[7] Universidad de Guadalajara, “La importancia del respaldo de información,” Gaceta UdeG, septiembre 10, 2018. [En línea]. Disponible en: http://www.gaceta.udg.mx/La-importancia-del-respaldo-de-informacion/ [Consultado en julio 17, 2020].

[8] I. Aparicio, “¿Almacenamiento on-line o físico? Decisión de futuro,” Noticias 3D, agosto 19, 2010. [En línea]. Disponible en: https://www.noticias3d.com/articulo.asp?idarticulo=1315&pag=5 [Consultado en julio 18, 2020]

[9] OK Diario, “Pros y contras de guardar tus archivos en la nube,” OK Diario, enero 05, 2018. [En línea]. Disponible en: https://okdiario.com/tecnologia/guardar-archivos-nube-ventajas-desventajas-70643 [Consultado en julio 18, 2020].

[10] MEDIACLOUD, “Nube híbrida o cloud híbrida: Descubre cuáles son las ventajas de la,” MEDIACLOUD, 2018. [En línea]. Disponible en: https://blog.mdcloud.es/descubre-las-ventajas-la-nube-hibrida/ [Consultado en julio 18, 2020]

[11] Welivesecurity, “El 77% de los usuarios ha perdido información por no realizar respaldos,” Welivesecurity by eset, noviembre 09, 2012. [En línea]. Disponible en: https://www.welivesecurity.com/la-es/2012/11/09/77-usuarios-perdido-informacion-no-realizar-respaldos/ [Consultado en julio 18, 2020]

[12] ISC, “Cloud y Archivado de datos en la Nube: Últimas tendencias de backup,” ISC Ingeniería, Servicios y Comunicaciones S.A, mayo 30, 2018 [En línea]. Disponible en: https://www.isc.cl/cloud-y-archivado-de-datos-en-la-nube-ultimas-tendencias-de-backup/ [Consultado en julio 18, 2020]