Nuestra descripción del puesto de incluye responsabilidades, deberes, habilidades, educación, calificaciones y experiencia.
Acerca del rol de
Un Ingeniero de Confiabilidad del Sitio (SRE) es responsable de garantizar la estabilidad y disponibilidad de los sistemas de software mediante la gestión y monitoreo de los sistemas de producción. Los SRE utilizan una combinación de habilidades de ingeniería de software y administración de sistemas para desarrollar e implementar soluciones automatizadas para el mantenimiento del sistema y el software, la monitorización del rendimiento y la respuesta a incidentes. También se aseguran de que los sistemas funcionen de manera óptima y responden a cualquier problema que surja.
Propósito del Rol
El propósito de un Ingeniero de Confiabilidad del Sitio (SRE) es garantizar la confiabilidad, escalabilidad y mantenibilidad de los productos y servicios de una empresa. Los SRE son responsables del diseño, desarrollo y mantenimiento de sistemas y procesos técnicos que aseguran un alto nivel de disponibilidad, rendimiento y escalabilidad del servicio. Trabajan estrechamente con los desarrolladores para comprender sus necesidades y desarrollar soluciones para mejorar la confiabilidad y mantenibilidad de sus productos y servicios. Utilizan herramientas de monitoreo y análisis para identificar posibles problemas y abordarlos de manera proactiva antes de que afecten a los clientes. Los SRE también colaboran con los equipos de operaciones para garantizar que los procesos sean eficientes y automatizados.
Resumen de
El Ingeniero de Confiabilidad del Sitio (SRE) es responsable de garantizar el rendimiento, disponibilidad y confiabilidad de los sitios web y aplicaciones web de la empresa. El SRE trabajará con desarrolladores, administradores de sistemas y otras partes interesadas para desarrollar e implementar estrategias para mejorar la escalabilidad, rendimiento y confiabilidad de los sitios web y aplicaciones web de la empresa. El SRE será responsable de monitorear el rendimiento del sistema y responder a problemas de manera oportuna, así como de solucionar problemas del sistema. El SRE también debe poder trabajar y comprender tanto la infraestructura como el software para garantizar el funcionamiento exitoso de todos los servicios web. Además, el SRE será responsable de crear y documentar procedimientos y mejores prácticas para el mantenimiento y actualizaciones del sistema.
Deberes de
- Diseñar, desarrollar y mantener la infraestructura para servicios altamente disponibles y seguros
- Desarrollar y mantener la automatización para el despliegue, monitoreo y escalado de servicios
- Garantizar la disponibilidad, escalabilidad y rendimiento de los servicios
- Analizar y resolver problemas del sistema y de la aplicación
- Monitorear sistemas para planificación de capacidad y rendimiento
- Desarrollar, revisar y mejorar políticas, procedimientos y herramientas de seguridad del sistema
- Proporcionar asistencia técnica a desarrolladores de software y administradores de sistemas
Habilidades de
- Administración de Linux
- Computación en la nube
- Protocolos de redes
- Lenguajes de scripting
- Depuración de software
- Gestión de bases de datos
Requisitos de
- Título en Ciencias de la Computación, Ingeniería en Computación o Ingeniería Eléctrica
- Conocimiento sólido de redes de computadoras y administración de sistemas
- Experiencia con desarrollo de software y lenguajes de scripting como Python, Ruby y Bash
- Experiencia con tecnologías de virtualización como Docker y Kubernetes
- Familiaridad con servicios en la nube como Amazon Web Services, Microsoft Azure y Google Cloud Platform
- Experiencia con bases de datos como MySQL, PostgreSQL, MongoDB y Redis
- Excelentes habilidades para resolver problemas y comunicarse
Rasgos Personales
- colaborativo
- analítico
- resolución de problemas
- motivado