DevOps와 SRE의 다른 점

(2020년 1월)지금으로 부터 약 13년전 구글은 제품 생산 관리 방식을 바꾸기로 결졍한다. 개발팀은 새로운 기능을 만들어서 제품에 적용하는데 집중했지만 운영 그룹은 만들어진 제품을 안정적으로 유지하려고 노력했다. 두 조직의 이해가 상충했다. 이러한 긴장은 다른 경험, 기술 세트, 평가 기준의 차이로 발생했다.구글의 운영 책임자 중 한명인 Ben Trey...

SRE 적용

Cloud Native 환경에서 SRE를 적용해 보려 한다. 다양한 사례들을 수집하고, 수집한 내용들을 운용중인 AWS에 접목하기 위한 나의 고민들로 채워진다. SRE에 대한 이론적인 내용보다는 실질적인 내용을 주로 다룰 것이다. 아주 먼 옛날에 IT 회사는 개발과 운영이 서로 분리돼 있었다. 좀 더 들어가보면 개발, 운영, 설계, 기획, 마케팅 등이 전부...

SRE - Site Reliability Engineering

Site Reliability Engineering(이하 사이트 신뢰성 엔지니어링 혹은 SRE로 표기한다.)는 소프트웨어 엔지니어링 기술들을 인프라 및 운영에 적용하는 것을 의미한다. SRE 팀을 이끌고 있는 Google의 Ben Trenor에 따르면, SRE는 "소프트웨어 엔지니어가 이전에는 작업이라고 불렀던 일을 처리 할 때 어떤 일이 일어날지"에 대한...