engineering/ITSM / ITIL2006. 9. 27. 14:27

[Tech Report - ITSM과 ITIL ②]

서비스 관리의 표준 프로세스

ITIL에 근거한 서비스 서포트와 딜리버리


지난 호에서는 ITIL과 ITSM의 개념과 필요성에 대해 알아보았다. 이번 호에서는 ITIL에서 정의하는 두 영역, 즉 서비스 서포트(Service Support)와 서비스 딜리버리(Service Delivery)에 대한 각각의 프로세스와 그 기능에 대해서 살펴보도록 한다.

장인석/ 한국HP 교육사업부 대리 in-suk.jang@hp.com

1. IT 서비스를 위한 ITSM과 ITIL (2003년 9월호)

2. ITIL에 근거한 Service Support와 Service Delivery(이번 호)



서비스 서포트
서비스 서포트(Service Support)는 고객이 비즈니스에 필요한 IT 서비스를 제공하기 위한 프로세스들이다. 이 영역에서는 서비스 레벨 매니지먼트(SLA)에 정의된 서비스 품질을 보장하도록 IT 서비스를 운영하는 절차들에 대해 기술하고 있으며, IT 인프라에 대한 관리와 가용성 보장을 위한 장애 처리 절차, 서비스 데스크에 대한 내용들을 포함하고 있다.

1. Configuration Management
구성관리는 IT 서비스관리 프레임워크의 근간을 형성하며 서비스 서포트 프로세스, 서비스 딜리버 프로세스와 밀접히 관계되어 있다.
구성관리 프로세스에서 담당하는 일들은 다음과 같다.
·Configuration Management
·Planning
·Identification
·Control
·Status Accounting
·Verification & Audit

구성관리는 IT 인프라와 IT 서비스를 구성하고 있는 다양한 종류와 다양한 버전의 구성요소(Configuration Item: CI)를 식별하고 이것들을 데이터베이스화(Configuration Management Data Base: CMDB)하여 관리하는 것을 의미한다. CI는 각종 애플리케이션, 드라이버 등의 소프트웨어와 컴퓨터, 네트워크 장비, 그 부속품 등의 하드웨어들이 될 수 있으며, CI의 범위와 상세 수준은 IT 조직의 규모와 환경에 맞게 설정할 수 있다.
또한 구성관리는 다음과 같은 기능들을 제공해야 한다.
·IT 서비스 관리와 지원 조직에 현재 IT자원의 상세한 구성 정보와 그것들의 물리적, 기능적 정보를 제공
·IT 인프라의 구성요소에 대한 현재 상태와 과거 이력을 기록
·IT 서비스와 구성요소에 대한 관계를 설정하여 구성요소가 서비스에 미치는 영향을 파악
·다른 모든 프로세스에 대한 IT의 기본 정보를 제공

2. 서비스 데스크(Service Desk)
서비스 데스크는 고객, 사용자, IT 조직과 기타 지원 조직 간의 최일선 접점 역할을 하는 중요한 기능 조직이다. 서비스 데스크는 IT 서비스가 이상 없이 운영되는지 관리하며 장애의 최초 접수에서부터 최종 장애가 해결될 때까지 관계되는 다른 모든 프로세스와 긴밀히 정보를 주고받으며 단일 접점(Single Point of Contact : SPOC)의 역할을 수행한다. 또한 장애가 발생하였을 때 비즈니스에 충격을 최소화하도록 사고의 신속한 복구를 가능하게 해야 한다.
이러한 기능들로 인해 고객 만족에 있어 가장 중요한 역할을 하는 조직이 서비스 데스크이다.
서비스 데스크는 다음과 같은 일들을 책임진다.
·서비스 콜의 접수, 등록, 우선 순위화, 이력관리
·등록된 콜에 대한 처리 상태 감시
·장애 처리에 대한 일선 지원 역할 담당 및 2선, 3선 조직의 역할 할당
·장애처리의 종결

3. Incident Management
장애관리 프로세스는 가능한 SLA를 위반하지 않도록 최대한 빨리, 그리고 비즈니스에 영향을 최소로 하여 장애를 해결하는 것이다. 이것은 장애의 근본 원인을 해결하는 것을 의미하지는 않고 비즈니스의 연속성을 유지하도록 IT 서비스의 중단을 해결하는 것이다. 서비스 데스크로부터 통보받은 서비스의 장애를 분석하여 장애를 없애는 것이 목적이며 장애의 근본 원인 해결은 다음에 나오는 Problem Management 프로세스에서 담당한다.
일반적인 장애관리 절차는 다음과 같다.
·Incident Detection and Recording
·Classification of All Incidents and Initial Support
·Investigation and Diagnosis
·Resolution and Recovery
·Incident Closure
장애의 최초 접수는 서비스 데스크에서 하며 SLA를 고려하여 장애의 비즈니스에 대한 충격(Impact)과 긴급성(Urgency)을 기준으로 장애의 우선 순위를 결정한다. 장애에 대한 최초 해결은 일단 서비스 데스크에서 담당하며 해결이 불가능할 경우 장애관리 프로세스로 통보한다.
장애관리에서는 통보 받은 장애에 대한 범주를 식별하는 것(Categorization)이 첫 번째 임무이다. 그 후에 장애의 내용을 분석하여 이미 처리되었던 장애의 유형인지, 알려진 해결책 등이 있는지를 파악한다. 장애를 해결한 경우 이것은 서비스 데스크로 보고되고 서비스 데스크에서 최종 장애에 대한 종결을 담당한다.


4. Problem Management
문제관리 프로세스의 기본적인 목적은 장애관리와 마찬가지로 IT 인프라에서 발생한 비즈니스에 영향을 주는 다양한 문제들을 해결하는 데 있다. 또한 이 프로세스에서는 장애의 근본 원인을 해결함과 동시에 그러한 문제들이 재발되지 않도록 하여 IT 서비스의 가용성을 높이는 기능을 포함하고 있다.
장애관리 프로세스에서는 장애 서비스의 연속성에 초점을 맞추어 장애를 해결하고 장애에 대한 근본 원인의 해결과 장애예방을 위한 방법은 문제관리 프로세스에서 처리되어야 한다.
장애관리 프로세스로부터 발생한 각각의 문제는 먼저 분류되어 다음 해당 지원 조직에 할당되고, 지원 조직은 문제를 분석하여 근본적인 해결책을 찾아낸다. 또한 알려진 에러에 대해서는 데이터베이스를 만들어 나중에 장애관리 프로세스에서 활용하여 신속히 장애를 해결할 수 있도록 해야 하며 알려진 에러의 영구적인 해결을 위해 변경관리 프로세스로 변경요청(Request For Change : RFC)을 할 수 있다.

문제관리 프로세스의 일반적인 절차는 다음과 같다.
·Problem Identification and
Registration
·Classification
·Assigning Resources
·Investigation and Diagnosis
·Establish Known Error



5. Change Management
변경관리의 주 목적은 IT 인프라와 IT 서비스를 이루는 모든 구성요소들의 변경에 대한 표준화된 절차를 만들고, 변경으로 인한 영향이 서비스 품질과 연속성에 주는 영향을 최소로 하도록 효율적인 변경작업을 보장하는 것이다. 기본적으로 ‘변경’은 변경요청에 의해 시작되고 승인된 변경요청만이 실제 변경으로 이어진다. 그러나 변경관리 프로세스가 실제 변경을 구현하는 것을 의미하는 것은 아니며 변경요청에 대한 심사와 승인 및 거부 등의 절차에만 관여한다.
변경관리 프로세스가 모든 변경에 대해 같은 절차를 필요로 하지는 않고 변경의 내용과 다른 프로세스에 미치는 영향에 따라 다른 절차에 의해 변경요청을 처리할 수 있다. 예를 들어 사용자의 패스워드를 변경하는 수준의 변경은 간단한 프로세스들에 의해 처리될 수 있으며 서버의 마이그레이션과 같은 변경은 변경자문위원회(Change Advisory Board : CAB)의 전체 구성원을 소집하여 장기간에 걸친 분석과 검토를 통해 이루어질 것이다.
그리고 전체 위원회의 소집이 불가능한 긴급 변경이 필요한 경우 긴급변경자문위원회(Change Advisory Board Emergency Committee: CAB/EC)를 통해 변경을 처리하도록 할 수 있다.

6. Release Management
많은 IT 서비스들은 다양한 종류의 하드웨어와 소프트웨어에 연관되어 있다. 릴리즈관리의 목적은 이러한 서비스와 연관된 프로덕트들의 릴리즈를 예측하고 적용하여 효율적인 IT 서비스를 제공하도록 하는 것이다.
또한 신뢰할 수 있는 버전의 프로덕트만이 설치되도록 하여 임의의 변경을 방지하고 설치된 내용은 CMDB에 저장하여 릴리즈의 설치 현황과 과거 기록을 조회할 수 있어야 한다. 승인된 릴리즈의 소프트웨어는 Definitive Software Library로 관리하고 승인된 하드웨어는 Definitive Hard ware Store를 통해 관리한다.
릴리즈관리 프로세스는 변경관리 프로세스, 구성관리 프로세스와 밀접히 연관되어 있고 프로세스 간에 필요한 정보들은 CMDB를 통해 공유된다.


서비스 딜리버리(Service Delivery)
서비스 딜리버리 영역은 비즈니스 사용자가 어떠한 IT 서비스와 지원을 요구하는지 파악하여 그것에 적합한 서비스를 서비스 제공자가 사용자에게 지원하도록 하는 데 목적이 있다. 이러한 프로세스들은 고객의 비즈니스와 IT 기술 간의 다리 역할을 하여 비즈니스 목표를 달성하도록 돕는다.

1. Capacity Management
용량관리의 목적은 비즈니스에 요구되는 IT 자원과 성능을 적시에, 그리고 비용 면에서 효과적으로 지원하도록 보장하는 것이다. 이를 위해서는 IT 서비스가 제공하는 성능의 지속적인 모니터링과 기존의 자원을 효율적으로 사용하도록 하는 튜닝 활동이 필요하다. 또한 현재 비즈니스가 요구하고 있는 성능과 향후에 요구되는 용량에 대한 예측과 분석을 통해 용량계획을 수립하여야 한다. 용량계획은 SLA에 기반한 서비스 품질을 기반으로 재무관리(Financial Management) 프로세스와 연계해 수립되도록 한다.
용량관리는 다음과 같은 하위 프로세스들로 구성된다.

·Business Capacity Management
이 프로세스는 향후 비즈니스 요구에 부합하도록 IT 서비스를 계획하고 적절한 시점에 구현하는 것이다. 이것은 기존의 성능 트렌드 분석과 모델링에 의한 예측을 통해 이루어지며 IT의 성능뿐만 아니라 비즈니스 자체에 대한 계획과 예측을 필요로 한다.
·Service Capacity Management
이 프로세스에서는 IT 서비스의 성능을 관리하는 것이 주 목적으로 모든 서비스들에 대한 성능이 정의된 SLA에 맞게 유지되는지 감시한다.
·Resource Capacity Management
이 프로세스에서는 IT 인프라를 구성하는 개별 요소들의 성능 측정과 리포팅, 데이터 분석이 요구된다.

2. Availability Management
가용성관리의 목적은 IT 인프라의 성능과 지원 조직을 최적화하여 신뢰할 만한 수준으로 가용성을 유지시키는 것이다. 이것은 비즈니스에 요구되는 가용성 수준을 파악하고 거기에 맞게 IT 인프라의 성능과 지원 조직을 구성함으로써 얻어질 수 있으며, 가용성을 충족시키기 위해서는 가능한 비용에 대한 문제 또한 고려되어야 한다.
가용성관리에서 중요한 문제는 가용성 수준의 측정 방법과 모니터링이며 일관된 결과를 얻을 수 있는 방법과 도구가 선택되어야 한다.
이 프로세스에서의 주된 기능은 다음과 같다.
·비즈니스에 요구되는 가용성을 위한 요구 조건들의 파악과 가용성 계산 공식 산출과 장애 발생 시 복구 기준 설정
·ITSCM(IT Service Continuity Management)와 관련하여 비즈니스의 핵심 기능 요소와 IT 서비스의 장애발생 시 비즈니스의 영향 분석
·SLA, OLA와 계약에 근거한 가용성과 신뢰성, 복구에 대한 목표 설정 및 그것의 측정 방법과 리포팅 내용에 대한 설정
·가용성 계획 수립
·주기적인 가용성과 신뢰성의 모니터링과 트렌드 분석을 통한 가용성의 향상

또한 가용성관리에 있어 중요한 부분 중의 하나는 위험 분석(Risk Analysis)인데, 이를 통해 잠재적인 위험요소들이 어떤 것들이며 그것들의 위협 수준과 그 위협에 대한 IT 조직의 취약 정도를 파악하는 것이 필요하다.
3. IT Service Continuity Management
(ITSCM)
ITSCM은 많은 위험요소를 안고 있는 비즈니스 상황에서 비즈니스의 연속성을 보장해 주는 중요한 도구이다. 적절한 ITSCM 조치들을 구현함으로써 비즈니스에 미치는 영향을 최소화할 수 있고 다양한 환경의 변화에 대해 신속하고도 효과적으로 대응하도록 주기적인 검증 절차를 통해 더욱 확실한 연속성을 보증한다.
ITSCM의 주된 목표는 필요한 IT 기술과 서비스 자원들을 요구되는 기간 내에 제공하여 전체적인 비즈니스의 연속성을 지원하는 것이다. 이것을 위해서는 위험요소의 분석과 평가를 기반으로 비즈니스의 연속성을 보장할 수 있는 전략을 수립하고 조직의 구성과 역할에 맞게 적용하여야 한다. 장애 발생 시 잘 짜여진 운영 및 복구 전략은 비즈니스와 IT 서비스의 중단을 최소화할 수 있다.


4. Financial Management
재무관리는 IT와 관련한 기업의 재무 자원을 건실하게 관리하는 것으로서 비즈니스 목표를 수립하고 실행하는 데 있어 발생 비용과 수입에 대한 정확한 계획과 예측을 도와준다.
재무관리는 다음의 세 부분으로 나뉜다.

·Budgeting
이 프로세스에서는 IT를 위한 예산을 예측하고 할당하며 예산 범위 내에서 비용이 소요되도록 한다. 설정된 목표에 맞는 성능을 위한 IT 서비스 소요 비용을 예측하고 집행되도록 함으로써 효과적인 예산 운영이 가능하도록 한다.
· IT Accounting
이 프로세스는 IT 서비스를 위한 비용이 비즈니스의 목적에 맞게 사용되었는지에 대한 정보를 제공한다. 어떤 서비스에 얼마의 비용이 소요되었는지에 대한 정보와 향후 투자를 위한 가이드라인을 제공한다.
· Charging
이 프로세스는 지출과 수입의 균형을 맞추는 프로세스이다. 고객이 사용하는 서비스의 수준에 맞추고 비용을 회수할 수 있도록 해야 하며 서비스에 대한 향후 투자를 고려해 운영되어야 한다.

5. Service Level Management
서비스 수준관리는 비즈니스에 필요한 수준과 제공할 수 있는 IT 서비스 수준을 파악하여 밸런싱하는 프로세스이다. 서비스 제공자와 고객 간에 상호 만족할 수 있는 수준의 서비스를 협의하여 협의된 수준에 맞게 IT 서비스를 운영하도록 하는 것이 목적이다.
서비스 수준관리에 관련된 내용은 다음과 같다.

·Service Catalogue
IT 조직에서 제공할 수 있는 서비스 전체에 대한 목록으로 다양한 서비스 수준과 각 서비스 수준별 상세 내용을 포함한다.
·Service Level Agreements
고객과의 협의를 통해 도달된 동의된 서비스 수준에 대한 약속이다.
·Operational Level Agreement
SLA를 위해 IT 조직과 내부 공급자와 외부 공급자 간에 체결된 계약이다.
·Service Quality Plan
협의된 서비스 수준을 보장하기 위해 필요한 모든 내용을 기술한 내부 계획이다.
·Monitoring, Review and Report
주기적으로 서비스 수준 위반 여부를 검토함과 동시에 서비스 수준 향상 계획을 수립하고 기존의 SLA와 OLA를 갱신한다.

Posted by theYoungman