topics 결함 유형 분석 결함 트리 분석이란 무엇인가요?
IBM Maximo Application Suite 살펴보기
첨단 기술 터널 내부의 평탄한 도로

제조 시설에서 시스템 장애의 잠재적 원인을 이해하는 것은 이를 예방하는 데 중요합니다. 결함 트리 분석(FTA)은 근본 원인 분석에 대한 하나의 접근 방식을 제공하며, 장비에 장애가 발생하기 이전에 자산 문제에 대한 근본 원인을 식별하고 분석합니다. 

결함 트리 분석은 복잡한 시스템 내에서 원하지 않는 특정한 이벤트의 원인을 파악하기 위한 연역적 및 하향식 접근 방법입니다. 여기에는 장애의 근본 원인을 기여 요인으로 분류하고, 이를 결함 트리라는 그래픽 모델로의 표현이 포함되며 관리자와 엔지니어가 안전 및 신뢰성 분석을 위해 잠재적인 장애 모드와 장애 모드별 확률을 식별하는 데 도움이 됩니다.

1960년대 초 미 공군이 미니트맨 미사일 시스템의 잠재적 결함을 파악하기 위해 벨 연구소에서 처음 개발한 결함 트리 분석은 항공우주, 원자력, 화학 및 자동차 분야를 비롯한 다양한 산업 분야에서 널리 사용되고 있습니다.

유지 관리 담당자는 결함 트리 분석을 활용하여 다음 작업을 수행할 수 있습니다:

  • 새로운 시스템 설계 및/또는 설치
  • 기존 시스템 변경
  • 시스템 안전 또는 신뢰성 조사
  • 규정 준수 평가
  • 유지 관리 예산 최적화

제조 환경이 계속 발전하고 더욱 복잡해짐에 따라 결함 트리 분석과 같은 효과적인 위험 관리 도구의 요구가 점점 더 중요해지고 있습니다.결함 트리 분석을 조직의 안전 분석 및 신뢰성 엔지니어링 수행에 통합하면 시스템 장애의 잠재적 원인에 대한 심층적인 인사이트를 확보하여 전반적인 성능을 개선하고 비용이 많이 들며 잠재적으로 치명적인 사고의 가능성을 줄일 수 있습니다.

IBM Maximo 둘러보기

IBM Maximo를 살펴보고 IoT 데이터, 분석 및 AI가 자산 운영을 간소화하는 데 어떻게 도움이 되는지 알아보세요.

관련 내용

IBM 뉴스레터 구독하기

결함 트리 분석 수행하기

결함 트리 분석 수행은 7가지 주요 단계로 구성된 복잡한 프로세스입니다.

1단계: 원하지 않는 이벤트 정의하기

분석을 실행하기 전에 분석하려는 원하지 않는 이벤트를 명확하게 정의해야 합니다. 이 이벤트는 구성요소 장애나 시스템 오작동과 같이 구체적이며 측정 가능해야 합니다. 이러한 이벤트가 결함 트리 다이어그램의 시작점 역할을 하기 때문에 이벤트를 명확하고 일관된 용어로 정의하는 것도 중요합니다.

2단계: 원인 이벤트 및 요인 파악하기

원하지 않는 이벤트를 정의한 후에는 이러한 이벤트 발생에 기여할 수 있는 요인과 이벤트를 식별해야 합니다.기여 요인은 기본 이벤트와 중간 이벤트라는 두 가지 광범위한 범주로 분류되는 경향이 있습니다.

기본 이벤트(더 간단한 이벤트로 더 세분화할 수 없는 이벤트)는 결함 트리에서 가장 기본적인 이벤트로, 분석할 수 있는 이벤트의 가장 낮은 수준을 나타냅니다. 예를 들어, 자동차 사고에 대한 결함 트리의 기본 이벤트는 "운전자가 차량에 대한 통제력을 잃음"일 수 있습니다.

중간 이벤트는 하위 수준의 기본 이벤트와 최상위 이벤트(분석 중인 원하지 않는 기본 이벤트) 사이에 위치합니다. 중간 사건은 결함 트리의 다른 이벤트에 의해 발생하고, 결과적으로 다른 이벤트가 발생하게 됩니다.이는 추가로 분석할 수 있는 더 높은 수준의 이벤트를 나타냅니다. 동일한 자동차 사고를 예로 들면, 결함 트리의 중간 이벤트는 "타이어 파열"일 수 있습니다.

구성요소 장애, 인적 오류, 환경 조건과 같은 내부와 외부의 이벤트를 모두 고려해야 합니다. 이 분석 단계에서는 해당 분야 전문가와 상담하거나 기록 데이터, 사고 보고서 및 유지보수 기록을 검토해야 할 수도 있습니다.

3단계: 결함 트리 구성

표준 게이트 심볼과 이벤트 심볼을 사용하여 원하지 않는(또는 출력) 이벤트와 해당 기여 요인(입력 이벤트라고도 함) 간의 관계를 그래픽으로 구성합니다. 결함 트리는 계층적으로 구성되어야 하며, 원하지 않는 이벤트가 최상단에 위치하고 기여 요인이 그 아래로 나눠져 있습니다.

기본 이벤트는 다른 이벤트를 생성할 수 없으므로 기본 이벤트를 배치하는 것은 매우 간단합니다.하지만 중간 이벤트를 포함하면 최상위 이벤트, 중간 이벤트, 기본 이벤트 간의 관계를 나타내는 부울 논리 게이트를 요구하기 때문에 조금 더 복잡해집니다.

결함 트리에 사용되는 주요 로직 게이트 유형에는 이는 AND 게이트OR 게이트입니다.

  • AND 게이트: 원하지 않는 이벤트가 발생하기 위해 원인이 되는 모든 이벤트가 동시에 발생해야 하는 경우 AND 게이트를 사용합니다. 예를 들어, 시스템 장애에 구성요소 장애와 운영자 오류가 모두 필요한 경우, AND 게이트를 사용하여 결함 트리의 이벤트를 연결합니다.
  • OR 게이트: 입력 이벤트 중 하나만 있어도 출력 이벤트가 발생하기에 충분한 경우 OR 게이트를 사용합니다.즉, OR 게이트에 연결된 한 개 이상의 입력 이벤트가 발생하면 출력 이벤트가 발생할 것입니다.예를 들어, 구성요소 장애 또는 운영자 오류로 시스템 장애가 발생할 수 있는 경우, OR 게이트를 사용하여 이벤트를 연결합니다.

자주 사용되지는 않지만 NOT 게이트, XOR 게이트, K/N 게이트, INHIBIT 게이트도 입력과 출력 이벤트 간 특정 관계를 식별하는 데 도움이 될 수 있습니다.

  • NOT 게이트: NOT 게이트는 입력 이벤트의 반대를 나타냅니다. 입력 이벤트가 발생하지 않으면 출력 이벤트가 발생합니다. 이러한 게이트는 이벤트의 부재 또는 보완적 이벤트의 발생을 모델링하기 때문에 결함 트리 분석에서는 덜 일반적입니다.

  • XOR 게이트(배타적 OR 게이트): 출력 이벤트가 발생하기 위해 입력 이벤트 중 하나가 정확하게 발생해야 하는 경우 XOR 게이트를 사용합니다. 입력 이벤트가 발생하지 않거나 하나 이상 발생하면 출력 이벤트는 발생하지 않습니다.

  • K/N 게이트: K/N 게이트는 투표 게이트 또는 임계값 게이트라고도 하며, 출력 이벤트가 발생하기 위해 가능한 모든 입력 이벤트(N)에서 특정 개수의 입력 이벤트(K)가 발생해야 할 때 사용됩니다. K/N 게이트는 결함 트리 분석에서 보다 복잡한 관계를 설명하는 데 도움이 될 수 있습니다.

  • INHIBIT 게이트: INHIBIT 게이트는 AND 게이트와 마찬가지로 입력 이벤트와 조건부 이벤트(모든 게이트에 적용될 수 있는 조건 또는 제한)가 모두 발생하면 출력 이벤트가 발생함을 나타냅니다.

또한 중간 이벤트에는 완전히 이해되지 않았거나 완전히 분석되지 않은 이벤트인 개발되지 않은 이벤트를 포함할 수 있습니다.

사용 가능한 다양한 게이트를 사용하면 원하지 않는 사건을 발생하게 만든 다양한 이벤트와 요인 간의 복잡한 상호작용을 포착하는 포괄적인 결함 트리를 생성하는 데 도움이 됩니다.

결함 트리를 구성하는 것은 반복적인 프로세스이므로 이벤트를 더 이상 세분화하여 분석할 수 없을 때까지 원인이 되는 이벤트를 기본 하위 이벤트로 계속 분류해야 한다는 점을 기억하는 것이 중요합니다. 새로운 정보 및/또는 시스템 조건이 변경되면 결함 트리를 개선하기 위해 여러 조정이 필요할 수 있습니다.

4단계: 장애 데이터 수집

원하지 않는 이벤트와 관련된 위험을 정량화하기 위해서는 결함 트리의 기본 이벤트에 대한 장애 데이터(과거 기록, 업계 데이터베이스, 전문가 의견 등)를 수집해야 합니다. 장애 데이터는 수행하는 분석 유형에 따라 장애 확률 또는 장애 비율로 표현되어야 합니다.

5단계: 분석 수행

결함 트리를 구성하고 장애 데이터를 수집한 후에는 분석을 수행하여 원하지 않는 이벤트가 발생할 확률을 계산하고, 가장 중요한 기여 요인을 식별합니다.정성적 또는 정량적 데이터 분석 방법을 활용합니다.

정성적 분석은 결함 트리의 구조, 이벤트 간 관계, 임계 경로 및 최소 절단 집합(원하지 않는 이벤트를 생성할 수 있는 최소 이벤트 집합) 식별을 이해하는 데 중점을 둡니다. 정성적 분석은 수정 조치의 우선순위를 정하고, 추가적인 조사가 필요한 영역을 식별하는 데 도움이 될 수 있습니다.

반면, 정량적 방법론에서는 기본 이벤트의 장애 확률을 기반으로 원하지 않는 이벤트가 발생할 확률을 계산합니다. 정량적 분석은 위험 관리 의사 결정을 알리고, 제안하는 개선 사항의 효과를 평가하는 데 도움이 될 수 있습니다.

6단계: 결과 해석

분석을 수행한 후에는 결과를 해석하고, 필요한 이해 관계자에게 관련 정보를 전달해야 합니다.

이벤트 트리 분석의 결과는 입력 데이터의 품질과 분석 중에 정해진 가정에 따라 달라진다는 점을 기억해야 합니다.따라서 결과는 최종적인 결론이 아니라 추가 조사와 검증을 위한 출발점이 되어야 합니다.

7단계: 개선 사항 시행 및 진행 상황 모니터링

결함 트리 분석 결과를 기반으로 원하지 않는 이벤트의 가능성을 제거하거나 줄이기 위해 예방 조치 및/또는 개선 사항을 시행하게 됩니다. 이러한 개선 사항의 성과를 모니터링하고, 시스템 설계, 운영 조건 또는 구성요소 성능의 변경 사항을 반영하기 위해 결함 트리를 지속적으로 업데이트하여 트리가 조직에 정확하고 유용한 상태로 유지되도록 하십시오.

결함 트리 분석의 이점
  • 결함 트리 분석은 시스템 장애를 유발할 수 있는 기여 요인과 이벤트를 시각적으로 보여주므로 시스템 구성요소 간의 복잡한 상호작용을 더 쉽게 이해할 수 있습니다.

  • 결함 트리 분석을 통해 장애 이벤트가 발생할 확률을 계산할 수 있어 더 나은 위험 관리 및 의사 결정을 내리고 팀은 시정 조치에 대해 선제적으로 대응할 수 있습니다.

  • 한 번에 하나의 출력 이벤트만 분석할 수 있으므로, 팀은 결함 트리 분석을 통해 체계적으로 시스템 수준을 평가하고 효과 분석을 체계적으로 수행할 수 있습니다.

  • 결함 트리 분석은 장애 모드 및 영향 분석(FMEA)에 대한 다른 접근 방식과 달리 인적 오류를 설명하므로 팀이 해당 문제가 표준 운영 절차와의 편차와 관련이 있는지 여부를 이해하는 데 도움이 될 수 있습니다.

  • 결함 트리 분석은 발생할 가능성이 가장 높은 장애를 식별하여 팀이 긴급하게 주의해야 하는 문제를 결정하는 데 도움이 됩니다.

결함 트리 분석의 한계
  • 결함 트리 분석의 정확성과 유효성은 분석가의 전문성, 관련된 장애 원인 식별 능력, 결함 트리 자체의 복잡성의 이해도에 의해 크게 좌우됩니다.
  • 결함 트리 분석은 소규모 시스템 분석에 가장 적합합니다. 크고 복잡한 시스템에는 크고 복잡한 결함 트리가 필요할 수 있으므로 분석하는 데 시간이 많이 소요되는 까다로운 작업입니다.
  • 장애 데이터 가용성과 품질은 결함 트리에서 계산된 확률의 정밀도를 결정합니다.
  • 결함 트리 분석에서는 한 번에 하나의 상위 이벤트만 조사할 수 있습니다.
결함 트리 분석 제품
자산 관리 IBM Maximo® Application Suite

지능형 자산 관리, 모니터링, 예측 유지보수 및 안정성이 단일 플랫폼에서 제공됩니다.

IBM Maximo Application Suite 자세히 보기 IBM Maximo 둘러보기

관측성 IBM Instana Observability

애플리케이션 성능 모니터링을 강화하여 인시던트를 더 빨리 해결하는 데 필요한 컨텍스트를 제공합니다.

IBM Instana Observability 더 알아보기 IBM Instana 체험

결함 트리 분석 리소스 근본 원인 분석이란 무엇인가요?

근본 원인 분석을 수행하고 문제를 신속하게 해결하기 위한 다양한 툴과 방법론에 대해 알아보세요.

예방적 유지 보수와 예측적 유지 보수

예방적, 예측적, 대응적 유지 보수 접근 방식의 차이점을 살펴보십시오.

인텔리전트 EAM을 통한 비즈니스 혁신

지능적인 기업 자산 관리가 수익에 어떻게 도움이 되는지 학습하여 복잡한 자산 환경을 더욱 효과적으로 제어할 수 있습니다.

다음 단계 안내

Maximo Application Suite로 기업 자산의 가치를 극대화하세요. Maximo Application Suite는 AI, IoT 및 분석을 사용하여 성능을 최적화하고 자산 라이프사이클을 연장하며, 운영 다운타임 및 비용을 줄이는 단일 통합 클라우드 기반 플랫폼입니다.

IBM Maximo 자세히 보기