topics 선형 회귀분석 선형 회귀란 무엇인가요?
쉽게 해석할 수 있는 수학 공식을 사용하여 예측 생성
watsonx.ai로 선형 회귀 적용 AI 업데이트 구독하기
선형 회귀의 추세, 데이터 분석 및 예측 간의 관계를 보여주는 그림
선형 회귀란 무엇인가요?

선형 회귀 분석은 다른 변수의 값을 기반으로 변수의 값을 예측하는 데 사용됩니다. 예측하려는 변수를 종속 변수라고 합니다. 다른 변수의 값을 예측하는 데 사용하는 변수를 독립 변수라고 합니다.

이 분석 형태는 종속 변수의 값을 가장 잘 예측하는 하나 이상의 독립 변수를 포함하는 선형 방정식의 계수를 추정합니다. 선형 회귀는 예측된 출력 값과 실제 출력 값 간의 불일치를 최소화하는 직선 또는 표면에 적합합니다. '최소 제곱'법을 사용하여 쌍을 이루는 데이터 집합에 가장 적합한 선을 찾는 간단한 선형 회귀 계산기가 있습니다. 그런 다음 Y(독립 변수)에서 X(종속 변수) 값을 추정합니다.

AI를 위한 데이터 저장소

AI 확장을 위한 개선 및 비용 최적화 기회 등의 데이터 레이크하우스 전략을 데이터 아키텍처에 통합하는 것의 이점을 살펴보세요.

관련 내용

IDC 보고서 신청

한층 쉬워진 예측 생성

Microsoft Excel에서 선형 회귀를 수행하거나 선형 회귀 방정식, 선형 회귀 모델 및 선형 회귀 공식을 사용하는 과정을 크게 간소화해 주는 IBM SPSS Statistics와 같은 통계 소프트웨어 패키지를 사용할 수 있습니다. SPSS Statistics는 단순 선형 회귀 및 다중 선형 회귀와 같은 기술에 활용할 수 있습니다.

다음을 포함한 다양한 프로그램 및 환경에서 선형 회귀 방법을 수행할 수 있습니다. 

  • R 선형 회귀.
  • MATLAB 선형 회귀.
  • Sklearn 선형 회귀.
  • 선형 회귀 Python.
  • Excel 선형 회귀.
선형 회귀가 중요한 이유

선형 회귀 모델은 비교적 간단하며 예측을 생성할 수 있는 해석하기 쉬운 수학 공식을 제공합니다. 선형 회귀는 비즈니스 및 학술 연구의 다양한 영역에 적용할 수 있습니다.

선형 회귀는 생물학, 행동, 환경 및 사회 과학에서 비즈니스에 이르기까지 모든 분야에서 사용됩니다. 선형 회귀 모델은 미래를 과학적이고 안정적으로 예측하는 입증된 방법이 되었습니다. 선형 회귀는 오랫동안 확립된 통계 절차이기 때문에 선형 회귀 모델의 속성을 잘 이해하고 매우 빠르게 학습할 수 있습니다.

미래를 과학적이고 안정적으로 예측하는 검증된 방법

비즈니스 및 조직 리더는 선형 회귀 기술을 사용하여 더 나은 결정을 내릴 수 있습니다. 조직은 방대한 양의 데이터를 수집하고, 선형 회귀를 통해 경험과 직관에 의존하는 대신 이러한 데이터를 사용하여 현실을 더 잘 관리할 수 있습니다. 대량의 원시 데이터를 가져와서 실행 가능한 정보로 변환할 수 있습니다.

또한 선형 회귀를 사용하여 비즈니스 동료들이 이전에 이미 알고 있다고 생각했던 패턴과 관계를 발견함으로써 더 나은 인사이트를 제공할 수도 있습니다. 예를 들어, 판매 및 구매 데이터 분석을 수행하면 특정 요일이나 특정 시간대의 특정 구매 패턴을 파악하는 데 도움이 될 수 있습니다. 회귀 분석을 통해 수집된 인사이트는 비즈니스 리더가 회사 제품의 수요가 높아질 시기를 예측하는 데 도움이 될 수 있습니다.

IBM Knowledge Center에서 선형 회귀에 대해 자세히 알아보기
효과적인 선형 회귀의 주요 가정

선형 회귀 분석의 성공을 위해 고려해야 할 가정

  • 각 변수: 유효 사례의 수, 평균 및 표준 편차를 고려합니다. 
  • 각 모델: 회귀 계수, 상관 행렬, 부분 및 부분 상관 관계, 다중 R, R2, 조정된 R2, R2의 변화, 추정치의 표준 오차, 분산 분석 테이블, 예측값 및 잔차 등을 고려합니다. 또한 각 회귀 계수, 분산-공분산 행렬, 분산 팽창 인수, 허용 오차, Durbin-Watson 테스트, 거리 측정(Mahalanobis, Cook 및 레버리지 값), DfBeta, DfFit, 예측 구간 및 사례별 진단 정보에 대한 95% 신뢰 구간을 고려합니다. 
  • 도표: 산점도, 부분 도표, 히스토그램, 정규 확률 도표를 고려합니다.
  • 데이터: 종속 변수와 독립 변수는 정량적이어야 합니다. 종교, 주요 연구 분야 또는 거주 지역과 같은 범주형 변수는 이진(더미) 변수 또는 다른 유형의 대비 변수로 다시 코드화되어야 합니다.  
  • 기타 가정: 독립 변수의 각 값에 대해 종속 변수의 분포는 정규 분포를 따라야 합니다. 종속 변수 분포의 분산은 모든 독립 변수 값에 대해 일정해야 합니다. 종속 변수와 각 독립 변수 간의 관계는 선형이어야 하며 모든 관측치는 독립적이어야 합니다.
SPSS Statistics 무료 체험
데이터가 선형 회귀 가정을 충족하는지 확인

선형 회귀를 수행하기 전에 이 절차를 사용하여 데이터를 분석할 수 있는지 확인해야 합니다. 데이터는 특정 필수 가정을 통과해야 합니다.

이러한 가정을 확인하는 방법은 다음과 같습니다.

  1. 변수는 연속적인 수준에서 측정되어야 합니다. 연속형 변수의 예로는 시간, 매출, 체중, 시험 점수 등이 있습니다. 
  2. 산점도를 사용하면 두 변수 사이에 선형 관계가 있는지 빠르게 확인할 수 있습니다.
  3. 관측치는 서로 독립적이어야 합니다(즉, 종속성이 없어야 함).
  4. 데이터에 유의미한 이상값이 없어야 합니다. 
  5. 동질성(가장 적합한 선형 회귀선을 따른 분산이 해당 선 전체에서 유사하게 유지되는 통계 개념)을 확인합니다.
  6. 가장 잘 맞는 회귀선의 잔차(오차)는 정규 분포를 따릅니다.
이 실습 튜토리얼을 사용하여 선형 회귀 데이터 가정에 대해 자세히 알아보기
선형 회귀 성공의 예
추세 및 판매 추정치 평가

또한 선형 회귀 분석을 사용하여 나이, 교육, 경력 연수와 같은 독립 변수를 통해 영업 사원의 연간 총 매출(종속 변수)을 예측할 수도 있습니다.

가격 탄력성 분석

가격 변화는 종종 소비자 행동에 영향을 미치며, 선형 회귀는 그 영향을 분석하는 데 도움이 될 수 있습니다. 예를 들어, 특정 제품의 가격이 계속 변하는 경우 회귀 분석을 사용하여 가격이 상승함에 따라 소비가 감소하는지 확인할 수 있습니다. 가격이 상승해도 소비가 크게 떨어지지 않는다면 어떻게 될까요? 구매자가 제품 구매를 중단하는 가격대는 어느 정도인가요? 이 정보는 리테일 비즈니스의 리더에게 매우 유용할 것입니다.

보험 회사의 위험 평가

선형 회귀 기법을 사용하여 위험을 분석할 수 있습니다. 예를 들어, 보험 회사에서 주택 소유자의 보험금 청구를 조사할 수 있는 리소스가 제한적일 수 있는데, 선형 회귀를 사용하면 보험금 청구 비용 추정을 위한 모델을 구축할 수 있습니다. 분석은 회사 리더가 어떤 위험을 감수해야 하는지에 대한 중요한 비즈니스 결정을 내리는 데 도움이 될 수 있습니다.

스포츠 분석

선형 회귀가 항상 비즈니스에만 적용되는 것은 아닙니다. 스포츠에서도 중요합니다. 예를 들어, 농구팀이 한 시즌에 승리한 경기 수가 경기당 팀이 획득하는 평균 점수와 관련이 있는지 궁금할 수 있습니다. 산점도는 이러한 변수가 선형적으로 관련되어 있음을 나타냅니다. 승리한 게임 수와 상대방이 획득한 평균 점수도 선형적으로 연관되어 있습니다. 이러한 변수는 음의 관계를 갖습니다. 승리한 게임 수가 증가할수록 상대가 획득하는 평균 점수는 감소합니다. 선형 회귀를 사용하면 이러한 변수의 관계를 모델링할 수 있습니다. 좋은 모델을 사용하면 팀이 얼마나 많은 게임에서 승리할지 예측할 수 있습니다.

관련 솔루션
IBM SPSS Statistics 소프트웨어

이 빠르고 강력한 솔루션으로 연구와 분석을 촉진하세요.

SPSS Statistics 살펴보기
IBM SPSS Statistics GradPack 및 Faculty Packs

학생, 교사 및 연구원은 예측 분석 소프트웨어를 저렴하게 이용할 수 있습니다.

SPSS Statistics Grad Pack 및 Faculty Pack 살펴보기 SPSS Statistics 무료 체험
IBM Cognos Analytics

이 입증된 셀프서비스 분석 솔루션을 사용하면 데이터를 결합 및 조화시켜 매력적인 시각화를 만들 수 있습니다.

Cognos Software 살펴보기
리소스 IBM Knowledge Center의 선형 회귀에 대한 자세한 정보 무료 튜토리얼의 간단한 선형 회귀 예시 선형 회귀를 사용하여 차량 판매량을 모델링하는 방법 방법 선택 변수 회귀 모델 선형 회귀 집합 규칙 정보 선형 회귀 통계 선형 회귀 도표 선형 회귀 변수 선택 방법 새 변수, 예측 값, 잔차 및 기타 통계 저장 처음부터 시작하는 선형 회귀

수학을 코드로 변환한 다음 데이터 세트에서 코드를 실행하여 새로운 데이터에 대한 예측을 얻는 방법을 알아보세요.

R의 선형 회귀

R을 사용하여 선형 회귀 모델을 구축하고 검증합니다.

다음 단계 안내

IBM SPSS Statistics는 고급 통계 분석, 방대한 머신 러닝 알고리즘 라이브러리, 텍스트 분석, 오픈 소스 확장성, 빅데이터 통합 및 애플리케이션으로의 원활한 배포를 제공합니다.

SPSS Statistics 살펴보기 30일 무료 체험