회귀분석예시(교통사고관련)
본 자료는 4페이지 의 미리보기를 제공합니다. 이미지를 클릭하여 주세요.
닫기
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
해당 자료는 4페이지 까지만 미리보기를 제공합니다.
4페이지 이후부터 다운로드 후 확인할 수 있습니다.

소개글

회귀분석예시(교통사고관련)에 대한 보고서 자료입니다.

목차

1. 회귀분석 정의
2. 교통사고 사망자 자료를 이용한 회귀분석
-참고문헌

본문내용

iplot(행렬도)임
- <그림 3>에서의 5개의 화살표는 두 개의 주성분으로 축소했을 때 원래 변수들이 나타내는 방향으로 주성분과 자료 간의 관계를 나타냄
- 그림에서 보듯 사망자수와 인구수, 자동차대수는 서로 밀접한 연관성을 가짐
- 대한민국, 터키, 폴란드는 자동차 1만대당 사망자수와 인구 10만명당 사망자수가 다른 나라에 비해 높은 것을 볼 수 있으며, 미국은 사망자수, 인구수, 자동차대수가 다른 나라에 비해 매우 높은 것을 볼 수 있음
□ 회귀분석 개요
ㅇ 분석 개요 및 목적
- 본 회귀식의 목적은 OECD국가들의 자동차대수, 교통사고사망자수 등의 변수를 이용하여 교통사고 사망자수를 예측하기 위함
- 교통사고의 주요원인이 되는 변수를 분석, 예측하여 향후 안전대책을 마련하기 위한 기초 자료로 활용
ㅇ 분석과정
- 자료를 분석하기 위하여 통계분석용 소프트웨어인 R을 사용하였음
> library(openxlsx)
> dat <- read.xlsx("/home/jang/Downloads/MailDownloads/OECD가입국가 교통사고 비교(회귀분석용).xlsx", startRow = 2, rows=1:34)
> dat2 <- apply(dat[,-c(1:2, 8)], 2, as.numeric)
> dat4 <- as.data.frame(dat2)
> colnames(dat4) <- c("y", paste("x", 1:4, sep=""))
> fit1 <- lm(y ~ x1, data=dat4)
> fit2 <- lm(y ~ x2, data=dat4)
> summary(fit1)
Call:
lm(formula = y ~ x1, data = dat4)
Residuals:
Min 1Q Median 3Q Max
-4323.6 -197.9 232.5 357.0 3113.4
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) -3.331e+02 2.755e+02 -1.209 0.236
x1 1.192e-01 5.225e-03 22.815 <2e-16 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Residual standard error: 1402 on 30 degrees of freedom
Multiple R-squared: 0.9455,Adjusted R-squared: 0.9437
F-statistic: 520.5 on 1 and 30 DF, p-value: < 2.2e-16
> summary(fit2)
Call:
lm(formula = y ~ x2, data = dat4)
Residuals:
Min 1Q Median 3Q Max
-5896.0 -135.8 589.7 784.6 4699.2
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) -902.657 380.415 -2.373 0.0243 *
x2 95.521 5.633 16.958 <2e-16 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Residual standard error: 1846 on 30 degrees of freedom
Multiple R-squared: 0.9055,Adjusted R-squared: 0.9024
F-statistic: 287.6 on 1 and 30 DF, p-value: < 2.2e-16
- 사용한 R 코드는 다음과 같음
□ 회귀분석 결과
ㅇ 파라메타 설명
- 사망자수와 자동차대수, 사망자수와 인구수와 관계를 선형회귀모형으로 분석하기 위하여 다음과 같은 두 개의 모형을 구축함
ㅇ 모형1 : 사망자수와 자동차대수를 이용한 회귀모형
- 추정된 회귀모형
- 모형의 유의성 검정
회귀계수
표준오차
t-값
유의확률
절편
-333.1130
275.55343
-1.209
0.2361
자동차대수(천대)
0.1192
0.00523
22.815
0.0000
R-square: 0.9455
- 회귀계수의 유의성 검정 결과 자동차대수의 회귀계수가 유의수준 95%에서 매우 유의하므로 자동차대수는 사망자수에 영향을 주는 변수로 별수 있으며 ANOVA의 F-검정의 p-값 또한 0.0000으로 모형의 유의성이 있다고 볼 수 있음
- 추정된 회귀계수가 0.1191이므로 자동차가 천대 증가할 때 약 0.119명의 사망자수가 증가한다고 생각할 수 있음
ㅇ 모형2 : 사망자수와 인구수를 이용한 회귀모형
- 추정된 회귀모형
- 모형의 유의성 검정
회귀계수
표준오차
t-값
유의확률
절편
-902.657
380.4154
-2.3738
0.0243
인구수(백만명)
95.5213
5.6337
16.958
0.0000
R-square: 0.9055
- 회귀계수의 유의성 검정 결과 인구수의 회귀계수가 유의수준 95%에서 매우 유의하므로 인구수는 사망자수에 영향을 주는 변수로 별수 있으며 ANOVA의 F-검정의 p-값 또한 0.0000으로 모형의 유의성이 있다고 볼 수 있음
- 추정된 회귀계수가 95.5213이므로 인구가 백만명 증가할 때 약 95명의 사망자수가 증가한다고 생각할 수 있음
□ 결론
ㅇ 분석의 결과
- 미국이 회귀직선이 기울기에 영향을 많이 미치는 영향점(leverage point)로 보이므로 이 점을 제외하고 분석할 필요가 있을 것으로 보임
- 미국을 제외한 경우 추정된 회귀모형
- 미국을 제외한 경우 자동차대수가 천대 증가할 때 사망자수가 0.0696명 증가하고 인구수가 백만 명 증가할 때 사망자 수가 47.99명 증가함
ㅇ 결론 및 시사점
- 본 과제에서는 교통사고 사망자수, 자동차 대수, 인구수 등을 활용하여 회귀분석을 실시하였음
- 향후 이용가능한 데이터의 수나 정확도가 높아질 경우 보다 정밀한 분석이 이루어 질 수 있으며, 다양한 변수를 활용하여 회귀분석을 실시할 수 있음
- 분석을 통해 교통사고의 원인을 찾아내고, 향후 자동차 증가나 인구수의 증가에 따른 교통사고 수치를 예측할 수 있을것으로 판단됨
  • 가격2,000
  • 페이지수13페이지
  • 등록일2015.10.02
  • 저작시기2015.6
  • 파일형식한글(hwp)
  • 자료번호#982980
본 자료는 최근 2주간 다운받은 회원이 없습니다.
청소해
다운로드 장바구니