[공모전] 노동공급 이탈 예측 모형을 활용한 노동력 회복 정책 및 개선방안 제언

주관 : 2024 데이터안심구역 활용 공동 경진대회 (최우수상)
프로젝트 명 : 노동공급 이탈 예측 모형을 활용한 노동력 회복 정책 및 개선방안 제언
프로젝트 기간 : 24년 8월 ~ 24년 10월
인원 : 5명 (BOAZ 시각화 21기&22기, 팀 데꾼이들)
활용 Tool : Notion, Python, Tableau, Figma, PPT
☐ 프로젝트 개요 : 노동력 향상을 위한 데이터 기반 디지털 정부 플랫폼 구축을 통해, 향후 노동 공급 이탈 예측 모형 예측 및 일자리 공백에 선제적으로 대응하는 정책 제언
☐ 본인이 맡은 역할 :
  • 자료 수집 및 전처리 :
    • 인구/경제/고용 관련 데이터 수집 및 전처리
  • 지표 선정 :
    • 인구지표/경제지표/고용지표 제작
  • 대시보드 제작
  • PPT 제작
☐ 성과/의의 :
  • 객관적 자료를 참고하여 노동 숙련 지표를 구성한 뒤 대시보드에 표현
  • 노동공급 이탈 예측 모형 및 대시보드를 통해 지역별 노동 공급 정책 제언

📑 프로젝트 내용


❓주제 선정 배경

대한민국이 인구 축소 사회로 진입하면서 미래의 노동 인구 감소는 우리 사회가 마주하게 될 불가피한 문제다.
이를 해결하기 위해, 크게 다음 두 가지의 목표를 세웠습니다.
  1. 노동력 변동성을 예측하여 지역별 노동력 이탈 현상 분석
  1. 외부 변수(경제 성장률, 인구 이동 등)를 반영한 예측 결과 기반 노동력 회복 정책 제언 대시보드 제작

🔗 데이터 수집

토글을 펼치면 활용 데이터 목록을 확인할 수 있습니다.
데이터
시점
출처
데이터 설명 및 목적
행정동 단위 소득관련 통계정보
2020 ~ 2023 월별
KDATA (코리아크레딧뷰로)
시계열 예측 모델
기업 고용정보
2022
KDATA (한국평가데이터)
[지역별 노동 숙련 지표(고용) 현황 대시보드] 기업규모 시트
7대 광역시 유동인구 정보
2022 ~ 2023 월별
KDATA (LGU+)
시계열 예측 모델
월.분기.연간 인구동향(출생, 사망, 혼인, 이혼)
2013 ~ 2023 연별
통계청
[대시보드] 자연적 인구 증감 시트
시도.산업별 사업체수, 종사자수 및 매출액
2016 ~ 2022 연별
통계청
[대시보드] 산업별 소득/종사자수 구성
시군구/성/연령(5세)별 주민등록연앙인구
2013 ~ 2023 연별
통계청
[대시보드] 인구 구조 구성
시군구별 이동자수
2013 ~ 2023 연별
통계청
[대시보드] 인구 전입/전출 시트, 시계열 예측 모델
지역내총생산(GRDP)
2013 ~ 2022 연별
통계청
[대시보드] 인당 지역내총생산(GRDP), 시계열 예측 모델
행정구역(시도)/성별 경제활동인구
2013 ~ 2022 연별
통계청
[대시보드] 성별 경제활동참가/실업률 구성
행정구역(시도)/연령별 경제활동인구
2013 ~ 2023 연별
통계청
[대시보드] 연령별 경제활동참가 시트, 시계열 예측 모델
국민연급 가입 사업장 내역
2015 ~ 2022 연별
국민연금공단
산업 종사자수 시트
산업별 노동 부족인원
2013 ~ 2023 월별
고용노동부
부족률/미충원률 시트, 시계열 예측 모델
법정동코드목록
2024
행정안전부
산업 종사자수 데이터 매핑 구성
활용한 모든 데이터는, 프로젝트 진행 당시 기준 최신 데이터로 수집하였습니다.
 

🙋🏻‍♀️ 본인이 맡은 역할


⓵ 객관적 자료를 기반으로 복합적 지표 구성 제안

(2022년~2032년) 중장기 인력수급 전망 및 추가 필요인력 전망(2024.03) 논문을 참고하여, 인구지표경제지표, 고용지표 구성을 제안하였습니다.
인구지표
  • 정의 : 지역별 인구 정보를 고려한 노동 숙련 인구 지표
  • 계산 : (총 인구수 정규화 + 순이동자수 정규화 + 자연증감 정규화) / 3
    • → 정규화는 MINMAX Scaler를 이용하여 0 ~ 100 사이의 값으로 계산하였습니다.
경제지표
  • 정의 : 지역별 경제 정보를 고려한 노동 숙련 경제 지표
  • 계산 : (1인당 GRDP 정규화 + GRDP 성장률 정규화 + 1인당 산업 매출액 정규화) / 3
    • → 정규화는 MINMAX Scaler를 이용하여 0 ~ 100 사이의 값으로 계산하였습니다.
고용지표
  • 정의 : 지역별 고용 정보를 고려한 노동 숙련 고용 지표
  • 계산 : (인원부족률(역수) 정규화 + 미충원률(역수) 정규화 + 취업률 정규화 + 국민연금 가입자수 정규화) / 4
    • → 정규화는 MINMAX Scaler를 이용하여 0 ~ 100 사이의 값으로 계산하였습니다.

인구지표, 고용지표 데이터 전처리 및 지표 구성

인구지표에 포함되는 인구 데이터고용지표에 포함되는 고용 데이터를 담당하여, 데이터 전처리를 수행한 뒤 지표를 구성하였습니다.
💡
인구지표 : (총 인구수 정규화 + 순이동자수 정규화 + 자연증감 정규화) / 3
  • 데이터 명: 시군구_성_연령_5세_별_주민등록연앙인구, 시군구별_이동자수, 시도_인구동태건수_및_동태율_출생_사망_혼인_이혼
      1. 시군구_성_연령_5세_별_주민등록연앙인구 파일
        1. 연도 > 시도 > 성별 > 연령(10세 단위)으로 그룹화 후, 총 인구수 계산
          1. PS = PS[~PS['시도별'].isin(['전국'])] PS = PS[~PS['연령별'].isin(['계'])].reset_index(drop=True) def find_upper_age_limit(group): def get_last_age(age_str): if '이상' in age_str: return int(age_str.split('세')[0]) else: return int(age_str.split('-')[1].replace('세', '')) group['상한연령'] = group['연령별'].apply(get_last_age).max() return group def group_ages_and_sum(group): upper_limit = group['상한연령'].iloc[0] def group_ages(age_str): start_age = int(age_str.split('-')[0]) if '-' in age_str else int(age_str.split('세')[0]) if start_age >= upper_limit: return f'{upper_limit}세 이상' grouped_start_age = (start_age // 10) * 10 return f'{grouped_start_age}-{grouped_start_age + 9}세' group['연령별'] = group['연령별'].apply(group_ages) group_sum = group.groupby(['시점', '시도별', '성별', '연령별'], as_index=False)['평균총인구수'].sum() return group_sum PS = PS.groupby(['시점', '시도별', '성별']).apply(find_upper_age_limit) PS = PS.groupby(['시점', '시도별', '성별']).apply(group_ages_and_sum).reset_index(drop=True) PS = PS[PS['성별'] == '계'].reset_index() PS_mean_region = PS.drop(columns=['index', '성별', '연령별']) PS_mean_region
      1. 시군구별_이동자수 파일
        1. 연도 > 시도 > 순이동(명)으로 그룹화 후, 순이동자수 계산
          1. PM = PM[~PM['시도별'].isin(['전국'])] PM = PM[PM['항목'].isin(['순이동 (명)'])].reset_index() PM = PM.drop(columns=['index']) PM_mean_region = PM PM_mean_region
      1. 시도_인구동태건수_및_동태율_출생_사망_혼인_이혼 파일
        1. 연도 > 시도 > 자연증가율(천명당)로 그룹화 후, 자연증감 계산
          1. BS = BS[~BS['시도별'].isin(['국외', '전국'])] BS = BS[BS['항목'].isin(['자연증가율 (천명당)'])].reset_index() pd.set_option('display.float_format', lambda x: '%.1f' % x) BS = BS.drop(columns=['index', 'level_0']) BS_mean_region = BS BS_mean_region

⓷ 대시보드 제작

데이터 분석 결과 및 제작 지표들을 바탕으로, 노동 공급 현황 확인을 위한 대시보드를 제작하였습니다.
notion image
 

💡성과/의의


📍대시보드 인사이트

제작한 총 4개의 대시보드별 인사이트는 다음과 같습니다.
notion image
💡
노동 이탈 현황 파악 대시보드 인사이트
notion image
💡
지역별 노동 숙련도(인구) 현황 대시보드 인사이트
notion image
💡
지역별 노동 숙련도(경제) 현황 대시보드 인사이트
notion image
💡
지역별 노동 숙련도(고용) 현황 대시보드 인사이트

📍프로젝트 의의

진행한 프로젝트 의의는 다음과 같습니다.
  1. 객관적 자료를 기반으로 복합적 노동 숙련 지표 구성
    1. 연구자료와 공문을 바탕으로 노동 숙련 지표를 구성하였습니다.
    2. 지표별 가중치를 통일화하기 위해 min-max 정규화로 지표를 구성하였습니다.
  1. 노동력 예측 모델 분석 결과 및 지표를 기반으로 한 대시보드 제공
    1. RandomForest 모델로 분석한 노동력 예측 모델을 노동 이탈 현황 파악 대시보드에 추가함에 따라, 산업 및 지역별 노동 공급 편차를 확인 가능하도록 구성하였습니다.
    2. 객관적 자료를 기반으로 구성된 노동 숙련 지표를 지역별 노동 숙련도 현황 대시보드에 추가함에 따라, 각 지표별 노동 숙련 현황 파악이 가능하도록 구성하였습니다.
  1. Random Forest LIME 분석을 기반으로 한 지역 유형 분류 및 정책 제언
    1. LIME 결과를 기반으로 영향을 미치는 요소가 유사한 시도를 묶어 6개 지역 유형으로 분류하였으며, 6개 지역별 평균 노동 숙련 지표를 확인하여 레벨을 부여하였습니다.
    2. 분류된 6개 지역 그룹별로 미래 노동 공급에 도움이 되는 맞춤형 정책을 제언하였습니다.
 

📍아이디어 결론

💡
[아이디어] ‘노동 공급 현황 확인을 위한 대시보드: 플라이어’ 제공
  1. 배경
    1. 대한민국이 인구 축소 사회로 진입하면서 미래의 노동 인구 감소는 우리 사회가 마주하게 될 불가피한 문제입니다.
  1. 운영
    1. ‘노동 공급 현황 확인을 위한 대시보드: 플라이어’를 통해, 정부는 노동생산성을 관리하고, 기업은 노동자 현황 및 산업 현황을 파악합니다.
  1. 의의
    1. 운영에 대한 의의는 다음과 같습니다.
      • 정부
        • : 노동 이탈 현황 파악 대시보드의 주요 KPI, 노동력 추이 등을 기반으로 대한민국의 전반적인 노동생산성을 관리한다.
      • 기업
        • : 지역벼 노동 숙련도 현황 대시보드의 지표 점수, 다양한 차트 등을 기반으로 노동자 현황 및 산업 현황을 파악한다.
💡
[아이디어] Random Forest LIME 분석을 기반으로 한 지역 유형 분류 및 정책 제언
  1. 배경
    1. ‘노동 공급 현황 확인을 위한 대시보드: 플라이어’를 제공하는 것 뿐만 아니라, 지역별로 미래 노동 공급을 위한 정책을 제언하는 것이 중요합니다.
  1. 제공
    1. LIME 결과를 기반으로 영향을 미치는 요소가 유사한 시도를 묶어 6개 지역 유형으로 분류하였으며, 6개 지역별 평균 노동 숙련 지표를 확인하여 레벨을 부여하였습니다. 분류된 6개 지역 그룹별로 미래 노동 공급에 도움이 되는 맞춤형 정책을 제언하였습니다.
      • 인구 유출 민감형 지역: 전남, 전북, 경남, 경북, 강원
        • 근로자 유입 정책: 청년 근로자를 위한 주거 시설 및 정착금 지원
        • 기업 유입 정책: 신설, 이전 기업을 위한 법인세 감면 등 세제 혜택 제공
      • 경제 성장 및 인구 이동 복합형 지역: 서울, 부산, 대구
        • 지역 산업 최적화: 지역 산업 맞춤형 연계 특화 사업 확대/개편, 경제 위기 단계별 지원 체계 내실화
        • 지역 일자리 사업 재구조화: 지역별 인구 이동, 노동력 등을 반영한 지역 일자리 사업의 확대/개편 등 지역 맞춤형 고용 창출 인프라 구축
      • 균형적 성장 지역: 대전, 세종, 광주
        • 노동력 점검 시스템 마련: 지역 내 산업별 부족 인원 정기 점검 및 인력 확충안 제시
        • 인구문제인식 여론조사 시행 및 수요조사: 심층적인 문제인식 여론조사 시행 및 빅데이터 기반 수요조사로 불편요인 파악
      • 경제 성장형 지역: 경기, 인천, 충북
        • 청년층 유입 정책을 통한 장기적인 고용 안정성 확보: 청년 정착 및 주거 지원 프로그램 + 창업 지원금 및 컨설팅 서비스 제공
        • 생산성 강화 정책: 고용/생산성 연계를 통한 인센티브 프로그램으로 노동 생산성 향상 유도
      • 노동력 감소 위험형 지역: 울산
        • 주거 환경 개선 및 교육 인프라 확충 정책: 공공 임대 주택 건설로 청년층/신혼부부의 정착을 지원하고, 교육 프로그램 강화를 통해 장기적으로 정착할 수 있는 기반 마련
        • 국내외 인재 유치 프로그램: 기술인재와 고급인력을 위한 전략적 유치 지역으로서 국내외 인재 유입 촉진
      • 노동력 연속성 중심형 지역: 제주
        • 인구문제인식 여론조사 시행 및 수요조사: 심층적인 문제인식 여론조사 시행 및 빅데이터 기반 수요조사로 불편요인 파악
        • 가족친화적 세법 개정 및 경력단절여성을 위한 직업 교육: 가족을 형성한 가구에 한해서 세금 감면 혜택 제공 및 경력단절여성을 위한 직업 교육 및 취업 지원
  1. 의의
    1. 운영에 대한 의의는 다음과 같습니다.
      • 분석 모델 및 지표를 기반으로 한 신뢰성 있는 정책 제언
      • 제언하는 정책을 바탕으로, 미래 노동 공급에 대한 기대

💬 회고


➕ 보완할 점

  • ‘노동 공급 현황 확인을 위한 대시보드: 플라이어’에서, 크게 지역별로만 분류하여 노동 이탈 혹은 공급을 확인한 부분이 아쉬웠습니다. 더 나아가 산업별 등 더 다양한 분류 기준을 사용하여 노동 이탈 혹은 공급을 확인하는 것이 목표입니다.
  • 지표를 구성함에 있어 데이터를 수집하는 과정에서, 다양한 데이터를 고려하다 보니 모든 데이터의 시점, 주기 등을 일치화하는 과정에서 짧은 기간의 데이터 값으로만 지표를 구성한 점이 아쉬웠습니다.

🚶🏻‍♀️‍➡️ 성장한 점

  • 이전의 대시보드를 제작할 때에는 다양하고 깊은 분석 모델을 활용하지 못한 점이 아쉬웠는데, 이번 대시보드에서는 깊은 분석 모델을 활용하여 함께 제공할 수 있었던 점이 의미있었습니다.
  • ‘노동 공급 현황 확인을 위한 대시보드: 플라이어’를 바탕으로 지역별 취약 부분을 확인하고, 이에 따른 맞춤형 정책을 제언하는 시간이 의미있었습니다.