오늘은 프로그래밍 말고 새로운 주제로 시작하려 합니다.
새로운 프로젝트를 한달간 진행하였고
그 진행과정에 대해 이야기해보려고 합니다.
주제는 여성가족부와 저출산입니다.
분석 프로그램은 UIPATH와 R을 이용하였습니다.
대한민국의 저출산 문제는 몇년전부터 꾸준히 화제거리였습니다.
다양한 정책을 펼치고 있지만 저출산이 해결되었다는 기사나 소식은 보지 못했으며
점차 나아지는 기미조차 보지 못했습니다.
주제가 여성가족부와 저출산으로 결정한 이유는,
저출산을 해결하기 위해 우선 결혼이 해야할것이며
결혼한 신혼부부나 기존의 부부들에게 출산에 대한 정책을 제안할 수 있는 곳이
여성가족부라고 생각하였습니다.
먼저 여성가족부에서 실시하고 있는 저출산을 해결할 수 있는 방안에 대해 알아보았습니다.
가족 카테고리에서 살펴본 정책입니다.
아기를 낳는것 목적으로 했을때 청소년기까지의 자료는 불필요 하다고 느껴졌기에 가족 카테고리만 살펴보았습니다.
제가 생각한 저출산의 원인은 아기를 낳아서 당장 어떻게 키울지가 근본적이 원인이라 생각하였기에
청소년기까지 살펴보지 않고 관련이 많아보이는 가족 카테고리를 살펴보았습니다.
가족과 관련된 정책을 제시하는 여성가족부에서 저출산과 관련된 정책은 현저히 부족해보였습니다.
공동 육아나눔터 운영, 가족 역량 강화 지원, 양육비 이행 지원 제도가 있지만
이마저도 혜택 사항에 한부모 가정, 조손 가정이 해당되어야만 혜택을 받을 수 있기에
대다수의 국민들이 받을 수 있는 혜택이 턱없이 부족하다는것을 확인 할 수 있었습니다.
제 생각과 더불어 대다수의 국민들의 생각을 알아보기위해
UIPATH를 이용하여
네이버와 유튜브 댓글을 수집하여 분석해보았습니다.
UIPATH는 RPA(Robotic Process Automation)
즉 ,자동화 시스탬입니다.
메소드를 짜놓으면 그 메소드에 맞춰
자동으로 검색 과 크롤링까지 해주는 프로그램입니다.
왼쪽 그림은 유튜브에서 저출산을 검색하였을때
조회수가 가장 높은 영상을 선택하여 댓글을 크롤링하는 과정을 나타낸 것이며,
오른쪽 그림은 네이버에서 저출산을 검색하고 뉴스 카테고리를 선택한 후,
선택한 뉴스 기사 하단에 달린 댓글을 크롤링하는 과정입니다.
크롤링 된 총 댓글 갯수는 4980개,
네이버 1022개,
유튜브 3958개 입니다.
수집된 텍스트 파일을 이용하여
R을 통해 워드 클라우드로 제작해보았습니다.
먼저 필요한 패키지를 설치 및 불러오기를 실행하였습니다.
자세한 내용은 제 블로그 중 R카테고리에서 추후에 자세히 다뤄보도록 하겠습니다.
한글 읽고 설정하기 위한 코드를 적어준 뒤,
본격적으로 텍스트를 이용하여 코드를 짜주도록 합니다.
아까 모아둔 텍스트 파일 이름을 news.txt로 저장해뒀기에
readLines을 사용하여 txt1 변수에 저장해줍니다.
txt2 는 명사만 추출하여 저장해준 변수이며
txt3은 자료를 벡터형으로 바꿔주기위한 명령어입니다.
우리가 워드 클라우드로 보기 좋은 글자 수가 2~4글자라고 생각했기에
txt4에 명사 중 1글자 초과, 5글자 미만인 글자만 추출해서 저장하는 변수를 생성하였습니다.
txt5는 txt4를 내림차순 정렬로 정리해주는 변수이며,
txt6는 txt5의 상위 1000개를 뽑아내는 변수 입니다.
그 후 워드클라우드를 제작하였습니다.
제작된 워드클라우드는 완성되어 보였지만
자세히보면 '때문', 'ㅋ' 등 불필요한 자료가 많이 보였기에
눈에 띄게 불필요한 내용들은 gsub() 명령어로 삭제해보았습니다.
gsub()를 사용하여 삭제한 내용입니다.
^ <- 이 눈웃음 모양을 없애고 싶었지만 삭제되지 않아서 지우지 못했지만
전보다 깔끔한 워드 클라우드를 생성할 수 있었습니다.
워드 클라우드를 살펴보면 '결혼','생각','문제','자식','집값','출산','노예' 등 높은 빈도를 보이고 있습니다.
빈도는 낮지만 '부동산','아파트','주거문제','정책','맞벌이','포기','스트레스' 등의 키워드도 존재하였습니다.
워드 클라우드로 본 결과는
저출산을 걱정하기 이전에
국민들 대다수는 결혼이라는 근본적인 사항을 문제로 생각하고 있었습니다.
분석 결과입니다.
제가 여성가족부와 저출산을 연관지은 이유는
가족을 위한, 결혼한 가정을 위한, 부부를 위한
보편적인 정책을 만들 수 있는 상위 기관이 여성가족부라 생각하였기 때문입니다.
정부 및 기관에서는 어떤 제도나 정책으로 저출산을 높일지를 생각하고 있지만
정작 국민들은 결혼 자체를 부정적으로 바라보고 있었습니다.
물론 지금 지자체에서 진행하고 있는
출산 장려금과 같은 제도적 방안도 매우 중요하다 생각합니다.
하지만
최근 정인이 사건, 구미 3세 여아 사건 등
영유아기 아이들의 사망사고등이 연이어 터지며
국민들에게 큰 충격으로 다가왔으며
사건을 처리하는 과정에서 실망스러운 기관들의 대처를 보며
사회적 분위기 자체가 결혼을, 출산을 꺼려하는 분위기가 생성되지 않았나 생각해보았습니다.
제도적 방안을 우선시 하기 이전에
불미스러운 사건이 발생하였을때
적절한 대처, 충분한 처벌 방안을 통해
전체적인 사회적 분위기가 개선되기위한 노력이 필요하다는 분석 결과를 마무리로,
이번 게시글을 마무리해보겠습니다.
분석 결과는 뉴스 기사로도 만나보실수 있습니다.
m.ujnews.co.kr/news/newsview.php?ncode=1065599805479763
감사합니다.
'진행한 프로젝트' 카테고리의 다른 글
(UIPATH, R) 부동산과 관련된 국민들의 의견 수집 및 분석을 통해 도출한 감정 분석 및 추후 부동산 정책 예측 (0) | 2021.08.21 |
---|---|
UIPATH를 활용한 주식 정보 알아보기. (2) | 2021.07.01 |