r 8

엑셀 중 원하는 부분만 끌어와서 시각화 자료 만들기

DATA_1 % mutate(method = "SimplePos22") ) %>% ggplot(aes(x = reorder(Var1, Freq), y = Freq, fill = method)) + geom_bar(stat = "identity", colour = "red") + facet_wrap(~ method, nrow = 1, scales = "free") + coord_flip() + labs(x = "Words", y = "Freq") 같은 내용을 R에서 명사추출로 가장 많이 사용하는 extractNoun, SimplePos를 활용하여 추출 결과가 어떻게 다른지 살펴볼 수 있는 시각화 자료 생성 가능 코드

R 데이터 분석 2022.01.14

결측치, 이상치, 그리고 상관관계 분석

이때까지 제가 했던 분석의 대부분은 데이터 수집(크롤링) -> 데이터 분석 -> 시각화 의 과정을 거쳐왔습니다. 하지만 프로젝트를 진행하면서 용어에 대한 지식 자체가 부족했고 사람들과 의사소통을 넘어 간단한 논문 내용 조차, 통계 분석 결과 조차 해석 하기 어려웠습니다. 그렇기에 앞으로 공부와 복습을 위해 단어 및 공부 내용을 정의와 함께 간단하게 살펴보는 게시글을 올리게 되었습니다. 저는 R을 기반으로 공부하기 때문에 하단에 정의와 함께 게시된 코드는 R 코드 기반입니다. 1. 결측치 결측치는 NA, 즉 비어있는 값 입니다.. 데이터를 전처리할 때 결측값을 제거하는 일이 종종 있었습니다. 결측치가 포함된 채 분석을 진행했을 때 분석 결과가 완전 다른 결과를 도출하거나, 도출 되지 않을 수도 있기에 결측..

R 데이터 분석 2021.08.22

(UIPATH, R) 부동산과 관련된 국민들의 의견 수집 및 분석을 통해 도출한 감정 분석 및 추후 부동산 정책 예측

안녕하세요 병통입니다. 이번 프로젝트는 UIPATH와 R을 활용하여 워드클라우드를 제작해보고 그 결과로 감정분석을 해보는 프로젝트를 진행하보았습니다. 전체적인 과정을 요약하자면 두 가지의 분석 과정을 진행했습니다. 첫번째로는 UIPATH를 활용하여 유튜브 댓글을 크롤링하고 크롤링 한 댓글을 워드클라우드로 만든 뒤, 워드 클라우드를 바탕으로 감정분석을 해보았으며, 두번쨰로는 R을 활용하여 뉴스 기사 내용을 크롤링하고 크롤링 된 뉴스 기사를 워드 클라우드로 만든 뒤, 워드 클라우드를 바탕으로 감정분석을 해보았습니다. 주제는 2021년 가장 핫한 주제 중 하나였던 부동산 을 선택하여 진행하였습니다. 정치적인 이야기를 하고자하는 것이 아닌, 국민들의 대부분의 정서를 파악하고 20대의 입장에서 생각해 본 앞으로의..

웹 크롤링

웹 크롤링 기초 과정입니다. 제가 제일 처음 배웠던 웹 크롤링으로써 처음 체험하는데 가장 좋은 예시가 될 수 있을 것 같아 글을 적게 되었습니다. 파란색으로 남긴 글이 코드이기에 본 게시글을 보시면서 파란글을 R studio에 붙여넣기 하시면 이해가 더 쉽게 될 것입니다. 게시글 시작하겠습니다 ! library(rvest) #크롤링을 위한 라이브러리 크롤링만 진행할 것이기에 rvest만 있어도 충분히 크롤링이 가능합니다. 필요한 라이브러리 기입입니다. 전처리 내용을 워드클라우드까지 제작해 보는 것을 목표로 진행하였습니다. 지금 블로그 글에서는 크롤링까지 진행해보겠습니다. 처음에는 다음 뉴스 기사 크롤링입니다. 많은 분들이 시도하였고 좋은 예시라고 생각하기에 제일 먼저 이 방법을 선택하여 진행하였습니다. ..

R 데이터 분석 2021.08.19

소셜 데이터로 보는 저출산

오늘은 프로그래밍 말고 새로운 주제로 시작하려 합니다. 새로운 프로젝트를 한달간 진행하였고 그 진행과정에 대해 이야기해보려고 합니다. 주제는 여성가족부와 저출산입니다. 분석 프로그램은 UIPATH와 R을 이용하였습니다. 대한민국의 저출산 문제는 몇년전부터 꾸준히 화제거리였습니다. 다양한 정책을 펼치고 있지만 저출산이 해결되었다는 기사나 소식은 보지 못했으며 점차 나아지는 기미조차 보지 못했습니다. 주제가 여성가족부와 저출산으로 결정한 이유는, 저출산을 해결하기 위해 우선 결혼이 해야할것이며 결혼한 신혼부부나 기존의 부부들에게 출산에 대한 정책을 제안할 수 있는 곳이 여성가족부라고 생각하였습니다. 먼저 여성가족부에서 실시하고 있는 저출산을 해결할 수 있는 방안에 대해 알아보았습니다. 가족 카테고리에서 살펴..

R과 함께하는 반복문

R은 꾸준히 하고 있었지만 바쁘다는 핑계로 1년간 올리지 않았네요. 그동안 많이 응용할줄 아는것도 늘어난것은 분명하지만 아직도 저는 제자리에 불과하네요 조금 더 불태우며 다시금 해보겠습니다..! 오늘은 제목 그대로 R에서 반복문을 사용하는 방법을 간단하게 해보려고 합니다. 기본적으로 크게 반복문은 for 과 while가 있습니다 오늘은 while을 해보고 다음시간에 for을 해보도록 하겠습니다. 반복문에서 가장 간단하게 하는것은 역시 1부터 100까지의 합을 구하는 것이겠죠? 1부터 100이 모두 중첩되는 과정을 겪어야하기에 이런 경우 반복문은 유용하게 사용하게 되는것 같습니다. 여러분 이렇게 한번 해보시겠어요? 그러면 1부터 100까지의 합이 일일이 다 찍힐거에요 100개의 숫자가 다 나오는것이죠. 차..

R 데이터 분석 2021.03.23

R 데이터 분석에 필요한 R studio (2)

안녕하세요 고통 받는 병통입니다. 코로나 때문에 벌써 3월이 없어지고 4월이 시작되고 있습니다. 과제가 너무 많아 허덕이고 있지만 일주일에 꼭 한번은 올릴려고 노력하겠습니다! 오늘은 새로운 프로젝트를 실행하여 폴더를 만들고 새 스크립트를 여는것을 해보겠습니다. 그리고 저번주에 했던 숫자 지정하기의 응용 버전을 같이 해볼게요! 일단 R studio 를 실행 해주세요, 그리고 오른쪽 상단에 있는 project 버튼을 눌러주세요 그리고 상단에 new project 를 누르면 파일 목록이 뜰건데 밑에는 다 무시하고 제일 위에 new project를 또 눌러주세요. 그리고 칸이 두개가 뜰건데 위에는 파일 이름 밑에는 저장 할 위치를 지정해 주세요 저는 바탕화면에 저장을 해보겠습니다 아! 이름은 꼭 영어로 해주세요..

R 데이터 분석 2020.04.06

R 데이터 분석에 필요한 R Studio

안녕하세요 ! 고통 받는 병통입니다. 오늘은 R 과 R 스튜디오에 대해 설명 드릴려고 해요 저도 처음 접하는 프로그램인 만큼 오늘 설치와 간단한 설명을 한 다음 저도 다음주 수업을 듣고 바로 업로드 할 예정입니다 R 이란 데이터를 분석하는데 사용되는 소프트웨어 입니다. 최근에 R의 사용이 늘어남으로 데이터의 다양성이 늘어나고 양도 많아졌기 때문에 R 하나만 잘 다루면 어떤 형태의 데이터를 지유롭게 분석할 수 있다고 해요! 지도 시각화. 주식 분석. SNS분석, 이미지 와 사운드 분석은 물론 웹 애플리케이션 개 등등 많은곳에 사용이 가능하다고 합니다. 최근에는 연구자들 사이에서도 많은 사용이 일어나고 있다고 해요! 다른 분석 프로그램은 하락하는 반면 황금색의 R은 점점 늘어나는 추세를 보여주고 있어요 프로..

R 데이터 분석 2020.03.23