R 데이터 분석

엑셀 중 원하는 부분만 끌어와서 시각화 자료 만들기

병통 2022. 1. 14. 11:15

DATA_1 <- read_xlsx("ㅇㅇ 핵심 키워드 종합.xlsx", range = "A2:C102")
DATA_2 <- read_xlsx("ㅇㅇ 핵심 키워드 종합.xlsx", range = "E2:G102")
DATA_3 <- read_xlsx("ㅇㅇ 핵심 키워드 종합.xlsx", range = "I2:K102")

bind_rows(
  head(DATA_1,70) %>% mutate(method = "extraNoun"),
  head(DATA_2,70) %>% mutate(method = "SimplePos09"),
  head(DATA_3,70) %>% mutate(method = "SimplePos22")
) %>% 
  ggplot(aes(x = reorder(Var1, Freq), y = Freq, fill = method)) +
  geom_bar(stat = "identity", colour = "red") +
  facet_wrap(~ method, nrow = 1, scales = "free") +
  coord_flip() +
  labs(x = "Words", y = "Freq")

 

같은 내용을 R에서 명사추출로 가장 많이 사용하는 extractNoun, SimplePos를 활용하여 
추출 결과가 어떻게 다른지 살펴볼 수 있는 시각화 자료 생성 가능 코드