분류 전체보기 19

무역 용어 정리 (수입, 수출, 선적, 항송)

무역 회사에서 근무 중입니다만, 제 전공은 무역이 아닙니다... 그렇기에 사소한 업무 하나하나 파악하기가 너무 어려운 상황입니다. 그래서 제가 자주 쓰는 단어와 용어들을 계속해서 추가해나가며 해당 게시글을 진행해나갈 예정입니다. 해당 게시글이 저 뿐만 아니라 많은 비전공자들에게 많은 도움이 되었으면 좋겠습니다. ETD (Estimated Time of Departure): 출발 예정 시간을 나타냅니다. (부산항에서 출발하는 시간) ETA (Estimated Time of Arrival): 도착 예정 시간을 나타냅니다. (배가 도착하는 시간) FOB (Free On Board): 판매자는 제품을 선적 항구에 배치하고, 운송비용은 구매자가 부담하는 무역 조건입니다. 제가 담당하는 곳은 특별한 상황이 아니라면..

무역업무 2023.10.01

파이썬 셀리니움 크롬드라이버 버전 오류 (맥북)

셀리니움을 사용하려면 크롬드라이버를 필히 설치해야하며 버전에 맞는 파일을 사용해야한다는 사실은 누구나 알고 있는 사실이다. 크롬 드라이버를 내가 사용하고 있는 크롬 버전과 동일한 것으로 다운받는다. 크롬 오른쪽 상단 "점 세개" 클릭 -> 가장 하단의 "도움말" -> "chrome정보" 클릭하여 본인의 크롬 버전 확인 크롬 버전 다운받기 -> https://chromedriver.chromium.org/downloads ChromeDriver - WebDriver for Chrome - Downloads Current Releases If you are using Chrome version 102, please download ChromeDriver 102.0.5005.27 If you are using..

셀레니움을 활용한 네이버 블로그 크롤링

나는 "코로나"와 관련된 게시글을 크롤링할거다 네이버는 참 복잡하다 일을 하면서 모든 데이터를 확인하기 위해 크롤링 코드를 이제 공부하는 나도 참 답답하지만 어쩔 수 없다. 이렇게 된 이상 셀레니움의 모든 것을 공부하고 싶어진다. 네이버 블로그 페이지를 기본값으로 놔두고 내가 찾고자하는 키워드를 word 변수에 저장하여 실행할때마다 간편하게 사용할 수 있게 구축했다. word = "코로나" page_url = "https://section.blog.naver.com/Search/Post.naver?pageNo=1&rangeType=ALL&orderBy=sim&keyword=" + word wb = Workbook(write_only=True) ws = wb.create_sheet() driver = we..

카테고리 없음 2022.02.12

파이썬 네이버 뉴스 크롤링 및 엑셀 저장

필요한 라이브러리 불러오기 from bs4 import BeautifulSoup import requests import pandas as pd 나는 "코로나" 와 관련된 뉴스 기사를 검색할 것이며 5페이지까지 추출할 것이다. word = "코로나" page = 5 urls = [] for i in range (1,page + 1): if i == 1: page_num = 1 url = "https://search.naver.com/search.naver?where=news&sm=tab_pge&query=" + word + "&start=" + str(page_num) urls.append(url) else: page_num = ((i-1) * 10) + 1 url = "https://search.nav..

엑셀 중 원하는 부분만 끌어와서 시각화 자료 만들기

DATA_1 % mutate(method = "SimplePos22") ) %>% ggplot(aes(x = reorder(Var1, Freq), y = Freq, fill = method)) + geom_bar(stat = "identity", colour = "red") + facet_wrap(~ method, nrow = 1, scales = "free") + coord_flip() + labs(x = "Words", y = "Freq") 같은 내용을 R에서 명사추출로 가장 많이 사용하는 extractNoun, SimplePos를 활용하여 추출 결과가 어떻게 다른지 살펴볼 수 있는 시각화 자료 생성 가능 코드

R 데이터 분석 2022.01.14

파이썬 크롤링 코드

파이썬을 활용한 크롤링 코드 html을 가져와서 필요한 부분 추출 진행 중 21.12.28 #네이버 블로그 제목 크롤링 소스 from bs4 import BeautifulSoup import requests pageurl = requests.get('https://blog.naver.com/dorothy2648/222579385478') type(pageurl) soup = BeautifulSoup(pageurl.content, 'html.parser') type(soup) result = soup.find_all(attrs = {'class':'se-main-container'}) for i in result: print(i.get_text()) print(i.attrs['href']) 해당 부분 실행..

결측치, 이상치, 그리고 상관관계 분석

이때까지 제가 했던 분석의 대부분은 데이터 수집(크롤링) -> 데이터 분석 -> 시각화 의 과정을 거쳐왔습니다. 하지만 프로젝트를 진행하면서 용어에 대한 지식 자체가 부족했고 사람들과 의사소통을 넘어 간단한 논문 내용 조차, 통계 분석 결과 조차 해석 하기 어려웠습니다. 그렇기에 앞으로 공부와 복습을 위해 단어 및 공부 내용을 정의와 함께 간단하게 살펴보는 게시글을 올리게 되었습니다. 저는 R을 기반으로 공부하기 때문에 하단에 정의와 함께 게시된 코드는 R 코드 기반입니다. 1. 결측치 결측치는 NA, 즉 비어있는 값 입니다.. 데이터를 전처리할 때 결측값을 제거하는 일이 종종 있었습니다. 결측치가 포함된 채 분석을 진행했을 때 분석 결과가 완전 다른 결과를 도출하거나, 도출 되지 않을 수도 있기에 결측..

R 데이터 분석 2021.08.22

(UIPATH, R) 부동산과 관련된 국민들의 의견 수집 및 분석을 통해 도출한 감정 분석 및 추후 부동산 정책 예측

안녕하세요 병통입니다. 이번 프로젝트는 UIPATH와 R을 활용하여 워드클라우드를 제작해보고 그 결과로 감정분석을 해보는 프로젝트를 진행하보았습니다. 전체적인 과정을 요약하자면 두 가지의 분석 과정을 진행했습니다. 첫번째로는 UIPATH를 활용하여 유튜브 댓글을 크롤링하고 크롤링 한 댓글을 워드클라우드로 만든 뒤, 워드 클라우드를 바탕으로 감정분석을 해보았으며, 두번쨰로는 R을 활용하여 뉴스 기사 내용을 크롤링하고 크롤링 된 뉴스 기사를 워드 클라우드로 만든 뒤, 워드 클라우드를 바탕으로 감정분석을 해보았습니다. 주제는 2021년 가장 핫한 주제 중 하나였던 부동산 을 선택하여 진행하였습니다. 정치적인 이야기를 하고자하는 것이 아닌, 국민들의 대부분의 정서를 파악하고 20대의 입장에서 생각해 본 앞으로의..

웹 크롤링

웹 크롤링 기초 과정입니다. 제가 제일 처음 배웠던 웹 크롤링으로써 처음 체험하는데 가장 좋은 예시가 될 수 있을 것 같아 글을 적게 되었습니다. 파란색으로 남긴 글이 코드이기에 본 게시글을 보시면서 파란글을 R studio에 붙여넣기 하시면 이해가 더 쉽게 될 것입니다. 게시글 시작하겠습니다 ! library(rvest) #크롤링을 위한 라이브러리 크롤링만 진행할 것이기에 rvest만 있어도 충분히 크롤링이 가능합니다. 필요한 라이브러리 기입입니다. 전처리 내용을 워드클라우드까지 제작해 보는 것을 목표로 진행하였습니다. 지금 블로그 글에서는 크롤링까지 진행해보겠습니다. 처음에는 다음 뉴스 기사 크롤링입니다. 많은 분들이 시도하였고 좋은 예시라고 생각하기에 제일 먼저 이 방법을 선택하여 진행하였습니다. ..

R 데이터 분석 2021.08.19