Stack Building

실시간 검색어 크롤링 본문

R

실시간 검색어 크롤링

S00ahKim 2019. 3. 17. 13:00

크롤링 특강 정리를 이제야 하기 시작한다.





코드 statistical-analysis-with-R/크롤링/실시간 검색어 크롤링.R




[3] rvest 패키지가 필요하기 때문에 필요할 경우 인스톨한다.

[5] 원하는 웹사이트의 url을 변수로 받는다.

[6] 해당 url의 html을 읽어온다. 네이버는 utf-8로 인코딩된 사이트다.

[7] 실검에 해당하는 태그가 span.ah_k라서 해당 노드를 읽어와서 텍스트화한다.

이때, 해당하는 태그를 알고 싶다면 크롬의 개발자 도구를 이용하는 것이 편리

[8] 1위부터 20위까지의 검색어를 인덱싱한다.







오늘의 실검 상황.

'R' 카테고리의 다른 글

블로그 게시물 제목 크롤링  (0) 2019.03.29
이미지 크롤링  (0) 2019.03.27
R 정규표현식 연습  (0) 2019.03.08
R 정규표현식 만들기  (0) 2019.03.08
R 정규표현식 기초  (0) 2019.03.07
Comments