Stack Building
실시간 검색어 크롤링 본문
크롤링 특강 정리를 이제야 하기 시작한다.
코드 statistical-analysis-with-R/크롤링/실시간 검색어 크롤링.R
[3] rvest 패키지가 필요하기 때문에 필요할 경우 인스톨한다.
[5] 원하는 웹사이트의 url을 변수로 받는다.
[6] 해당 url의 html을 읽어온다. 네이버는 utf-8로 인코딩된 사이트다.
[7] 실검에 해당하는 태그가 span.ah_k라서 해당 노드를 읽어와서 텍스트화한다.
이때, 해당하는 태그를 알고 싶다면 크롬의 개발자 도구를 이용하는 것이 편리
[8] 1위부터 20위까지의 검색어를 인덱싱한다.
오늘의 실검 상황.
'R' 카테고리의 다른 글
블로그 게시물 제목 크롤링 (0) | 2019.03.29 |
---|---|
이미지 크롤링 (0) | 2019.03.27 |
R 정규표현식 연습 (0) | 2019.03.08 |
R 정규표현식 만들기 (0) | 2019.03.08 |
R 정규표현식 기초 (0) | 2019.03.07 |
Comments