Stack Building
이미지 크롤링 본문
[4]-[7] 필요한 패키지 부착
[10] 크롤링을 해올 url을 지정한다.
[12] 일반적으로 url은 검색어 쿼리가 부착된 형태이므로, 찾고자 하는 쿼리를 지정하여 url string을 만드는 방법도 있다.
[16] url의 html을 읽어온다.
[17] html의 a 태그 아래의 노드를 읽어 저장한다.
[19] 이미지 태그의 패턴. (정규표현식 참고)
[20] 패턴에 해당하는 노드만 필터링한다.
[22]-[24] 이미지 태그의 하이퍼링크를 필터링한다.
[26]-[27] 이미지가 저장될 디렉토리를 확인하고 원하는 곳과 다를 경우 워킹 디렉토리를 설정한다.
[28] 두 번째 링크에 해당하는 파일을 다운로드한다.
[30]-[32] 하이퍼링크 갯수만큼의 이미지를 특정 이름 형식으로 다운로드한다.
강아지 이미지 크롤링 예제였기 때문에
귀여운 강아지들 이미지가 다운로드된 것을 확인할 수 있다! (일부 없는 사진은 캡처에서 잘린 것)
'R' 카테고리의 다른 글
블로그 게시물 제목 크롤링 (0) | 2019.03.29 |
---|---|
실시간 검색어 크롤링 (0) | 2019.03.17 |
R 정규표현식 연습 (0) | 2019.03.08 |
R 정규표현식 만들기 (0) | 2019.03.08 |
R 정규표현식 기초 (0) | 2019.03.07 |
Comments