Stack Building

이미지 크롤링 본문

R

이미지 크롤링

S00ahKim 2019. 3. 27. 09:35



[4]-[7] 필요한 패키지 부착

[10] 크롤링을 해올 url을 지정한다.

[12] 일반적으로 url은 검색어 쿼리가 부착된 형태이므로, 찾고자 하는 쿼리를 지정하여 url string을 만드는 방법도 있다.






[16] url의 html을 읽어온다.
[17] html의 a 태그 아래의 노드를 읽어 저장한다.

[19] 이미지 태그의 패턴. (정규표현식 참고)

[20] 패턴에 해당하는 노드만 필터링한다.

[22]-[24] 이미지 태그의 하이퍼링크를 필터링한다.

[26]-[27] 이미지가 저장될 디렉토리를 확인하고 원하는 곳과 다를 경우 워킹 디렉토리를 설정한다.

[28] 두 번째 링크에 해당하는 파일을 다운로드한다.

[30]-[32] 하이퍼링크 갯수만큼의 이미지를 특정 이름 형식으로 다운로드한다.





강아지 이미지 크롤링 예제였기 때문에




귀여운 강아지들 이미지가 다운로드된 것을 확인할 수 있다! (일부 없는 사진은 캡처에서 잘린 것)





소스코드 확인하기 statistical-analysis-with-R/크롤링/이미지 크롤링.R

'R' 카테고리의 다른 글

블로그 게시물 제목 크롤링  (0) 2019.03.29
실시간 검색어 크롤링  (0) 2019.03.17
R 정규표현식 연습  (0) 2019.03.08
R 정규표현식 만들기  (0) 2019.03.08
R 정규표현식 기초  (0) 2019.03.07
Comments