이전 글 :)


2016/08/20 - [Python/libraries] - Html parsing - beautifulsoup4 (install)





이번에는 간단한 예제로  


Beautifulsoup4 에서 제공되는 find_all을 알아보도록 하겠습니다 !!!




find_all 이라는 함수는 이름에서도 알 수 있듯이 동일한 것을 모두 찾아주는 함수입니다. 

자세한 설명은 https://www.crummy.com/software/BeautifulSoup/bs4/doc/#find-all  을 참고하세요 :)


https://www.crummy.com/software/BeautifulSoup/bs4/doc/#find-all



실제 웹 페이지를 통해서 한 번 find_all이 어떤 역할을 할 수 있는지 알아보아요.


만만한건 제 블로그이니 http://ngee.tistory.com/ 에서 find_all을 실습해보겠습니다.




line 24 를 보시면 find_all  함수를 통해 img 라는 태그를 모두 찾아요.

for 문안에 위치하기 때문에 찾아진 img 태그 각각은 img라는 변수에 들어가고

25번째 라인에서 get("src") 라는 함수를 통해 src 속성값을 뽑아온 것이 되겠습니다.


12~14 라인에 웹 페이지 주소를 작성하면 됩니다.

작성된 모든 웹 페이지를 돌면서 img에 대한 주소를 가져오게되겠죠? 


아래는 출력결과에요 :)










  1. 2016.08.22 13:48

    비밀댓글입니다

+ Recent posts