본문 바로가기

Html parsing - beautifulsoup4 (find all elements using attribute) 아래 포스팅들에서 이어집니다. :-) 2016/08/21 - Html parsing - beautifulsoup4 (child element) 2016/08/21 - Html parsing - beautifulsoup4 (find_all image src) 2016/08/20 - Html parsing - beautifulsoup4 (install) 위 포스팅들을 보면 주로 find_all 에서 class 이름으로 elements를 찾는데요. 전 이게 일반적이라고 봅니다. 대부분의 사이트에서는 class 이름만으로 찾기가 가능하다고 생각하거든요. 이번 포스팅에서는 class가 아니라 다른 attribute를 활용해서 elements를 찾는 것에 대해서 작성해둡니다. 이 포스팅 내용은 아래 URL에서도 찾.. 더보기
Html parsing - beautifulsoup4 (child element) 이전 글 :) 2016/08/20 - [Python/libraries] - Html parsing - beautifulsoup4 (install)2016/08/21 - [Python/libraries] - Html parsing - beautifulsoup4 (find_all image src) 이번에는 특정 element의 child element의 값을 얻는 과정을 간단하게 작성해두려고 합니다. 먼저 사용하려는 웹 소스는 제 블로그이구요. http://ngee.tistory.com 현재 여러분은 이 글을 읽고 있다면 접속하신 상태겠군요 !!!아무튼 왼쪽에 카테고리가 보이는데 이걸 파싱해보겠습니다. 소스를 보니 하위에 li로 구성되어있네요. (빨간색으로 표시된 부분) 이렇게 해보려고 합니다. 1. 를 .. 더보기
Html parsing - beautifulsoup4 (find_all image src) 이전 글 :) 2016/08/20 - [Python/libraries] - Html parsing - beautifulsoup4 (install) 이번에는 간단한 예제로 Beautifulsoup4 에서 제공되는 find_all을 알아보도록 하겠습니다 !!! find_all 이라는 함수는 이름에서도 알 수 있듯이 동일한 것을 모두 찾아주는 함수입니다. 자세한 설명은 https://www.crummy.com/software/BeautifulSoup/bs4/doc/#find-all 을 참고하세요 :) https://www.crummy.com/software/BeautifulSoup/bs4/doc/#find-all 실제 웹 페이지를 통해서 한 번 find_all이 어떤 역할을 할 수 있는지 알아보아요. 만만한건.. 더보기