"뷰티플 수프"의 두 판 사이의 차이

3번째 줄: 3번째 줄:
;뷰티풀 수프
;뷰티풀 수프
* HTML과 XML 문서를 파싱하는 파이썬 패키지
* HTML과 XML 문서를 파싱하는 파이썬 패키지
* 잘못 쓴 태그, 안닫힌 태그 등 소위 '[[태그 수프]]'를 잘 처리할 수 있다.


[[파일:bs4-doc-image-6.1.jpg]]
[[파일:bs4-doc-image-6.1.jpg]]
17번째 줄: 18번째 줄:


==같이 보기==
==같이 보기==
* [[lxml]]
* [[Selenium]]
* [[Selenium]]
* [[lxml]]
* [[태그 수프]]


==참고==
==참고==

2019년 12월 11일 (수) 23:22 판

1 개요

Beautiful Soup
뷰티풀 수프
  • HTML과 XML 문서를 파싱하는 파이썬 패키지
  • 잘못 쓴 태그, 안닫힌 태그 등 소위 '태그 수프'를 잘 처리할 수 있다.

Bs4-doc-image-6.1.jpg

from bs4 import BeautifulSoup
from urllib.request import urlopen

with urlopen('https://en.wikipedia.org/wiki/Main_Page') as response:
    soup = BeautifulSoup(response, 'html.parser')
    for anchor in soup.find_all('a'):
        print(anchor.get('href', '/'))

2 같이 보기

3 참고