티스토리 뷰

 

웹 페이지 내부 하이퍼링크 전부 크롤링 하는 코드

from urllib.request import urlopen
from bs4 import BeautifulSoup

html = urlopen('https://www.naver.com')
bs = BeautifulSoup(html, 'html.parser')
for link in bs.findAll('a'):
if 'href' in link.attrs:
print(link.attrs['href'])

 

댓글