정보보안 관련 정보공유

티스토리 뷰

[Python]

[Python] 웹페이지 하이퍼링크 전부 크롤링

carmoon 2021. 5. 13. 18:14

웹 페이지 내부 하이퍼링크 전부 크롤링 하는 코드

from urllib.request import urlopen
from bs4 import BeautifulSoup

html = urlopen('https://www.naver.com')
bs = BeautifulSoup(html, 'html.parser')
for link in bs.findAll('a'):
if 'href' in link.attrs:
print(link.attrs['href'])

저작자표시 비영리 변경금지 (새창열림)

'[Python]' 카테고리의 다른 글

파이썬 Selenium 브라우저 새로고침 방법 (0)	2021.05.13
[Python] 새로고침 후 자동으로 장바구니 담기 (0)	2021.05.13
[Python] 3줄로 웹 페이지 크롤링 하기 (0)	2021.05.13
Data Science Tool (0)	2021.04.12
Best Code Editors Tool (0)	2021.04.12

공지사항

최근에 올라온 글

최근에 달린 댓글

Total

Today

Yesterday

링크

울지않는벌새 : Security, Movie & Soc…
Ec0nomist's Lab. :: Ec0nomist'…
바이러스 제로 시즌 2
알약공식블로그
AhnLab ASEC | Threat & Researc…
잉카인터넷 공식 블로그
SecurityFactory
해피용's 블로그

TAG more

« 2026/07 »
일	월	화	수	목	금	토
			1	2	3	4
5	6	7	8	9	10	11
12	13	14	15	16	17	18
19	20	21	22	23	24	25
26	27	28	29	30	31

글 보관함

Zero Security

티스토리 뷰

[Python] 웹페이지 하이퍼링크 전부 크롤링

'[Python]' 카테고리의 다른 글

티스토리툴바