[Python]

[Python] 3줄로 웹 페이지 크롤링 하기

carmoon 2021. 5. 13. 13:00

1. Pycharm 설치(community edition)

- pycharm 설치 시 환경변수에 등록 체크

www.jetbrains.com/ko-kr/pycharm/download/#section=windows

 

다운로드 PyCharm: JetBrains가 만든 전문 개발자용 Python IDE

 

www.jetbrains.com

 

2. pycharm 설치 시 환경변수에 등록 체크 안했을 시 수동등록

(환경변수 등록 예시)

C:\Users\karl\AppData\Local\Programs\Python\Python38\Scripts\;C:\Users\karl\AppData\Local\Programs\Python\Python38\;

 

3. cmd -> 'pip install urlopen' 명령 실행

4. Pycharm 실행 후 파이썬 코드 3줄 입력

from urllib.request import urlopen
html = urlopen("http://www.google.com")
print(html.read())

5. 'Run' 실행 -> 출력 창에 결과값 확인

6. 복사 후 html 파일로 저장 -> 브라우저에서 실행