[Python] 크롤링 HTTP Forbidden 403 문제 해결

 


코드에는 문제가 없는데 HTTP 403 Forbidden이 발생하길래..

검색해보니까 서버사이드에서 저 같은 불법 크롤러를 거르는 메쏘드가 있는 모양입니다.


아래의 링크를 참고해서 해결했습니다



urllib에서 Request를 import 해줘야합니다.

1
2
3
4
def hellenicshipping():
    url = Request("https://www.hellenicshippingnews.com/category/shipping-news/dry-bulk-market",headers={'User-Agent''Mozilla/5.0'})
    html = urlopen(url)
    savefile = './hsn.txt'
cs

댓글

이 블로그의 인기 게시물

(Node.js) XLSX로 결과 출력하기 / 모듈 디자인 Exporting / Node.js modular design

(VBA) 009 - 닫힌 파일에서 데이터 읽어오기 (ExecuteExcel4Macro)

(Node.js) EUC-KR을 Cheerio - Iconv-lite로 불러올 때