파이썬 파싱에서 요청 URL을 가져옵니다.

Scrapy의 parse () 함수에서 요청 URL을 어떻게 얻을 수 있습니까? start_urls 에 많은 URL이 있으며 그중 일부는 거미를 홈페이지로 리디렉션하고 결과적으로 빈 항목이 있습니다. 따라서 이러한 URL을 저장하려면 item [ 'start_url'] = request.url 과 같은 것이 필요합니다. BaseSpider를 사용하고 있습니다.

해결 방법

parse ()에 전달 된 'response'변수에는 원하는 정보가 있습니다. 아무것도 재정의 할 필요가 없습니다.

예. (편집 됨)

def parse(self, response):
    print "URL: " + response.request.url

참조 페이지 https://stackoverflow.com/questions/20081024

'파이썬' 카테고리의 다른 글

파이썬 Pandas 데이터 프레임은 각 그룹의 첫 번째 행을 가져옵니다. (0)	2020.12.31
파이썬 키 값을 사용하고 해당 값이없는 Python에서 사전 초기화 (0)	2020.12.31
파이썬 Mac OS X에서 Python 3 용 pip를 설치하는 방법은 무엇입니까? (0)	2020.12.30
파이썬 IndexError : 튜플 인덱스가 범위를 벗어남 ----- Python (0)	2020.12.30
파이썬 Pandas 데이터 프레임에서 열 수를 검색하려면 어떻게해야합니까? (0)	2020.12.30

프로그램 샘플 소스

파이썬 파싱에서 요청 URL을 가져옵니다.

해결 방법

'파이썬' 카테고리의 다른 글

댓글

티스토리툴바

파이썬 파싱에서 요청 URL을 가져옵니다.

해결 방법

'파이썬' 카테고리의 다른 글

관련글

댓글

티스토리툴바