반응형
Scrapy의 parse ()
함수에서 요청 URL을 어떻게 얻을 수 있습니까? start_urls
에 많은 URL이 있으며 그중 일부는 거미를 홈페이지로 리디렉션하고 결과적으로 빈 항목이 있습니다. 따라서 이러한 URL을 저장하려면 item [ 'start_url'] = request.url
과 같은 것이 필요합니다. BaseSpider를 사용하고 있습니다.
해결 방법
parse ()에 전달 된 'response'변수에는 원하는 정보가 있습니다. 아무것도 재정의 할 필요가 없습니다.
예. (편집 됨)
def parse(self, response):
print "URL: " + response.request.url
참조 페이지 https://stackoverflow.com/questions/20081024
반응형
'파이썬' 카테고리의 다른 글
파이썬 Pandas 데이터 프레임은 각 그룹의 첫 번째 행을 가져옵니다. (0) | 2020.12.31 |
---|---|
파이썬 키 값을 사용하고 해당 값이없는 Python에서 사전 초기화 (0) | 2020.12.31 |
파이썬 Mac OS X에서 Python 3 용 pip를 설치하는 방법은 무엇입니까? (0) | 2020.12.30 |
파이썬 IndexError : 튜플 인덱스가 범위를 벗어남 ----- Python (0) | 2020.12.30 |
파이썬 Pandas 데이터 프레임에서 열 수를 검색하려면 어떻게해야합니까? (0) | 2020.12.30 |
댓글