반응형
코드 :
import scrapy
class BlogSpider(scrapy.Spider):
name = 'bijouterie'
start_urls = ['https://www.example.com']
def parse(self, response):
for post in response.css('#engine-results .drs'):
yield {'title': post.css('a.moodalbox.response').get()}
명령 실행 (Windows 10) :
scrapy runspider C : \ Users \ DELL \ Desktop \ icscrap \ bijouterie.py -o posts.csv
전체 html 클래스 코드가 아닌 텍스트 만 긁어 내고 싶습니다.
해결 방법
css 선택기 끝에 (:: text)를 추가하십시오.
{ 'title': post.css ( 'a.moodalbox.response :: text'). get ()}
참조 페이지 https://stackoverflow.com/questions/63757338
반응형
'파이썬' 카테고리의 다른 글
파이썬 Python3 웹 페이지에서 전체 텍스트를 얻지 못함 (0) | 2020.09.13 |
---|---|
파이썬 목록이 비어 있어서는 안됩니다. (0) | 2020.09.13 |
파이썬 Qt 디자이너에서 창 최대화 (0) | 2020.09.13 |
파이썬에서 튜플 목록을 튜플 목록으로 병합하는 방법 (0) | 2020.09.13 |
파이썬 모든 열의 모든 값 수에 대한 히트 맵 (0) | 2020.09.13 |
댓글