본문 바로가기
파이썬

파이썬 텍스트 만 스크랩하는 방법?

by º기록 2020. 9. 13.
반응형

코드 :

import scrapy

class BlogSpider(scrapy.Spider):
    name = 'bijouterie'
    start_urls = ['https://www.example.com']

    def parse(self, response):
        for post in response.css('#engine-results .drs'):
            yield {'title': post.css('a.moodalbox.response').get()}

명령 실행 (Windows 10) :

scrapy runspider C : \ Users \ DELL \ Desktop \ icscrap \ bijouterie.py -o posts.csv


전체 html 클래스 코드가 아닌 텍스트 만 긁어 내고 싶습니다.

 

해결 방법

 

css 선택기 끝에 (:: text)를 추가하십시오.

{ 'title': post.css ( 'a.moodalbox.response :: text'). get ()}

 

참조 페이지 https://stackoverflow.com/questions/63757338

 

 

반응형

댓글