반응형
이 두 가지 기능을 가진 스크립트가 있습니다.
# Getting content of each page
def GetContent(url):
response = requests.get(url)
return response.content
# Extracting the sites
def CiteParser(content):
soup = BeautifulSoup(content)
print "---> site #: ",len(soup('cite'))
result = []
for cite in soup.find_all('cite'):
result.append(cite.string.split('/')[0])
return result
프로그램을 실행할 때 다음과 같은 오류가 발생합니다.
result.append(cite.string.split('/')[0])
AttributeError: 'NoneType' object has no attribute 'split'
출력 샘플 :
URL: <URL That I use to search 'can be google, bing, etc'>
---> site #: 10
site1.com
.
.
.
site10.com
URL: <URL That I use to search 'can be google, bing, etc'>
File "python.py", line 49, in CiteParser
result.append(cite.string.split('/')[0])
AttributeError: 'NoneType' object has no attribute 'split'
해결 방법
문자열 내부에 "None"유형보다 아무것도없는 경우가 발생할 수 있으므로 문자열이 "None"이 아닌지 먼저 확인하는 것이 좋습니다.
# Extracting the sites
def CiteParser(content):
soup = BeautifulSoup(content)
#print soup
print "---> site #: ",len(soup('cite'))
result = []
for cite in soup.find_all('cite'):
if cite.string is not None:
result.append(cite.string.split('/'))
print cite
return result
참조 페이지 https://stackoverflow.com/questions/25882670
반응형
'파이썬' 카테고리의 다른 글
파이썬 Turn off axes in subplots (0) | 2020.12.09 |
---|---|
파이썬 Python urllib urlopen이 작동하지 않습니다. (0) | 2020.12.09 |
파이썬 팬더 : 다른 이름으로 필드에서 DataFrames를 결합 하시겠습니까? (0) | 2020.12.08 |
파이썬 내 날짜가 문자열 인 경우 Python에서이 목록을 어떻게 정렬합니까? (0) | 2020.12.08 |
파이썬 python sys.exit가 try에서 작동하지 않습니다. (0) | 2020.12.08 |
댓글