[소스코드]
import urllib.request import bs4 url = "http://news.naver.com/"html = urllib.request.urlopen(url) bs_obj = bs4.BeautifulSoup(html, "html.parser") newsnow_txarea = bs_obj.find("ul",{"class":"newsnow_txarea"}) #print(bs_obj)#print(newsnow_txarea) #headline2 = bs_obj.find("ul",{"class":"newsnow_txarea"})#print(headline2) lis = newsnow_txarea.findAll("li") #print(lis) for li in lis: strong = li.find("strong") print(strong.text)
[결과] -> 결과는 매번 바뀔 수 있음(네이버 뉴스 헤드라인 최신 항목 표시함)
北김혁철·최강일 베이징 도착…북미 의제협의 재개 임박 UAE 왕세제 26일 공식 방한…文대통령과 정상회담 속도 올리는 미중 무역담판…이번주 타결여부 결정날듯 "카드수수료 개편, 가맹점 연간 부담 8000억원 줄었다" 오후 늦게 눈·비 그쳐…오늘 밤 구름 사이로 '슈퍼문' 볼 듯
웹 크롤링 파이썬 3
Reviewed by kukanuc
on
2월 18, 2019
Rating:
댓글 없음: