크롤링 연습 2. 실시간 검색어

python2019. 12. 19. 23:11

크롤링 연습 2. 실시간 검색어

크롬에서 F12 키 또는 Ctrl+Shift+i 를 입력하면 개발자 모드를 통해

원하는 링크의 html 태그 부분을 쉽게 확인 가능하며, attrs 및 class 또는 id를 활용하여 target을 추출할 수 있으면 충분하다.

#다음 실시간 검색어 받아오기
import requests
 
from bs4 import BeautifulSoup
 
html = requests.get('https://www.naver.com/')
 
soup = BeautifulSoup(html.content, "html.parser")
#data = soup.find('title')
 
#print(data.get_text())
#data = soup.find('h3',id="articleTitle")
#data = soup.find('p', attrs = { 'class':'head_channel_layer'})
data_list = soup.find_all('a', attrs={'class':"link_issue", 'tabindex':'-1'})
 
 
 
#print(data.string)
for data in set(data_list) :
    print(data.get_text())

#네이버 실시간 검색어 받아오기
import requests
from bs4 import BeautifulSoup
 
html = requests.get('https://www.naver.com')
soup = BeautifulSoup(html.content, "html.parser")
 
rank_list = soup.find('div',"ah_roll_area PM_CL_realtimeKeyword_rolling")
#결과물에 다시 find를 사용 가능함.
item_list = rank_list.find_all('li',"ah_item")
 
for d in item_list:
        text = d.get_text().strip().split()
        print(text[0],"위 : ",text[1])

'python' 카테고리의 다른 글

크롤링 연습 4. 순위 가져오기 (0)	2019.12.24
크롤링 연습 3. select (0)	2019.12.22
크롤링 연습 1. find, find_all (0)	2019.12.17
출력 format 예제 (0)	2019.12.08
jupyter note login token 확인 방법 (0)	2019.12.07

Posted by easy16

일	월	화	수	목	금	토
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

내 블로그 - 관리자 홈 전환	`Q` `Q`
새 글 쓰기	`W` `W`

글 수정 (권한 있는 경우)	`E` `E`
댓글 영역으로 이동	`C` `C`

이 페이지의 URL 복사	`S` `S`
맨 위로 이동	`T` `T`
티스토리 홈 이동	`H` `H`
단축키 안내	`Shift` + `/` `⇧` + `/`

easy blog

크롤링 연습 2. 실시간 검색어

'python' 카테고리의 다른 글

카테고리

공지사항

태그목록

최근에 올라온 글

최근에 달린 댓글

글 보관함

달력

링크

티스토리툴바

단축키

내 블로그

블로그 게시글

모든 영역