python2019. 12. 19. 23:11

크롬에서 F12 키 또는 Ctrl+Shift+i 를 입력하면 개발자 모드를 통해 

원하는 링크의 html 태그 부분을 쉽게 확인 가능하며, attrs 및 class 또는 id를 활용하여 target을 추출할 수 있으면 충분하다.

 

 
#다음 실시간 검색어 받아오기
import requests

from bs4 import BeautifulSoup

html = requests.get('https://www.naver.com/')

soup = BeautifulSoup(html.content, "html.parser")
#data = soup.find('title')

#print(data.get_text())
#data = soup.find('h3',id="articleTitle")
#data = soup.find('p', attrs = { 'class':'head_channel_layer'})
data_list = soup.find_all('a', attrs={'class':"link_issue", 'tabindex':'-1'})



#print(data.string)
for data in set(data_list) :
    print(data.get_text())

 

 

 


#네이버 실시간 검색어 받아오기
import requests
from bs4 import BeautifulSoup

html = requests.get('https://www.naver.com')
soup = BeautifulSoup(html.content, "html.parser")

rank_list = soup.find('div',"ah_roll_area PM_CL_realtimeKeyword_rolling")
#결과물에 다시 find를 사용 가능함.
item_list = rank_list.find_all('li',"ah_item")

for d in item_list:
        text = d.get_text().strip().split()
        print(text[0],"위 : ",text[1])


'python' 카테고리의 다른 글

크롤링 연습 4. 순위 가져오기  (0) 2019.12.24
크롤링 연습 3. select  (0) 2019.12.22
크롤링 연습 1. find, find_all  (0) 2019.12.17
출력 format 예제  (0) 2019.12.08
jupyter note login token 확인 방법  (0) 2019.12.07
Posted by easy16