크롤링 연습 5. urllib 사용 및 게시판 글 리스트 모두 가져오기

python2019. 12. 25. 20:43

크롤링 연습 5. urllib 사용 및 게시판 글 리스트 모두 가져오기

 
#urllib 사용법
#requests를 사용할 때, encoding 관련 에러가 발생하면 아래의 urllib을 사용해보도록.

from urllib.request import urlopen
from bs4 import BeautifulSoup


res = urlopen('https://seeko.earlyadopter.co.kr/bbs/board.php?bo_table=mainnews')
#print(type(res))
soup = BeautifulSoup(res, 'html.parser')

data = soup.find_all('a','item-subject')
for item in item_list:
    l1 = item.get_text().strip('\t\n31').split('\n')
    print(l1)

 
#게시판의 여러 페이지 읽어오기

#1 페이지
#https://seeko.earlyadopter.co.kr/bbs/board.php?bo_table=buysell&page=1
#2 페이지
#https://seeko.earlyadopter.co.kr/bbs/board.php?bo_table=buysell&page=2
#3 페이지
#https://seeko.earlyadopter.co.kr/bbs/board.php?bo_table=buysell&page=3

#링크에 대한 규칙을 파악



import requests
from bs4 import BeautifulSoup


for page in range(20, 1,-1):
    site = 'https://seeko.earlyadopter.co.kr/bbs/board.php?bo_table=buysell&page='+str(page)
    #print(site)
    
    res = requests.get(site)
    soup = BeautifulSoup(res.content, 'html.parser')

    item_list = soup.find_all('a','item-subject')
    print('====start page : '+str(page)+'====')
    for item in item_list:
        l1 = item.get_text().strip('\r\t\n123').split('\n')
        print(l1)
        #print(l1 ,'item')
    print('====end page '+str(page)+'====')

'python' 카테고리의 다른 글

크롤링 연습 7. open API test (0)	2019.12.26
크롤링 연습 6. openpyxl 이용 웹 데이터 저장 (0)	2019.12.25
크롤링 연습 4. 순위 가져오기 (0)	2019.12.24
크롤링 연습 3. select (0)	2019.12.22
크롤링 연습 2. 실시간 검색어 (0)	2019.12.19

Posted by easy16

일	월	화	수	목	금	토
						1
2	3	4	5	6	7	8
9	10	11	12	13	14	15
16	17	18	19	20	21	22
23	24	25	26	27	28

easy blog

크롤링 연습 5. urllib 사용 및 게시판 글 리스트 모두 가져오기

'python' 카테고리의 다른 글

카테고리

공지사항

태그목록

최근에 올라온 글

최근에 달린 댓글

글 보관함

달력

링크

티스토리툴바