https://www.hollys.co.kr/store/korea/korStore2.do?pageNo=10&sido=%EC%84%9C%EC%9A%B8&gugun=&store=
크롤링 해올 할리스 페이지
라이브러리 Import
from bs4 import BeautifulSoup
import urllib.request
import time
import pandas as pd
페이지 HTML 가져오기
page_num = 10 # 페이지 넘버를 변수로 설정
url = f'https://www.hollys.co.kr/store/korea/korStore2.do?pageNo={page_num}&sido=%EC%84%9C%EC%9A%B8&gugun=&store='
html = urllib.request.urlopen(url)
soup = BeautifulSoup(html,'html.parser')
section = soup.find('div',attrs={'class':'tableType01'})
part = section.find_all('th',attrs={'scope':"col"})
part
col = []
for i in range(len(part)):
col.append(part[i].get_text().strip())
col
page =section.find('tbody').find_all('tr')
page
page[0].find_all('td')[0].get_text()
table = {}
for c in col:
table[c] = []
for j in range(len(col)):
for i in range(len(page)):
table[col[j]] += [page[i].find_all('td')[j].get_text()]
pd.DataFrame(table)
최종 코드
page_num = 10
url = f'https://www.hollys.co.kr/store/korea/korStore2.do?pageNo={page_num}&sido=%EC%84%9C%EC%9A%B8&gugun=&store='
html = urllib.request.urlopen(url)
soup = BeautifulSoup(html,'html.parser')
section = soup.find('div',attrs={'class':'tableType01'})
part = section.find_all('th',attrs={'scope':"col"})
# part
col = []
for i in range(len(part)):
col.append(part[i].get_text().strip())
page =section.find('tbody').find_all('tr')
table = {}
for c in col:
table[c] = []
for j in range(len(col)):
for i in range(len(page)):
table[col[j]] += [page[i].find_all('td')[j].get_text()]
'🏷️Workplace > ANALYSIS' 카테고리의 다른 글
[RainflowCounting] reversals( ) (0) | 2023.10.17 |
---|---|
네이버금융 기업 실적 분석 데이터 크롤링 (2) | 2023.02.04 |
[크롤링&SQL] 할리스 매장 정보 크롤링 후 DB 저장 (0) | 2023.01.24 |
[ETF]파이썬 시각화 (0) | 2022.11.17 |
네이버 금융에서 β(베타) 크롤링 (0) | 2022.11.11 |