[크롤링] 네이버 홈화면의 메뉴를 가져와보자

cs/크롤링

[크롤링] 네이버 홈화면의 메뉴를 가져와보자

신_이나 2023. 3. 13. 16:19

! 새롭게 알게 된 점 !

보통 이런 형식으로 웹의 트리가 쌓여있다는 점 ~~책에서 이런 것도 안알려주구 ㅠ~~

<html>

<div>

<ul>

<li>

<a>

<span>

- 네이버 홈화면의 메뉴를 가져와보자

여기서 초록색 부분!

네이버의 웹소스는 이렇게 구성되어 있다. 'ul' 에서 각 'li' 들에 메뉴 이름이 쓰여있었다.

우선 'ul'에서 'li' 소스 들을 뽑아 그 안에서 a 태그들의 text 를 뽑아주도록 하겠다.

<완성 코드>

from urllib.request import urlopen
from bs4 import BeautifulSoup

html = urlopen('https://www.naver.com')
bs = BeautifulSoup(html, 'html.parser')

ul = bs.find('ul',{'class' : 'list_nav'})
#print(ul)

lis = ul.findAll('li')
#print(lis)

for li in lis:
    a_tag=li.find('a')
    print(a_tag.text)

ul = bs.find('ul',{'class' : 'list_nav'})
#print(ul)
=> ul을 찾아주는 코드

lis = ul.findAll('li')
#print(lis)

=> ul 안에 li 들을 lis 안에 저장해주었다.
for li in lis:
a_tag=li.find('a')
print(a_tag.text)

=> lis 안 li 들을 하나 하나 뽑으며 a태그의 text 를 출력하였다.

<결과>

저작자표시 (새창열림)

'cs > 크롤링' 카테고리의 다른 글

[크롤링] 하늬가람 페이지 크롤링해보자 (0)	2023.03.20
[크롤링] selenium 안녕 ,,? (0)	2023.03.20
[크롤링] 할리스 매장 위치 정보 크롤링 해보기 (pandas / del[:]) (0)	2023.03.08
[크롤링] 크롤링 시작하기 (페이지에 있는 링크 목록 가져오기/attrs/웹사이트를 무작위로 이동/딥 웹, 다크 웹, 히든 웹/웹스크레이핑/외부Url,내부 Url) (0)	2023.03.06
[크롤링] 고급 HTML 분석 (findAll/get_text()/트리이동/정규표현식/람다표현식) (0)	2023.02.28

현재글[크롤링] 네이버 홈화면의 메뉴를 가져와보자

빅게임, 서강형런닝맨빅게임, 베이글랭귀지클럽, 대외활동, Namecheap, 영어회화, 메타버스, 박준서고마워, 나의블로그 화이팅, 도메인구입, 수시박람회, BLC, 하늬가람, 블로그시작, 서강대, 미니김빱님감사해요,

Today :
Yesterday :

일	월	화	수	목	금	토
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30

신전떡볶이가 좋아