국립부경대학교 | 디지털스마트부산 아카데미

제1기4분반

작성자,작성일,첨부파일,조회수로 작성된 표
9월16일실습코드
작성일 2022-09-16 조회수 325
첨부파일 Untitled1.ipynb

url1="https://news.naver.com/main/ranking/popularDay.naver"

html1=urlopen(url1)

bs_obj=bs4.BeautifulSoup(html1,"html.parser")

ul1=bs_obj.findAll("ul",{"class":"rankingnews_list"})

 

media=bs_obj.findAll("strong",{"class":"rankingnews_name"})

media1=[]

for i in media:

    media1.append(i.text)

print(media1)

len(media1)

 

result=[]

contents=[]

link=[]

link1=[]

for i in ul1:

    li1=i.findAll("li")

    for j in li1:

        em_tag=j.find("em")

        a_tag=j.find("a")

        if (em_tag != None) and (a_tag !=None):

            contents.append(a_tag.text)

            link1.append(a_tag['href'])

    result.append(contents)

    link.append(link1)

    contents=[]

    link1=[]

    k+=1

 

for i in np.arange(len(media1)):

    if (media1[i] == "조선일보"):

        print(i)

        print(result[i])

 

url1=link[10][0]

html1=urlopen(url1)

bs_obj=bs4.BeautifulSoup(html1,"html.parser")

div1=bs_obj.find("div",{"id":"newsct_article","class":"newsct_article _article_body"})

print(div1.text.replace("\n",""))

 

url1="https://n.news.naver.com/article/023/0003716322?ntype=RANKING"

html1=urlopen(url1)

bs_obj=bs4.BeautifulSoup(html1,"html.parser")

div1=bs_obj.find("div",{"id":"newsct_article","class":"newsct_article _article_body"})

print(div1.text.replace("\n",""))

다음 9월23일(금) 교육은 비대면입니다.
이전 파이썬 기초 유튜브