python學習筆記 - BeautifulSoup模組

網頁解析工具，可以從HTML結構中挑出想要的資訊

引用方法：from bs4 import BeautifulSoup

sp = BeautifulSoup(html原始碼, 解析器) # 解析器 = html.parser or lxml，較推薦lxml

用法1: find

sp.find('標籤名稱', 屬性名稱=屬性內容)

sp.find('標籤名稱', 屬性字典)

範例:

sp.find('p', id="p1", class_="red")

sp.find('p', {'id':'p1', 'class':'red'})

用法2: find_all (會傳回list)

sp.find_all('標籤名稱', 屬性名稱=屬性內容)

sp.find_all('標籤名稱', 屬性字典)

範例:

sp.find_all('p', id="p1", class_="red")

sp.find_all('p', {'id':'p1', 'class':'red'})

用法3: select (會傳回list)

sp.select('選取標籤')

範例:

sp.select('a')

sp.select('.contents .ball.green')

其他更多精彩的分享

生活攻略站長

我是 Hank！，我是網站工程師，也是一位生活玩家，這是我的部落格，分享生活知識、旅遊紀錄、開箱心得、網站架設筆記

My name is Hank, this blog shares Knowledge of life, Travel records and Website setup notes, hope you will like it