python學習筆記 - BeautifulSoup模組

網頁解析工具,可以從HTML結構中挑出想要的資訊
引用方法:from bs4 import BeautifulSoup
sp = BeautifulSoup(html原始碼, 解析器) # 解析器 = html.parser or lxml,較推薦lxml
用法1: find
sp.find('標籤名稱', 屬性名稱=屬性內容)
sp.find('標籤名稱', 屬性字典)
範例:
sp.find('p', id="p1", class_="red")
sp.find('p', {'id':'p1', 'class':'red'})
用法2: find_all (會傳回list)
sp.find_all('標籤名稱', 屬性名稱=屬性內容)
sp.find_all('標籤名稱', 屬性字典)
範例:
sp.find_all('p', id="p1", class_="red")
sp.find_all('p', {'id':'p1', 'class':'red'})
用法3: select (會傳回list)
sp.select('選取標籤')
範例:
sp.select('a')
sp.select('.contents .ball.green')
其他更多精彩的分享

生活攻略站長

我是 Hank!,我是網站工程師,也是一位生活玩家,這是我的部落格,分享 生活知識、旅遊紀錄、開箱心得、網站架設筆記


My name is Hank, this blog shares Knowledge of life, Travel records and Website setup notes, hope you will like it