けむブログ

データ分析に関する気付きや学びを記録するブログ

Python スクレイピング findAll

 findAll

 使用例

指定したURLをスクレイピングして、BeautifulSoupを用いてHTMLを取得した後にそのHTMLを分解してほしいデータを取ってくるときなどで使う

 

指定したタグの中身を順に取得する 

soup = 取得したHTML

for a in soup.findAll("table"):

     print(a)

 

で tableタグのつくものを順に取得してaに返す。

なお、printをつけなかった場合は最後の一つだけが表示されるので注意!!

リストに格納すれば、二重配列のリストができる