けむブログ

データ分析に関する気付きや学びを記録するブログ

Python スクレイピング findAll

findAll

使用例

指定したURLをスクレイピングして、BeautifulSoupを用いてHTMLを取得した後にそのHTMLを分解してほしいデータを取ってくるときなどで使う

指定したタグの中身を順に取得する

soup = 取得したHTML

for a in soup.findAll("table"):

print(a)

で tableタグのつくものを順に取得してaに返す。

なお、printをつけなかった場合は最後の一つだけが表示されるので注意！！

リストに格納すれば、二重配列のリストができる