AmazonPrimeVideoの国内ドラマ一覧をブラウザのhtmlを置換して取得する方法
Prime Videoのホームを開く
https://www.amazon.co.jp/gp/video/storefront/ref=sv_atv_logo?node=2351649051
スクロールして、日本のテレビドラマの「すべて見る」をクリック
画面をスクロールして、全アイテムを表示する。
F12キーを押してソースコードを取得し、以下の順番で置換して、データを取得する
- <div class="av-hover-wrapper"> を \r\n<div class="av-hover-wrapper"> に置換
- ^.*<div class="_1Opa2_ dvui-packshot av-grid-packshot"> を 空 に置換
- <span class="nXG5iT"></span> を 空 に置換
- <div class="_1N2P-J mustache _2mxudr">.* を 空 に置換
- “></a></div> を 空 に置換
ここまで作業したら、各videoのリンクと、表示されている画像が抽出できているので、このデータは取っておきます。
urlを取得
ここからは、url、画像url、作品タイトルに別けていきます。
- 全体をコピー
- <a href=" を https://www.amazon.co.jp/ に置換
- “>.* を 空 に置換
タイトルを取得
- 全体をコピー
- .*<img src=" を 空 に置換
- " alt=".* を 空 に置換
- .*" alt=" を 空 に置換
- 【.*】 を 空 に置換
- (NHKオンデマンド) を 空 に置換
取得したタイトル、url、画像urlを、カンマ区切りでcsvファイルに保存して完成です。
今回は、480件分のデータを作成しました。
最終的には、この手順をバッチファイルにしたいですね。そうすると半自動でデータが取れるようになるので、酒飲みながらの作業でも何百タイトルのデータを作れるようになるので。
ディスカッション
コメント一覧
まだ、コメントがありません