スクレイピングの練習をしているのですが、
やりたい作業の方法が思いつかないので教えてください。
下記はコジマの商品一覧ページです。
作業はseleniumとlxml.htmlで行っています。
htmlを取得し、48商品すべてのポイントをスクレイピングしようと下記を実行しました。
u='1UMto4'
driver.get(u)
html = driver.page_source
html = lxml.html.fromstring(html)
css_pt = '#fwCms_wrapper > div > div > div.layoutGrid > div.fwCms_box.frame_MB > div.ProductList.MK2PFRDL010_01 > div > ul > li > p.point.small.mt1 > span.number'
pt = [int(pt.text_content().replace(",","").strip()) for pt in html.cssselect(css_pt)]
ポイントの記載がない商品は、0として値を取得したいのですが、
上記方法だとポイントがある商品しか値を取得できません。
そこでhtmlにp.point.small.mt1 > span.numberが記載されていない商品にもp.point.small.mt1 > span.numberhtmlを追記してポイント0を加えた上で、
css_pt = '#fwCms_wrapper > div > div > div.layoutGrid > div.fwCms_box.frame_MB > div.ProductList.MK2PFRDL010_01 > div > ul > li > p.point.small.mt1 > span.number'
pt = [int(pt.text_content().replace(",","").strip()) for pt in html.cssselect(css_pt)]
を実行するようにしてみたいです。
何かいい方法ありますか
【まず1嫁】くだすれPython(超初心者用) その58
■ このスレッドは過去ログ倉庫に格納されています
562デフォルトの名無しさん
2023/02/18(土) 23:14:23.54ID:kBeBEpAv■ このスレッドは過去ログ倉庫に格納されています
ニュース
- 「排外主義が日本全体で跋扈」村井嘉浩宮城県知事−外国ルーツの女子児童へのいじめで [蚤の市★]
- クールジャパン機構、累積損失500億円超 政府が廃止など検討へ ★2 [ぐれ★]
- 【テレビ】20代で7割、30代で6割が「見ていない」 衝撃の調査結果から考える「若者のテレビ離れ」本当の理由 [冬月記者★]
- (株)秀和グループ(東京)が破産=秀和システム 船井電機(株)を傘下だが、脱毛サロン「ミュゼプラチナム」の連帯保証などして [お断り★]
- 【アニメ】『日本の最強アニソンBEST100』 1位はまたもや『残酷な天使のテーゼ』… 視聴者は「出来レース」「見飽きた」の声 [冬月記者★]
- AKB48契約解除の花田藍衣、動画で悲痛な訴え「運営から性的な質問をされ…峯岸さんのように坊主にして誠意を見せろと言われ坊主に」★5 [冬月記者★]
- 日本人が中国を未だに下に見る理由とは?高市も不思議がってる [472617201]
- 【文春】高市、暴かれた本性。木下秘書「文春は中国から毎週一千万円もらっている」自民党内から総スカンなど🤓 [359965264]
- 【高市悲報】ミュトス、米政府機密システムの脆弱性も発見していた [663382246]
- 独身偽装は結婚詐欺で逮捕になる時代がもうまもなく来てその後はヤリ捨てが逮捕の時代がくる
- 【画像】メンヘラ系JK「え、むり。もう自殺する」👉電車の方が破壊されて生き延びる [398059782]
- 【朗報】GTA6、676GB [268244553]