如何使用Selenium Python在#dow-root(Open)中提取信息?

人气:287 发布:2022-10-16 标签: python selenium-webdriver selenium queryselector shadow-dom

问题描述

我获得了与在线商店相关的下一个URLhttps://www.tiendasjumbo.co/buscar?q=mani,但我无法提取其他字段的产品标签:

from selenium import webdriver
import time
from random import randint

driver = webdriver.Firefox(executable_path= "C:Program Files (x86)geckodriver.exe")
driver.implicitly_wait(10)
time.sleep(4)

url =  "https://www.tiendasjumbo.co/buscar?q=mani"
driver.maximize_window()
driver.get(url)
driver.find_element_by_xpath('//h1[@class="impulse-title"]')

我做错了什么,我也试图切换IFRAMES,但是没有办法实现我的目标?欢迎任何帮助。

推荐答案

网站https://www.tiendasjumbo.co/buscar?q=mani内的产品位于#shadow-root (open)内。

解决方案

要提取产品标签,您必须使用shadowRoot.querySelector(),您可以使用以下Locator Strategy:

编码挡路:

driver.get('https://www.tiendasjumbo.co/buscar?q=mani')
item = driver.execute_script("return document.querySelector('impulse-search').shadowRoot.querySelector('div.group-name-brand h1.impulse-title span.formatted-text')")
print(item.text)

控制台输出:

La especial mezcla de nueces, maní, almendras y marañones x 450 g

引用

您可以在以下位置找到几个相关的讨论:

Unable to locate the Sign In element within #shadow-root (open) using Selenium and Python How to locate the First name field within shadow-root (open) within the website https://www.virustotal.com using Selenium and Python

765