作者:传奇gk_543 | 来源:互联网 | 2023-06-15 19:20
我遇到了一个自动化(website (clickhere))的问题
该网站似乎受到chromedriver的某种保护。通常,当我访问该网站时,我没有问题,但是当硒尝试使该网站自动化时,该URL重定向到其他一些主页。
这是我的示例代码:
from selenium import webdriver
from selenium.webdriver.chrome.options import Options
import time
chrome_optiOns= Options()
#chrome_options.add_argument("--headless")
EXE_PATH = 'chromedriver.exe'
driver = webdriver.Chrome(executable_path=EXE_PATH)#,optiOns=chrome_options)
driver.get(SEE URL ABOVE)
time.sleep(5)
print(driver.current_url)
driver.quit()
请使用超链接文本中的链接。我从这里的代码中删除了它。
想知道是否有人遇到类似的问题,因为网站发现浏览器正在使用硒进行自动化,并且是否有解决办法。如果没有,也许您有个建议,可以从另一个角度分享。
更多关于您的用例以及为什么您觉得 ...该站点受到保护... 可以帮助我们进一步分析问题。但是,通过Selenium访问该网站,您可以使用以下解决方案:
-
代码块:
from selenium import webdriver
from selenium.webdriver.common.by import By
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC
optiOns= webdriver.ChromeOptions()
options.add_argument("start-maximized")
#options.add_argument("--headless")
options.add_experimental_option("excludeSwitches",["enable-automation"])
options.add_experimental_option('useAutomationExtension',False)
driver = webdriver.Chrome(optiOns=options,executable_path=r'C:\Utility\BrowserDrivers\chromedriver.exe')
driver.get("https://publicindex.sccourts.org/horry/publicindex/")
WebDriverWait(driver,10).until(EC.title_contains("Index"))
print(driver.current_url)
driver.quit()
-
控制台输出:
https://publicindex.sccourts.org/horry/publicindex/
Outro
您可以在以下位置找到一些相关的讨论
- Chrome browser initiated through ChromeDriver gets detected
- Selenium and non-headless browser keeps asking for Captcha