Selenium 是一个强大的自动化工具,广泛应用于网站测试和数据抓取等场景。使用 Selenium,您可以轻松获取网站上的所有链接。以下是具体步骤:
pip install selenium
from selenium import webdriver
from selenium.webdriver.common.by import By
# 初始化 WebDriver
driver = webdriver.Chrome()
# 打开网页
driver.get('https://www.example.com')
# 获取网页上的所有链接
links = driver.find_elements(By.TAG_NAME, 'a')
# 遍历链接并打印
for link in links:
print(link.get_attribute('href'))
# 关闭浏览器
driver.quit()
上述代码首先初始化 WebDriver,打开目标网页。使用 find_elements()
方法获取页面上的所有 <a>
标签,并遍历它们,输出每个链接的 href
属性。不要忘记关闭浏览器。
通过这种方式,您可以轻松获取网站上的所有链接,为后续的数据分析或网站测试提供有价值的信息。