[教程]掌握Python，轻松将网页链接保存为文本文件

csdn大佬

发布于 2025-07-09 15:30:25

797

在Python中，我们可以使用多种库来获取网页内容并将其保存为文本文件。以下是一些简单而有效的方法来实现这一目标。1. 使用requests库获取网页内容requests是一个简单易用的HTTP库，可...

在Python中，我们可以使用多种库来获取网页内容并将其保存为文本文件。以下是一些简单而有效的方法来实现这一目标。

1. 使用`requests`库获取网页内容

requests是一个简单易用的HTTP库，可以用来发送网络请求。以下是一个使用requests获取网页内容并将其保存为文本文件的例子。

1.1 安装`requests`库

pip install requests

1.2 编写Python脚本

import requests
# 要保存的网页链接
url = 'https://www.example.com'
# 发送HTTP GET请求
response = requests.get(url)
# 检查请求是否成功
if response.status_code == 200: # 读取网页内容 content = response.text # 指定保存的文件名 filename = 'webpage.txt' # 将内容写入文件 with open(filename, 'w', encoding='utf-8') as file: file.write(content) print(f'网页内容已保存到 {filename}')
else: print(f'请求失败，状态码：{response.status_code}')

2. 使用`BeautifulSoup`解析网页内容

BeautifulSoup是一个用于解析HTML和XML文档的库。它可以帮助我们提取网页中的特定内容。

2.1 安装`beautifulsoup4`库

pip install beautifulsoup4

2.2 编写Python脚本

import requests
from bs4 import BeautifulSoup
# 要保存的网页链接
url = 'https://www.example.com'
# 发送HTTP GET请求
response = requests.get(url)
# 检查请求是否成功
if response.status_code == 200: # 解析网页内容 soup = BeautifulSoup(response.text, 'html.parser') # 获取网页标题 title = soup.title.string # 指定保存的文件名 filename = f'{title}.txt' # 将标题写入文件 with open(filename, 'w', encoding='utf-8') as file: file.write(title) print(f'网页标题已保存到 {filename}')
else: print(f'请求失败，状态码：{response.status_code}')

3. 使用`Selenium`模拟浏览器行为

Selenium是一个用于Web应用程序测试的工具，也可以用来模拟浏览器行为。

3.1 安装Selenium和WebDriver

pip install selenium

根据你使用的浏览器，你需要下载相应的WebDriver。例如，对于Chrome浏览器，你可以从以下链接下载：

https://sites.google.com/chromium.org/driver/

3.2 编写Python脚本

from selenium import webdriver
# 要保存的网页链接
url = 'https://www.example.com'
# 指定WebDriver的路径
driver_path = '/path/to/chromedriver'
# 创建WebDriver对象
driver = webdriver.Chrome(executable_path=driver_path)
# 打开网页
driver.get(url)
# 获取网页标题
title = driver.title
# 指定保存的文件名
filename = f'{title}.txt'
# 将标题写入文件
with open(filename, 'w', encoding='utf-8') as file: file.write(title)
# 关闭浏览器
driver.quit()
print(f'网页标题已保存到 {filename}')

以上是几种将网页链接保存为文本文件的方法。你可以根据自己的需求选择合适的方法来实现这一功能。

一个月内的热帖推荐

[教程]掌握Python，轻松将网页链接保存为文本文件

1. 使用requests库获取网页内容

1.1 安装requests库