[教程]揭秘Python一键提取URL文件名技巧，轻松获取网址中的文件名！

发布于 2025-06-22 18:30:55

931

在处理网络数据或自动化脚本编写过程中，经常需要从URL中提取文件名。Python提供了多种方法来实现这一功能。本文将详细介绍几种常见的一键提取URL文件名的技巧，并附上相应的代码示例。一、使用标准库u...

在处理网络数据或自动化脚本编写过程中，经常需要从URL中提取文件名。Python提供了多种方法来实现这一功能。本文将详细介绍几种常见的一键提取URL文件名的技巧，并附上相应的代码示例。

一、使用标准库`urllib.parse`

Python的urllib.parse模块提供了一个非常方便的函数urlparse，可以解析URL，并从中提取文件名。

from urllib.parse import urlparse
def extract_filename(url): parsed_url = urlparse(url) path = parsed_url.path # 移除路径中的特殊字符和斜杠 filename = path.split('/')[-1].strip('/\\') return filename
# 示例
url = "https://example.com/path/to/file.pdf"
print(extract_filename(url)) # 输出: file.pdf

二、使用`os.path.basename`

os.path.basename函数可以直接从路径中提取文件名，这对于URL来说同样适用。

import os
def extract_filename(url): filename = os.path.basename(url) return filename
# 示例
url = "https://example.com/path/to/file.pdf"
print(extract_filename(url)) # 输出: file.pdf

三、正则表达式

如果你需要处理更复杂的URL格式，可以使用正则表达式来提取文件名。

import re
def extract_filename(url): # 正则表达式匹配文件名 match = re.search(r'/([^/]*)$', url) if match: filename = match.group(1) return filename else: return None
# 示例
url = "https://example.com/path/to/directory/file.pdf"
print(extract_filename(url)) # 输出: file.pdf