[教程]揭秘：Python轻松获取哔哩哔哩观看记录，解锁个人观看喜好大揭秘

发布于 2025-06-26 21:30:34

135

引言哔哩哔哩（Bilibili，简称B站）作为国内知名的视频分享网站，汇聚了大量的二次元、动画、游戏、科技等领域的优质内容。许多用户在B站上拥有丰富的观看记录，而这些记录背后隐藏着用户的个人喜好和观看...

引言

哔哩哔哩（Bilibili，简称B站）作为国内知名的视频分享网站，汇聚了大量的二次元、动画、游戏、科技等领域的优质内容。许多用户在B站上拥有丰富的观看记录，而这些记录背后隐藏着用户的个人喜好和观看习惯。本文将介绍如何使用Python轻松获取B站用户的观看记录，并通过数据可视化分析揭示用户的观看喜好。

1. 准备工作

在开始之前，请确保已经安装以下Python库：

requests
beautifulsoup4
pandas
matplotlib
seaborn
selenium（可选）

可以使用pip进行安装：

pip install requests beautifulsoup4 pandas matplotlib seaborn selenium

2. 数据采集

使用Python爬虫技术，我们可以通过分析B站网页的源代码来获取用户的观看记录。以下是一个简单的示例代码：

import requests
from bs4 import BeautifulSoup
def get_my_history(): url = 'https://www.bilibili.com/my/history' headers = { 'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.3' } response = requests.get(url, headers=headers) soup = BeautifulSoup(response.text, 'html.parser') history_list = soup.find_all('a', class_='video-title') for item in history_list: title = item.get_text() print(title)
get_my_history()

请注意，由于B站的反爬虫机制，上述代码可能无法正常运行。在实际操作中，您可能需要使用代理、更换User-Agent等手段来绕过反爬虫限制。

3. 数据处理

获取到观看记录后，我们可以使用Pandas库对数据进行处理和分析。以下是一个简单的示例：

import pandas as pd
def process_history(history_list): df = pd.DataFrame({'title': history_list}) return df
history_df = process_history([item.get_text() for item in history_list])
print(history_df)

4. 数据可视化

使用Matplotlib和Seaborn库，我们可以将用户的观看记录进行可视化展示。以下是一个简单的示例：

import matplotlib.pyplot as plt
import seaborn as sns
def visualize_history(df): plt.figure(figsize=(12, 6)) sns.countplot(y='title', data=df) plt.title('Bilibili 观看记录统计') plt.show()
visualize_history(history_df)

5. 总结

本文介绍了如何使用Python获取B站用户的观看记录，并通过数据处理和可视化分析揭示用户的观看喜好。通过这些方法，我们可以更好地了解用户在B站的观看习惯和兴趣，为内容创作者、运营者以及推荐系统提供有价值的信息。

注意事项

由于B站的反爬虫机制，爬虫程序可能需要不断优化以应对变化。
在实际操作中，请尊重用户隐私，避免泄露用户数据。
本文所提供的方法仅供参考，具体实现可能因B站网站结构和反爬虫机制的变化而有所不同。

一个月内的热帖推荐