网络脚本编写与数据库存储的实用技巧

发布时间：2026-01-05 08:40:29 阅读：317 次

平时上网，很多人会遇到需要自动抓取网页信息、保存数据的情况。比如你想定期查看某个商品价格变化，或者收集新闻标题做个自己的资讯库。这时候，写个简单的网络脚本，再把数据存进数据库，就方便多了。

从一个小例子说起

假设你是个喜欢买书的人，经常逛某电商网站。你想知道《Python编程入门》这本书的价格走势。手动查太麻烦，可以写一个Python脚本，自动访问页面，提取价格，然后存起来。

用 requests 库获取网页内容，配合 BeautifulSoup 解析HTML，几行代码就能搞定数据抓取：

import requests
from bs4 import BeautifulSoup

url = "https://example-bookstore.com/book/123"
response = requests.get(url)
soup = BeautifulSoup(response.text, 'html.parser')
price = soup.find('span', class_='price').text
print(f"当前价格：{price}")

数据不能只打印出来，得存下来

光打印价格没用，得记录每天的价格才能看出趋势。这时候就需要数据库了。SQLite 是个轻量的选择，不用单独安装服务，Python 自带支持。

创建一个数据库文件，建张表来存价格记录：

import sqlite3

conn = sqlite3.connect('book_prices.db')
c = conn.cursor()
c.execute('''CREATE TABLE IF NOT EXISTS prices
            (id INTEGER PRIMARY KEY, book_title TEXT, price TEXT, timestamp DATETIME DEFAULT CURRENT_TIMESTAMP)''')
conn.commit()

每次抓完数据，就把价格插入数据库：

c.execute("INSERT INTO prices (book_title, price) VALUES (?, ?)", ('Python编程入门', price))
conn.commit()

让脚本自动跑起来

写好了脚本，存为 price_tracker.py，接下来让它每天自动运行。在Windows上可以用“任务计划程序”，在Mac或Linux上可以用 cron 定时任务。

比如在Linux终端输入：

crontab -e

添加一行：

0 9 * * * /usr/bin/python3 /home/user/price_tracker.py

意思是每天早上9点自动执行这个脚本。你一觉醒来，数据已经记好了。

不只是价格，还能存更多

同样的方法，可以用来监控天气、股票、招聘信息，甚至社交媒体上的关键词动态。只要网页能公开访问，数据就可以被抓取并存入数据库。

注意一点：别频繁请求同一个网站，容易被封IP。加个 time.sleep(5) 让脚本休息几秒，既礼貌又安全。

小工具解决实际问题

这些技术听起来像程序员才用得上，其实普通人学点基础也能受益。花一个小时写个脚本，可能省下你未来几十次重复操作的时间。特别是当你需要长期跟踪某些网络信息时，脚本+数据库就是你的数字助手。