如何在 Jupyter Notebook 执行和学习 SQL 语句（上）—— 基本原理详解和相关库安装篇

🕗 发布于 2024-10-20 13:34 oracle 数据库 jupyter sql

近期我找工作很多岗位问到sql，由于我简历上有写，加上我实习的时候确实运用了，所以我还是准备复习一下SQL语句，常见的内容，主要包括一些内容，比如SQL基础（主要是取数select，毕竟用的时候基本上不会让我一个实习生进行一个删除之类的操作）和一些进阶的用法比如窗口函数之类的！

FROM：指定表格或视图，支持多表连接。

WHERE：条件过滤，筛选符合条件的行。

GROUP BY：按指定列分组，通常配合聚合函数使用。

HAVING：分组后的条件过滤，应用于聚合结果。

ORDER BY：排序结果，默认升序，支持降序。

LIMIT：限制返回的行数，常用于分页。

步骤	功能说明	常用方法	示例
SELECT	选择要返回的列、表达式、聚合函数	- 列名	SELECT name, SUM(price), COUNT(id)
		- 聚合函数（COUNT, SUM, AVG, MAX, MIN）	SELECT CASE WHEN age > 18 THEN 'Adult' ELSE 'Child' END AS age_group
		- CASE 表达式
FROM	指定要查询的表格或视图	- 单表查询	FROM users u JOIN transactions t ON u.id = t.user_id
		- 多表连接 (JOIN, INNER JOIN, LEFT JOIN, RIGHT JOIN)
		- 笛卡尔积 (CROSS JOIN)
WHERE	条件过滤，筛选符合条件的行	- 条件运算符 (=, <>, >, <, BETWEEN)	WHERE age > 25
		- 模式匹配 (LIKE, RLIKE)	WHERE email LIKE '%example.com'
		- 集合运算 (IN, EXISTS)	WHERE id IN (SELECT id FROM other_table)
GROUP BY	对结果按某些列进行分组，通常配合聚合函数使用	- 列名分组	GROUP BY user_id
		- 多列分组 (GROUP BY col1, col2)	GROUP BY department, role
HAVING	在分组后的结果上进一步过滤，通常用于聚合结果	- 聚合函数条件 (HAVING SUM(price) > 1000)	HAVING COUNT(*) > 2
			HAVING SUM(total_price) > 500
ORDER BY	对结果进行排序，按指定列升序（ASC）或降序（DESC）	- 按单列排序 (ORDER BY col)	ORDER BY transaction_date DESC
		- 按多列排序 (ORDER BY col1 ASC, col2 DESC)	ORDER BY name ASC, age DESC
LIMIT	限制返回的行数，通常用于分页	- LIMIT	LIMIT 10
		- OFFSET	LIMIT 10 OFFSET 20

然后由于我在自己的小破电脑上没有安装SQL的环境，但还是想要联系一下，除了牛客我只能选择了在Jupyter Notebook中使用SQL，我通过以下步骤创建一个数据库并连接到该数据库：

1. 安装SQLite和SQLAlchemy

SQLite 是一个轻量级的数据库系统，适合本地小型项目。SQLAlchemy 是一个强大的数据库连接工具，可以在Jupyter中方便地运行SQL查询。

在Jupyter Notebook的单元格中运行以下命令来安装：

!pip install sqlalchemy sqlite

2. 创建SQLite数据库

SQLite数据库是一个文件，我选择直接在本地创建一个SQLite数据库文件。

import sqlite3

# 创建一个名为 example.db 的SQLite数据库
conn = sqlite3.connect('example.db')

# 创建游标对象，用于执行SQL语句
cursor = conn.cursor()

# 创建一个示例表格
cursor.execute('''
    CREATE TABLE IF NOT EXISTS users (
        id INTEGER PRIMARY KEY AUTOINCREMENT,
        name TEXT NOT NULL,
        age INTEGER NOT NULL
    )
''')

# 插入一些数据
cursor.execute("INSERT INTO users (name, age) VALUES ('Alice', 25)")
cursor.execute("INSERT INTO users (name, age) VALUES ('Bob', 30)")

# 提交事务保存数据
conn.commit()

# 关闭连接
conn.close()

3. 连接到数据库并查询

再次打开连接并执行SQL查询。

# 重新连接到数据库
conn = sqlite3.connect('example.db')

# 使用 pandas 方便读取 SQL 查询结果
import pandas as pd

# 查询数据
query = "SELECT * FROM users"
df = pd.read_sql_query(query, conn)

# 展示数据
print(df)

# 关闭连接
conn.close()

1. 基础SQL操作——简历一个数据表

execute(）使用这个方法就可以轻松在python的环境中是执行一些sql语言，由于我本人没有安装sql的环境，我为了紧急复习一下sql也是煞费苦心

创建数据库和表，插入数据：

import sqlite3

# 创建SQLite数据库并连接
conn = sqlite3.connect('example.db')
cursor = conn.cursor()

# 创建用户表
cursor.execute('''
    CREATE TABLE IF NOT EXISTS users (
        id INTEGER PRIMARY KEY AUTOINCREMENT,
        name TEXT NOT NULL,
        age INTEGER NOT NULL,
        email TEXT
    )
''')

# 插入数据
cursor.execute("INSERT INTO users (name, age, email) VALUES ('Alice', 25, 'alice@example.com')")
cursor.execute("INSERT INTO users (name, age, email) VALUES ('Bob', 30, 'bob@example.com')")
cursor.execute("INSERT INTO users (name, age, email) VALUES ('Charlie', 35, 'charlie@example.com')")
cursor.execute("INSERT INTO users (name, age, email) VALUES ('David', 40, 'david@example.com')")

conn.commit()
conn.close()

查询数据：

conn = sqlite3.connect('example.db')
cursor = conn.cursor()

# 查询所有用户
cursor.execute("SELECT * FROM users")
rows = cursor.fetchall()

for row in rows:
    print(row)

conn.close()

比如user表长这样！

然后是这个表格

然后是

下一篇我将从所有类型的数据，比如数值数据和字符数据，和时间数据的种种操作，和一些常见函数比如sum（）之类简单函数和子查询和窗口函数大法的理论（超级常用），进行一个系统的复习！下下篇是我珍藏已久的实战操作题目，一个题包含了种种做法！基本上我感觉学会了我珍藏的实战题目，其他的都无敌了。

代码即将开源在github哈哈，希望各位大佬给我点歌星星！

原文地址：https://blog.csdn.net/qq_44117805/article/details/142925746

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：ubuntu22.04安装Jupyter Notebook
下一篇：rk3568创建基于Ubuntu18.04交叉编译遇到的坑

leetcode289:生命游戏
根据，简称为，是英国数学家约翰·何顿·康威在 1970 年发明的细胞自动机。给定一个包含m × n个格子的面板，每一个格子都可以看成是一个细胞。每个细胞都具有一个初始状态：1即为（live），或0即为
阅读更多2024-10-20
MongoDB数据恢复
注意：两个MongoDB的版本要一致，本文使用的是mongo:4.2.24。先把K8S上面的MongoDB 容器停止（可以把副本改成0）。1、将容器挂载MongoDB的数据目录备份到本地。经常是数据文
阅读更多2024-10-20
C#中实现事务
C#中实现事务
阅读更多2024-10-20
【LeetCode每日一题】——560.和为 K 的子数组
给你一个整数数组 nums 和一个整数 k ，请你统计并返回该数组中和为 k 的子数组的个数。子数组是数组中元素的连续非空序列。
阅读更多2024-10-20
「漏洞复现」满客宝智慧食堂系统 selectUserByOrgId 未授权访问漏洞
请勿利用文章内的相关技术从事非法测试，由于传播、利用此文所提供的信息而造成的任何直接或者间接的后果及损失，均由使用者本人负责，作者不为此承担任何责任。工具来自网络，安全性自测，如有侵权请联系删除。本次
阅读更多2024-10-20
React面试题目（从基本到高级）
React前端面试常见题目涵盖了React的基础概念、组件、状态管理、生命周期、性能优化等多个方面。
阅读更多2024-10-20
12.个人博客系统（Java项目基于spring和vue）
1 在校学习的学生，可用于日常学习使用或是毕业设计使用 2 毕业一到两年的开发人员，用于锻炼自己的独立功能模块设计能力，增强代码编写能力。 3 亦可以部署为商化项目使用。 4 需要完整资料及源码
阅读更多2024-10-20
YoloV8改进策略：注意力改进|DeBiFormer，可变形双级路由注意力|引入DeBiLevelRoutingAttention注意力模块（全网首发）
本次改进的核心在于将DeBiLevelRoutingAttention模块嵌入到YoloV8的主干网络中，具体位置是在SPPF（Spatial Pyramid Pooling Fast）模块之后。这一
阅读更多2024-10-20
word取消自动单词首字母大写
情况说明：在word输入单词后首字母会自动变成大写取消单词首字母大写步骤：（1）点击菜单栏文件（2）点击“更多”——>“选项”（3）点击“校对”——>“自动更正选项”（4）取消“句首字母大
阅读更多2024-10-20
web前端网页用户注册页面
【代码】web前端网页用户注册页面。
阅读更多2024-10-20