引言

在日常业务开发中,熟练掌握SQL语言是至关重要的。除了基础的增删改查操作外,了解和掌握一些进阶的SQL用法能够让你更高效地处理各种复杂的数据操作。本文将介绍几种SQL进阶用法,让你少走99%的弯路,提高数据处理效率。

自定义排序

MySQL中,你可以通过使用自定义排序来指定特定字段的排序顺序。通常情况下,MySQL的排序是按照默认的升序(ASC)或降序(DESC)进行的。但是,有时候你可能需要按照特定的顺序进行排序,而不仅仅是升序或降序。这时就可以使用自定义排序。

下面我们来通过一个示例来讲解自定义排序。

假设你有一个students表,其中包含学生的姓名和成绩。现在,你想按照自定义的顺序对学生进行排序,而不是按照成绩的大小。例如,你想按照"A"、"B"、"C"、"D"、"E"这样的顺序进行排序。

MySql8.0以前我们需要使用ORDER BY结合CASE语句来自定义一个排序规则去实现。例如:

SELECT * 
FROM students 
ORDER BY 
  CASE 
    WHEN grade = 'A' THEN 1 
    WHEN grade = 'B' THEN 2 
    WHEN grade = 'C' THEN 3 
    WHEN grade = 'D' THEN 4 
    WHEN grade = 'E' THEN 5 
    ELSE 6 -- 处理其他情况,例如如果有其他成绩值
  END;

执行结果如下:
image.png

而在MySql8.0之后可以直接使用自定义排序规则通过FIELD()函数来实现自定义排序。FIELD()函数接受一个字段和一个值列表作为参数,并返回该字段在值列表中的位置。上述示例我们可以改造为:

SELECT * 
FROM students 
ORDER BY  FIELD(grade,'A','B','C','D','E');

image.png

再例如我们在按照自定义的名称的规则排序:

SELECT *
FROM students 
ORDER BY  FIELD(name, 'Eve','David','Charlie','Bob','Alice');

执行结果:

学会这7种SQL进阶用法,让你少走99%的弯路!-小白菜博客
需要注意的是,FIELD()函数会返回字段在值列表中的位置,如果字段的值不在值列表中,则返回0。所以如果你的字段可能包含不在值列表中的值,可能需要在排序时进行适当的处理。

这种方法相对简单,并且在某些情况下非常方便,但也有一些限制。特别是,当值列表很长时,这种方法可能不够灵活,因为需要在ORDER BY子句中硬编码所有的值。

空值NULL排序

MySQL中,当涉及到NULL值排序时,通常,NULL值在升序排序(ASC)中被视为小于任何非NULL值,而在降序排序(DESC)中则被视为大于任何非NULL值。

SELECT * FROM students ORDER BY age ASC;

执行结果:

image.png

SELECT * FROM students ORDER BY age DESC;

执行结果:
学会这7种SQL进阶用法,让你少走99%的弯路!-小白菜博客
如果你希望NULL值出现在排序结果的末尾或开头,可以使用COALESCEIFNULL函数或者ORDER BY IF(ISNULL(字段), 0, 1)来替换NULL值,从而显式控制其排序位置:

  1. 升序时将NULL值放在最后面:
SELECT * FROM students ORDER BY COALESCE(age, 999999) ASC;

或者

SELECT * FROM students ORDER BY IFNULL(age, 999999) ASC;

或者

SELECT * FROM students ORDER BY IF(ISNULL(age), 1, 0), age ASC;

执行结果如下:

image.png

  1. 降序时把NULL值放在最前面:
SELECT * FROM students ORDER BY COALESCE(age, 999999) DESC;

或者

SELECT * FROM students ORDER BY IFNULL(age, 999999) DESC;

或者

SELECT * FROM students ORDER BY IF(ISNULL(age), 0, 1), age DESC;

执行结果如下:
image.png

假如对需要排序的列的最大最小的边界值可以确定,即逻辑上不会出现这么大的值的时候上述三种方式都可以实现,否则建议使用ORDER BY IF(ISNULL(age), 0, 1)的方式,当然也建议不管那种情况都要使用这种方式。

CASE表达式

CASE表达式是一种条件表达式,类似于其他编程语言中的switch语句。它允许根据条件的不同返回不同的值。

CASE表达式的基本语法如下:

CASE
    WHEN condition1 THEN result1
    WHEN condition2 THEN result2
    ...
    ELSE resultN
END
  • condition1condition2等是条件,可以是任何逻辑表达式。
  • result1result2等是对应条件为真时要返回的结果。
  • ELSE子句是可选的,用于处理所有条件都不满足的情况,如果省略了ELSE子句且所有条件都不满足,则返回NULL。
SELECT 
    name,
    score,
    CASE
        WHEN score >= 90 THEN 'A'
        WHEN score >= 80 THEN 'B'
        WHEN score >= 70 THEN 'C'
        ELSE 'D'
    END AS grade_level
FROM
    students;

执行结果如下:
学会这7种SQL进阶用法,让你少走99%的弯路!-小白菜博客
CASE表达式在SQL查询中用途广泛,可用于SELECTUPDATESET等语句中,实现动态计算列值、根据条件更新值等功能。

分组连接函数:GROUP_CONCAT

GROUP_CONCAT函数用于将每个组内的行连接成一个字符串,并返回该字符串。通常在对结果集进行分组后,需要将每个分组内的多个值合并成一个字符串时使用。该函数在MySQL中非常有用,特别是在处理与分组相关的数据时。

GROUP_CONCAT函数的语法:

GROUP_CONCAT([DISTINCT] expr [,expr ...]
             [ORDER BY {unsigned_integer | col_name | expr}
                 [ASC | DESC] [,col_name ...]]
             [SEPARATOR str_val])

  • DISTINCT:可选项,用于去除重复的值。
  • expr:要连接的表达式。
  • ORDER BY:可选项,用于指定连接后的字符串的排序方式。
  • SEPARATOR:可选项,用于指定连接后的字符串的分隔符,默认为逗号,
SELECT
	class,
	GROUP_CONCAT( NAME ) AS students_list 
FROM
	students 
GROUP BY
	class;

查询结果:
image.png

使用GROUP_CONCAT函数时,还可以通过ORDER BY子句可以指定连接后的字符串的排序方式。

SELECT
	class,
	GROUP_CONCAT( NAME ORDER BY age DESC SEPARATOR ';') AS students_list 
FROM
	students 
GROUP BY
	class;

执行结果:
image.png

默认情况下GROUP_CONCAT函数的最大连接长度是1024个字符。如果你的连接超过了这个限制,可以使用SET SESSION group_concat_max_len = val;语句来调整最大连接长度。

分组统计数据后在进行统计汇总:WITH ROLLUP

WITH ROLLUP是MySQL中用于执行聚合查询并生成总计行(rollup summary)的选项之一。它允许在GROUP BY子句中创建一个额外的行,该行包含了对分组数据的汇总信息。这在需要同时查看详细数据和总计数据时非常有用。

使用WITH ROLLUP时,查询结果会包含每个分组的详细数据,以及一个总计行,该总计行汇总了所有分组的数据。

SELECT
	class,
	AVG( age ) 
FROM
	students 
WHERE
	age IS NOT NULL 
GROUP BY
	class WITH ROLLUP;

查询结果:
学会这7种SQL进阶用法,让你少走99%的弯路!-小白菜博客
结果中包含了每个年级的平均年龄,并且返回所有的班级的学生平均年龄。

需要注意的是,总计行中分组键列的值为NULL,表示汇总了所有分组的数据。这使得我们可以通过检查分组键列是否为NULL来确定行是否为总计行。

子查询提取:WITH AS

在MySQL中,WITH AS子句(也称为子查询提取函数)允许你在一个查询中创建一个临时的命名子查询(也称为公共表表达式),然后在该查询的后续部分引用这个子查询。这有助于提高查询的可读性和简洁性,尤其是当查询中需要多次引用相同的子查询时。

WITH AS子句的基本语法:

WITH cte_name AS (
    SELECT columns
    FROM table
    WHERE conditions
)
SELECT columns
FROM cte_name
WHERE conditions;

假如我们查询分数大于80的,并且评级为A的并且不是2班的学生信息:

WITH s1 AS ( SELECT * FROM students WHERE score > 80 ),
s2 AS ( SELECT * FROM students WHERE class = 2 ) 
SELECT
	* 
FROM
	s1 
WHERE
	s1.id NOT IN ( SELECT s2.id FROM s2 ) 
	AND s1.grade = 'A';

结果如下:

image.png

WITH AS是从MySql 8.0.1开始提供

优雅处理数据插入、更新时主键或者唯一键冲突

在日常开发中,我们尝尝在插入数据时会遇到唯一键冲突导致插入失败的问题。如下:

假如我们的唯一键为:

ALTER TABLE students ADD UNIQUE KEY `uk_class_name` (`name`,`class`) USING BTREE;

我们执行以下sql:

SELECT * FROM students WHERE class = 1 and name = 'Alice';

查询结果:

image.png

此时我们在插入一条数据:

INSERT INTO students (name, grade, age, score, class) VALUES ('Alice', 'A', 18, 98, 1);

发现报错:

image.png

我们通常的做法时先按照唯一键查询一遍数据,如果存在则先删除数据,在进行插入。这种做法略显麻烦,并且可能会误删数据。此时我们就可以采取以下三种方法区优雅处理。

IGNORE

IGNORE关键字用于在执行插入、更新或删除操作时,忽略特定类型的错误,而不是中止整个操作。特别是在插入或更新数据时,如果存在唯一索引冲突或主键冲突,使用IGNORE关键字可以使得操作继续进行而不是因为错误而中断。

语法如下:

INSERT IGNORE INTO table_name (column1, column2, ...)
VALUES (value1, value2, ...);

UPDATE IGNORE table_name
SET column1 = value1, column2 = value2, ...
WHERE condition;

上述插入语句的示例中,我们使用IGNORE关键字:

INSERT IGNORE INTO students (name, grade, age, score, class) VALUES ('Alice', 'A', 18, 98, 1);

执行成功。
image.png

查询数据发现,数据没有变化:
image.png

如果UPDATE使用了IGNORE关键字,在更新数据时忽略那些会导致错误的行,比如更新更新后会违反唯一约束。

UPDATE IGNORE students SET name = 'Alice' WHERE id = 3;

此时会执行成功:
image.png

IGNORE在使用时应该谨慎,它可能会掩盖潜在的业务逻辑错误或数据一致性问题。并且在事务安全性和完整性要求较高的场景下可能并不适用。

REPLACE

REPLACE INTO是MySQL中用于向表中插入或替换数据的一种特殊语法。它类似于INSERT INTO语句,但是在插入数据时,如果发现表中已存在具有相同唯一索引或主键的记录,则会删除现有记录,然后插入新记录,而不是抛出错误或导致插入操作失败。即有则删除在插入,没有则插入。

语法如下:

REPLACE INTO table_name (column1, column2, ...)
VALUES (value1, value2, ...);

你也可以使用REPLACE INTOSELECT语句结合使用来替换表中的数据:

REPLACE INTO table_name (column1, column2, ...)
SELECT column1, column2, ...
FROM another_table
WHERE condition;

我们执行如下sql:

REPLACE INTO students (name, grade, age, score, class) VALUES ('Alice', 'A', 18, 98, 1);

执行成功,查询这条记录:
学会这7种SQL进阶用法,让你少走99%的弯路!-小白菜博客
此时我们发现记录的id重新生成了,并且数据页是插入的最新的数据。

REPLACE INTO会首先尝试删除表中具有相同唯一索引或主键的记录,然后再插入新记录。因此,在使用REPLACE INTO时应当谨慎,以确保不会意外删除需要保留的数据。

ON DUPLICATE KEY UPDATE

在MySQL中,ON DUPLICATE KEY UPDATE是用于在执行INSERT语句时,如果发生唯一键冲突(即违反了唯一索引或主键约束),则执行后面的更新操作。

当你想要向表中插入一行数据,但是如果这一行数据已经存在(即主键或唯一索引已经存在),则更新该行数据而不是插入新的行,即有则更新,没有则插入。

语法如下:

INSERT INTO table_name (column1, column2, ...)
VALUES (value1, value2, ...)
ON DUPLICATE KEY UPDATE column1 = value1, column2 = value2, ...;

我们执行以下sql:

INSERT IGNORE INTO students ( NAME, grade, age, score, class )
VALUES
	( 'Alice', 'A', 18, 98, 1 ) 
	ON DUPLICATE KEY UPDATE score = 100,
	grade = 'B';

执行成功,重新看一下这条数据:
image.png

数据已执行了更新操作。

这种方式适用于需要维护唯一记录(如用户名、邮箱等)的情况下,无需预先检查是否存在重复,就能保证数据的一致性和完整性。同时,它也减少了对数据库的请求次数,提高了处理效率。

总结

掌握以上这几种SQL进阶用法,能够让你在日常的数据处理工作中更加得心应手,少走很多弯路。通过优化查询逻辑、处理异常情况以及执行插入或更新操作,你可以更高效地管理和操作数据库,提升工作效率,从而更好地应对各种复杂的数据处理需求。

本文已收录于我的个人博客:码农Academy的博客,专注分享Java技术干货,包括Java基础、Spring Boot、Spring Cloud、Mysql、Redis、Elasticsearch、中间件、架构设计、面试题、程序员攻略等