百度360必应搜狗淘宝本站头条
当前位置:网站首页 > IT知识 > 正文

SQL知识大全三):SQL中的字符串处理和条件查询

liuian 2025-04-05 20:09 10 浏览


点击上方蓝字关注我们


今天是SQL系列的第三讲,我们会讲解条件查询,文本处理,百分比,行数限制,格式化以及子查询。


条件查询


IF条件查询

#if的语法
IF(expr1,expr2,expr3)
#示例
SELECT IF(sva=1,"男","女") AS s FROM table_name 
WHERE sva != '';

CASE WHEN条件查询

case when 可以实现if函数的功能,同时也可以联合各类聚合函数使用。

# case when也可以实和if一样的功能
SELECT CASE 
WHEN sva=1 THEN '男' 
  ELSE '女' 
END AS s 
FROM table_name
WHERE sva != '';


#case when可以联合聚合函数等使用
SELECT count(DISTINCT CASE
                          WHEN sva=1 THEN 'id'
                          ELSE 'null'
                      END) AS s
FROM TABLE_NAME
WHERE sva != '';


文本处理


SUBSTR()字符串截取

substr语法详解:

substr(strings|express,m,[n])

strings|express :被截取的字符串或字符串表达式

m 从第m个字符开始截取

n 截取后字符串长度为n

示例:
  select substr('abcdefg',3,4) from dual;
  # 结果是cdef


  select substr('abcdefg',-3,4) from dual;
  # 结果efg
  
  select substr('abcde',2),substr('abcde',-2),substr('abcde',2,3),substr('abcdewww',-7,3) from dual;
  # 结果是bcde、de、bcd、bcd


字符串拼接

1.使用特殊操作符拼接

#ACESS和SQL Serve使用+
SELECT vend_name + ' (' + vend_country + ')'
FROM Vendors
ORDER BY vend_name;


#DB2,Oracle, PostgreSQL,SQLite ,Open Office Base使用||
SELECT vend_name || ' (' || vend_country || ')' 
FROM Vendors
ORDER BY vend_name;

2.CONCAT()函数拼接

SELECT Concat(vend_name, ' (', vend_country, ')') 
FROM Vendors
ORDER BY vend_name; 


SPLIT()字符串分割

语法结构

split(str, regex) - Splits

str:需要分割的字符

regex:以什么符号进行分割

1.基本用法

split('a,b,c,d',',')
# 得到的结果:
["a","b","c","d"]

2.截取字符串中的某个值

当然,我们也可以指定取结果数组中的某一项

split('a,b,c,d',',')[0]


# 得到的结果:
a

3.特殊字符的处理

特殊分割符号

regex 为字符串匹配的参数,所以遇到特殊字符的时候需要做特殊的处理

# 例3: "." 点
split('192.168.0.1','.')


# 得到的结果:
[]
# 正确的写法:
split('192.168.0.1','\\.')
# 得到的结果:
["192","168","0","1"]


LENGTH()返回字符串长度

SELECT length(vend_name) vend_len
FROM Vendors
ORDER BY vend_name;


LOWER()/UPPER()将字符串转换为小写或大写

SELECT vend_name, 
LOWER(vend_name) AS vend_name_lowcase,
UPPER(vend_name) AS vend_name_upercase 
FROM Vendors
ORDER BY vend_name;

REPLACE()字符串替换

#将adress字段中的区替换为”呕“
select *,replace(address,'区','呕') AS rep
from test_tb


LEFT()/RIGHT()返回字符串左边或右边的字符

select left(CONTRACT_NAME,2)
from
gb_t_contract 
where 1=1;
#从字符表达式最左边一个字符开始返回指定数目的字符.
#若 b 的值大于 a 的长度,则返回字符表达式的全部字符a.如果 b 为负值或 0,则返回空字符串.




select left('2323232',9) ;
# 返回值为空


LTRIM()/RTRIM()/TRIM()去掉字符串左边/右边或全部空格

select ltrim('   sample ') from table;
# 返回结果:'sample '
select rtrim('   sample ') from table;
# 返回结果:'   sample'
select trim('   sample ') from table;


# 返回结果:'sample'

SOUNDEX() 返回字符串SOUNDEX值

#近似匹配
SELECT cust_name, cust_contact
 FROM Customers
 WHERE SOUNDEX(cust_contact) = SOUNDEX('Michael Green');

CAST数据类型转换

# 将str类型的dt字段转换为int类型的
select cast(dt as int)  dt
from table


取百分比


percentile()

语法格式:

percentile_approx(DOUBLE col, p ,[B])) 近似中位数函数

percentile(DOUBLE col, p ) 中位函数


前者多了一个参数B,后者无参数,其余语法一致。

求近似的第pth个百分位数,p必须介于0和1之间,返回类型为double,但是col字段支持浮点类型。参数B控制内存消耗的近似精度,B越大,结果的准确度越高。默认为10,000。当col字段中的distinct值的个数小于B时,结果为准确的百分位数。

select percentile(mmr,0.3) as 30_percentile,
percentile_approx(mmr,0.5) 50_percentile
from match_table


限制行数


LIMIT的用法

select account_id,account_name
from table
limt 100


格式化显示


FORMAT()数据格式化

FORMAT() 函数用于对字段的显示进行格式化。

SQL FORMAT() 语法:

SELECT FORMAT(column_name,format) FROM table_name;


FORMAT(X,D):强制保留D位小数,整数部分超过三位的时候以逗号分割,并且返回的结果是string类型的。


 SELECT FORMAT(100.3465,2),FORMAT(100,2),FORMAT(,100.6,2);
 # 结果分别:100.35,100.00,100.60


子查询


1.子查询条件过滤

SELECT cust_id
FROM Orders
WHERE order_num IN (SELECT order_num
FROM OrderItems
WHERE prod_id = 'RGAN01');

2.子查询作为计算字段


SELECT cust_name,
       cust_state,
       (SELECT COUNT(*)
         FROM Orders
         WHERE Orders.cust_id = Customers.cust_id) AS orders 
FROM Customers
ORDER BY cust_name;



参考书籍:《SQL必知必会》


SQL系列文章持续更新中


往期推荐

SQL知识大全(一):数据库的语言分类你都知道吗?

史上最全的SQL知识点汇总,错过这次等一年

游戏行业指标体系大全(一)

游戏行业指标体系大全(二)

数据岗知识体系及岗位介绍



分享数据知识,成就数据理想

相关推荐

GANs为何引爆机器学习?这篇基于TensorFlow的实例教程为你解惑!

「机器人圈导览」:生成对抗网络无疑是机器学习领域近三年来最火爆的研究领域,相关论文层出不求,各种领域的应用层出不穷。那么,GAN到底如何实践?本文编译自Medium,该文作者以一朵玫瑰花为例,详细阐...

高丽大学等机构联合发布StarGAN:可自定义表情和面部特征

原文来源:arXiv、GitHub作者:YunjeyChoi、MinjeChoi、MunyoungKim、Jung-WooHa、SungKim、JaegulChoo「雷克世界」编译:嗯~...

TensorFlow和PyTorch相继发布最新版,有何变化

原文来源:GitHub「机器人圈」编译:嗯~阿童木呀、多啦A亮Tensorflow主要特征和改进在Tensorflow库中添加封装评估量。所添加的评估量列表如下:1.深度神经网络分类器(DNNCl...

「2022 年」崔庆才 Python3 爬虫教程 - 深度学习识别滑动验证码缺口

上一节我们使用OpenCV识别了图形验证码躯壳欧。这时候就有朋友可能会说了,现在深度学习不是对图像识别很准吗?那深度学习可以用在识别滑动验证码缺口位置吗?当然也是可以的,本节我们就来了解下使用深度...

20K star!搞定 LLM 微调的开源利器

LLM(大语言模型)微调一直都是老大难问题,不仅因为微调需要大量的计算资源,而且微调的方法也很多,要去尝试每种方法的效果,需要安装大量的第三方库和依赖,甚至要接入一些框架,可能在还没开始微调就已经因为...

大模型DeepSeek本地部署后如何进行自定义调整?

1.理解模型架构a)查看深度求索官方文档或提供的源代码文件,了解模型的结构、输入输出格式以及支持的功能。模型是否为预训练权重?如果是,可以在预训练的基础上进行微调(Fine-tuning)。是否需要...

因配置不当,约5000个AI模型与数据集在公网暴露

除了可访问机器学习模型外,暴露的数据还可能包括训练数据集、超参数,甚至是用于构建模型的原始数据。前情回顾·人工智能安全动态向ChatGPT植入恶意“长期记忆”,持续窃取用户输入数据多模态大语言模型的致...

基于pytorch的深度学习人员重识别

基于pytorch的深度学习人员重识别Torchreid是一个库。基于pytorch的深度学习人员重识别。特点:支持多GPU训练支持图像的人员重识别与视频的人员重识别端到端的训练与评估简单的re...

DeepSeek本地部署:轻松训练你的AI模型

引言:为什么选择本地部署?在AI技术飞速发展的今天,越来越多的企业和个人希望将AI技术应用于实际场景中。然而,对于一些对数据隐私和计算资源有特殊需求的用户来说,云端部署可能并不是最佳选择。此时,本地部...

谷歌今天又开源了,这次是Sketch-RNN

前不久,谷歌公布了一项最新技术,可以教机器画画。今天,谷歌开源了代码。在我们研究其代码之前,首先先按要求设置Magenta环境。(https://github.com/tensorflow/magen...

Tensorflow 使用预训练模型训练的完整流程

前面已经介绍了深度学习框架Tensorflow的图像的标注和训练数据的准备工作,本文介绍一下使用预训练模型完成训练并导出训练的模型。1.选择预训练模型1.1下载预训练模型首先需要在Tensorf...

30天大模型调优学习计划(30分钟训练大模型)

30天大模型调优学习计划,结合Unsloth和Lora进行大模型微调,掌握大模型基础知识和调优方法,熟练应用。第1周:基础入门目标:了解大模型基础并熟悉Unsloth等工具的基本使用。Day1:大模...

python爬取喜马拉雅音频,json参数解析

一.抓包分析json,获取加密方式1.抓包获取音频界面f12打开抓包工具,播放一个(非vip)视频,点击“媒体”单击打开可以复制URL,发现就是我们要的音频。复制“CKwRIJEEXn-cABa0Tg...

五、JSONPath使用(Python)(json数据python)

1.安装方法pipinstalljsonpath2.jsonpath与Xpath下面表格是jsonpath语法与Xpath的完整概述和比较。Xpathjsonpath概述/$根节点.@当前节点...

Python网络爬虫的时候json=就是让你少写个json.dumps()

大家好,我是皮皮。一、前言前几天在Python白银交流群【空翼】问了一个Python网络爬虫的问题,提问截图如下:登录请求地址是这个:二、实现过程这里【甯同学】给了一个提示,如下所示:估计很多小伙伴和...