SQL数据分析10大常用功能

SQL难吗?说实话,要写好,很难很难。但要通过SQL笔试这关,并不难。相信大伙都使用过Excel,用SQL实现excel 常用操作去学,感觉会比较具体。我自身也刚入数据岗不久,本文也是为自己巩固一下SQL。

数据是网上找到的销售数据,命名为sale,长这样:

01. 关联公式:Vlookup

vlookup是excel几乎最常用的公式,一般用于两个表的关联查询等。所以我先创建一个新表:复制sale表并筛选出地区仅为广州的,命名为sale_guang。
create table sale_guang
SELECT * from sale where city="广州";

需求:根据订单明细号关联两表,并且sale_guang只有订单明细号与利润两列

SELECT * from sale a
inner JOIN
(SELECT ordernum,profit from sale_guang) b
on a.ordernum=b.ordernum

02. 对比两列差异

需求:对比sale的订单明细号与sale_guang订单明细号的差异;

SELECT * from sale a
WHERE a.ordernum not in 
(SELECT b.ordernum from sale_guang b);

03. 去除重复值

需求:去除业务员编码的重复值

SELECT * FROM sale
where salesnum not in 
(SELECT salesnum from sale
GROUP BY salesman
HAVING COUNT(salesnum)>1)

04. 缺失值处理

需求:用0填充缺失值或则删除有地区名称缺失值的行。

--用0填充:
update sale set city = 0 where city = NULL
--删除有缺失值的行:
delete from sale where city = NULL;

05. 多条件筛选

需求:想知道业务员张爱,在北京区域卖的商品订单金额大于等于6000的信息。

SELECT * from sale
where salesman = "张爱" 
and city = "北京"
and orderaccount >=6000;

06. 模糊筛选数据

需求:筛选存货名称含有”三星”或则含有”索尼”的信息。

SELECT * from sale
where inventoryname like "%三星%" 
or 存货名称 like "%索尼%";

07. 分类汇总

需求:北京区域各业务员的利润总额。

SELECT city,sum(`profit`)
from sale
WHERE city = "北京"
GROUP BY `city`;

08. 条件计算

需求:存货名称含“三星字眼”并且税费高于1000的订单有几个?这些订单的利润总和和平均利润是多少?

--有多少个?
SELECT COUNT(*) from sale
where inventoryname like "%三星%"
and `tax` > 1000 ;

--这些订单的利润总和和平均利润是多少?
SELECT `ordernum`,SUM(profit),AVG(`profit`)
from sale
where inventoryname like "%三星%"
and `tax` > 1000 
GROUP BY `ordernum`;

09. 删除数据间的空格

需求:删除存货名称两边的空格。

SELECT trim(inventoryname) from sale;

10. 合并与排序列

需求:计算每个订单号的成本并从高到低排序(成本 = 不含税金额 – 利润)

SELECT city,ordernum,
(Nontaxamount - profit) as cost 
from sale
order by cost DESC;

总结:结构化查询语言(Structured Query Language)简称SQL,果然和它名字一样,查询起来得心应手,但做想做数据处理方面,能明细感受到比Python和excel吃力(也可能是我还没学好orz)。

SQL笔试题原题

贴一些我在面试时遇到过的SQL笔试题吧:

某数据服务公司:

Student表

Score表

(1)查询Student表中的所有记录的Sname、Ssex和Class列。

select sname,ssex,class from student;

(2)查询Score表中成绩在60到80之间的所有记录。

select * from score between 60 and 80;

(3)查询95033班和95031班的平均分。

select class,avg(degree) from Score a
join student b
on a.sno = b.sno
GROUP BY CLASS

总之是比较简单的SQL笔试题了,当时很快就写完了。实际上这不是原题,不过我有印象就是考察这几个知识点,并且蛮简单的。

某手游公司的SQL笔试题(原题)

(1)建立表Student的语句写下来,表Student是由学号Sno,姓名Sname,性别Ssex,年龄Sage,所在系Sdept五个属性组成,其中学号属性不能为空,并且其值是唯一的。

create table Student_new
(sno varchar(20) PRIMARY KEY,
sname varchar(10),ssex char(2),
sage int,sdept varchar(25));

(2)在student 表中查询Sdept是“计算机”的学生所有信息并按SNO列排序。

select * from student
where sdept = "计算机" 
order by sno ;

(3)在以上三个表中查询Ccredit为5并且Grade大于60的学生的学号、姓名和性别。

select a.sno,a.sname,a.ssex from student a
join (Course b ,SC c)
on a.sno=c.sno and b.cno =c.cno 
where Ccredit = 5 and Grade > 60

某互联网金融公司SQL笔试题(原题)

(1)表A和表B的交集:

SELECT a.cus_id from `表a` as a
INNER JOIN `表b` as b
on a.cus_id=b.cus_id;

(2)表A和表B的并集:

SELECT * from `表a`
UNION
SELECT * from `表b`

(3)表A和表B的对称差:

SELECT * from `表a` 
where cus_id not in (SELECT * from `表b`)
UNION
SELECT * from `表b` 
where cus_id not in (SELECT * from `表a`);

(4)表A中存在但表B中不存在:

SELECT * from `表a`
WHERE cus_id not in (SELECT cus_id from `表b`);

原创文章,作者:guozi,如若转载,请注明出处:https://www.sudun.com/ask/78801.html

(0)
guozi's avatarguozi
上一篇 2024年5月30日 上午10:58
下一篇 2024年5月30日 上午11:03

相关推荐

  • 商企云网,商企云快线

    3、注册域名并购买主机。域名是您网站的地址,主机是您网站内容和数据的存储位置。域名注册可以通过国内、国际各大域名注册商进行,主机可以通过虚拟主机或独立服务器购买。 4.设计网站的结…

    行业资讯 2024年4月3日
    0
  • 软件二次开发费用算资产么,软件二次开发可以申请专利吗

    二次软件开发是对无限可能性和创新的令人回味的提醒。但你真的了解软件二次开发吗?它到底是什么?它的流程和步骤是什么?在这个快速发展的云服务器行业,二次软件开发常用的工具和平台有哪些?…

    行业资讯 2024年4月18日
    0
  • 中文域名被抢注案例,中文域名被骗怎么办

    首先,如果您发现自己的中文域名无法正常访问,应立即检查是否被劫持。您可以通过访问其他网站或使用VPN 来确定这是否是简单的网络问题。 2. 联系您的注册商 如果确认中文域名被劫持,…

    行业资讯 2024年5月6日
    0
  • 微网站建设报价

    微网站建设,这个似乎并不陌生的词汇,却隐藏着无穷的商机和发展空间。随着互联网时代的来临,越来越多的企业开始意识到拥有一个专属的微网站对于企业发展的重要性。那么什么是微网站建设?它又…

    行业资讯 2024年4月12日
    0

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注