新手数据库入门指南

此文是《10周入门数据分析》系列的第5篇。想了解学习路线,可以先行阅读“10周计划”公中号上已更新到第11篇,详情可见文末。上周更新了两篇Excel学习,有读者

老铁们,大家好,相信还有很多朋友对于新手数据库入门指南和的相关问题不太懂,没关系,今天就由我来为大家分享分享新手数据库入门指南以及的问题,文章篇幅可能偏长,希望可以帮助到大家,下面一起来看看吧!

公众号已更新至第11条。详细信息可以在文章末尾找到。

上周更新了两篇Excel学习文章,有读者反映写得不够实用。我在这里解释一下。真的很难用语言来详细描述每一个步骤,否则就真的可以写成一本书了。文章更多的是一个引导,告诉大家为什么要学这个,主要学什么,如何学?深入操作需要大家花费额外的时间,所以我尽力把素材留给大家了。

还有人建议制作一个视频,那就太好了!伟大的!明年的计划。即使没有时间,我也会推荐一些我认为还可以的视频供大家学习。

又到了年底了,这几个晚上我都在努力写年终报告。你写完了吗?

好了,回到正文,这篇文章讲的是数据库知识:

刚入职场、刚刚接触数据分析的人经常会问我做数据分析需要学习什么,应该如何规划自己的学习路径。我会告诉他:如果你还擅长使用Excel,那就先学Excel吧。当你使用Excel处理和分析一些小数据集没有问题时(具体表现是:常用函数公式唾手可得,数据透视表,如果你精通过滤、排序、图表),你可以学习SQL语言,然后使用BI进行分析并熟悉业务。然后到了一定阶段,就可以开始使用R或者Python了。如果后面能更进一步的话,可以了解一下Spark等一些大数据框架。

为什么要学习Excel?

首先,Excel是我们最常用的数据分析处理工具。 Excel的功能非常丰富,基本上可以涵盖我们后面在其他软件(SQL、BI、Python、R)中学习的功能。

有人可能会问,既然Excel这么强大,为什么还需要学习其他工具呢?这是因为Excel是通过菜单操作的,这使得自动化和重用功能变得困难。当然,你也可以通过VBA来完成。使用VBA就是编程,但由于VBA是一门基本可以学习的语言,在办公软件中使用时,学习的投入成本与产出效益是不成比例的。不建议学习。这是客观原因之一;二是Excel性能较差,在处理比较大的数据集时经常崩溃。 (虽然Excel 2013及以上版本号称可以容纳100万+条记录,但数万条数据后就开始卡顿)。

为什么学完Excel之后还要学SQL?

客观原因是大部分数据分析岗位都需要SQL技能。为了保证数据的安全性和管理的方便性,企业内的数据统一存储在数据库中。从数据库中提取和查询数据需要使用SQL语言。有些公司甚至使用SQL语言进行数据分析。

另一个原因是,即使你先学习其他工具,比如R、Python,甚至Spark这样的大数据框架,你会发现最后还是要学SQL。如果先学习SQL,可以在学习R、Python、Spark等更复杂的工具之前先弄清楚很多概念,对以后的学习会有帮助。这就像盖房子一样。你先打好基础,然后一层一层地建造。

SQL语言的学习排在Excel之后,其他工具之前。还有一个很重要的原因是SQL可以在一定程度上帮助Excel解决大数据集的问题,同时也搭建了通往其他工具的桥梁。

数据库和SQL的学习也分为两篇文章。第一篇文章讲了数据库和表的概念。第二部分是掌握SQL语句和操作数据库。

一、数据库基础知识

先说一下我对数据库的理解。顾名思义,数据库是数据的集合,由数据表组成。

放在物理实体上,就是一堆写在磁盘上的文件,文件中包含着数据。这些最基本的数据形成一个表格。我们把它想象成一张Excel表格,如下图:

每个表都有一个唯一的标识符、主键或ID。 ID是数据库中的一个重要概念,称为唯一标识符/主键,用于表示数据的唯一性。它相当于我们的身份证,是唯一的。有了身份证,我们就知道数据在哪里。

ID通常没有商业意义,它是唯一的标识。每个表只能有一个主键,主键通常是一个整数。主键一旦建立,其值通常不允许修改。

数据库是表的集合。一个数据库中可以有多个表。我们为每个表命名,并且这些表可以相互关联。连接意味着数据可以进行相应的匹配。正式名称为connection,对应的操作称为Join。我们将其想象为Excel 中的vlookup。

比如上面两张图,左图是学生信息表,右图是教师信息表。左图的主键是学生ID,右图的主键是教师ID。细心的读者可能会发现,右图中有一张学生证。这里的学生ID是专门用来连接用户表的。它不是主键。只是两张表通过学号这一唯一信息关联起来。

但是两个表之间的关系并不是一一对应的信息,可能存在差距,比如:

当两个表连接起来后,就会变成:

了解了上面的概念,你就知道什么是关系数据库了。简单来说,它是由多个可以相互连接的二维行列表组成的数据库。在准备数据时,我们通常需要建立表关联来进行分析。

关系数据库是基于关系代数模型开发的。常用的关系数据库有SQL Server、MySQL、Oracle、DB2等,这个要看企业的使用情况。我们后续的研究将基于MySQL。

各种关系型数据库(不感兴趣可以跳过):

DB2:关系数据库适用于大型分布式应用系统。这确实是一个非常非常好的数据库。它在稳定性、安全性、恢复性等方面都无可挑剔,非常适合从小规模到大规模的应用。不过使用起来感觉很麻烦,而且安装的时候有很多要求。很多软件可能会和DB2冲突,因为DB2一般安装在小型机或者服务器上,所以安装在PC上非常麻烦。创建一个新的库需要设置很多东西并分配各种存储空间。

新手数据库入门指南

Oracle:是目前市场占有率最大的数据库。我在学习SSH的时候用过Oracle。安装起来很麻烦,程序文件多达3G……使用起来很方便。对于像我这样的初学者来说,这是一个非常简单的配置。对于要求较高的企业级应用,也有非常复杂的配置和管理方法。它拥有非常强大的数据字典,可以说是最实用的数据库。不过查了一下,发现好贵……

MS SQL:最初使用版本2000和2005,这两个版本有很大不同。 2000年的数据库非常好。该程序体积小,操作方便,功能比较齐全。各方面都可以算是一个非常一般的数据库。它是一个中型数据库。我在我的毕业设计中使用了MS SQL 2000。 2005年增加了很多功能,复杂了很多,有大数据库的风格,价格也变高了。个人感觉除非你使用的是Window Server系统或者是针对微软的产品,否则还是使用Oracle比较好。

MySQL: MySQL是一个非常优秀的关系数据库。它是免费且功能齐全的。该程序很小且易于安装。现在很多网站都使用MYSQL。它不擅长领域限制。其他都不错,MS SQL也差不多。

Access:是典型的桌面数据库。我觉得它可以作为一个独立的系统来使用,比如记账、做笔记等。在局域网中运行一个小系统太困难了。数据源连接非常简单。因为它是一个Office数据库,所以Windows自带了自己的数据。来源。

二、尝试使用MySQL数据库

如果您没有接触过数据库或者SQL,建议您下载安装MySQL数据来尝试。 MySQL数据库的下载和安装比较简单,安装完成后即可使用。

可以访问MySQL官网下载,网址如下(这里给出Windows版本下载地址):

“关联”

下载MySQL时需要免费注册,注册页面为英文。下载工具后,点击运行,该程序会自动在线为您安装MySQL并自动配置。安装过程中需要设置密码,自己设置一个登录密码,记住下次登录MySQL时需要这个密码。

解压后没有my.ini文件(我的端口设置是3308),截图是我添加的。

管理员命令行:

在MySQL安装目录的bin目录下执行命令:

mysqld –初始化–console

得到以下结果:

我看到一个警告并检查了mysql。建议使用utf8mb4。

修改my.ini文件

警告消失了,上面打印了默认密码:njuUJkpH4/I

然后,安装服务:

mysqld –安装MySQL8.0

因为这是电脑上的第二个mysql,服务名改为MySQL8.0

启动服务:

净启动MySQL8.0

修改初始密码

登录mysql后执行:

更改用户’root’@’localhost’ 通过mysql_native_password 识别为’123456’;

将MySQL连接到Excel或其他数据分析工具

默认安装时,有一个插件可以让MySQL数据库连接到Excel。试想一下,我们在MySQL数据库中通过SQL语言对大量数据进行处理和计算,将计算结果存储在特定的数据表中,然后使用Excel连接MySQL数据库,将数据读入Excel中,使用Excel进行分析并绘制图表,省去了从数据库导出数据再导入Excel的麻烦。会提高效率吗?

用户评论

新手数据库入门指南
剑已封鞘

终于找到一篇通俗易懂的数据库入门指南了!作为一个完全菜鸟的大学生,以前对数据库一直一头雾水,这篇文章把各种概念解释得清 claro, 让我一下子就理解很多!

    有13位网友表示赞同!

新手数据库入门指南
自繩自縛

作为一名软件工程师已经工作两年了,没想到这么基础的东西还有人写教程。不过看这个标题好像是面向新人设计的,我觉得有些内容还是值得一看的。

    有13位网友表示赞同!

新手数据库入门指南
志平

这篇文章确实非常适合菜鸟入门数据库,我最近开始学习编程,感觉理解数据库对我的学习很有帮助。感谢作者分享!

    有14位网友表示赞同!

新手数据库入门指南
红尘滚滚

写给新人的数据库入门指南? 我觉得应该更名为 “数据库入门指南 – 全能版”,因为这篇文章涉及很多高级概念,对我来说有些深奥.

    有5位网友表示赞同!

新手数据库入门指南
未来未必来

对于新手来说,这篇指南确实非常全面了。 从数据库的基本概念到操作的步骤都讲解得很详细。 现在看我的代码感觉都能优化!

    有13位网友表示赞同!

新手数据库入门指南
拉扯

标题有点误导人啊,这篇文章的内容对初学者来说有些难度吧? 我以为是简明扼要型的入门指南,结果很多概念都不太懂…

    有16位网友表示赞同!

新手数据库入门指南
折木

我从别的平台看到这个教程分享了,看起来不错。我现在正在学习web开发,数据库知识很重要, 感觉可以参考一下这篇入门指南。

    有10位网友表示赞同!

新手数据库入门指南
微信名字

数据库入门指南真的太重要了! 这篇文章把数据结构和 SQL语句都解释得清晰易懂,简直是学习数据库的利器!

    有14位网友表示赞同!

新手数据库入门指南
滴在键盘上的泪

看这篇指南我才知道原来数据库里还有这么多分类和操作方法啊! 太有趣了,我以前只知道简单的查询语句。

    有11位网友表示赞同!

新手数据库入门指南
日久见人心

虽然这篇文章非常详细,但是对于完全没有编程基础的新人来说可能有些难度吧? 比如SQL语句的讲解部分,需要一定的代码理解能力来入门。

    有7位网友表示赞同!

新手数据库入门指南
反正是我

感觉作者把多年数据库经验都写在了这份指南里,从基础知识到进阶技巧都罗列得很完整。 对想深入了解数据库的人非常有用!

    有19位网友表示赞同!

新手数据库入门指南
北染陌人

看了这篇文章后我才明白为什么数据库设计很重要了!原来数据结构的选择会直接影响到程序的效率和性能啊!

    有18位网友表示赞同!

新手数据库入门指南
*巴黎铁塔

这个指南写的挺好的,把常用的数据库操作都总结得很清晰。 我最近在学 Python,这方面的内容可以帮到我。

    有9位网友表示赞同!

新手数据库入门指南
眷恋

希望能看到更多高级的数据库知识分享,比如分布式数据库、NOSQL 数据库等等,这些内容对软件工程师来说都很关键!

    有8位网友表示赞同!

新手数据库入门指南
减肥伤身#

总觉得现在的教程都太主观了,缺乏实践案例的讲解。希望作者能增加一些真实的应用场景,这样更能帮助 newbies 理解数据库的实际使用情况。

    有11位网友表示赞同!

新手数据库入门指南
执拗旧人

这篇指南虽然简单易懂,但是我觉得还是太理论化了, 缺少一些编程实战内容。希望以后可以添加一些代码示例,让读者更直观地学习数据库操作!

    有14位网友表示赞同!

新手数据库入门指南
裸睡の鱼

作为一名开发工程师,我看过很多数据库入门教程, 这篇文章写的思路比较清晰,而且讲解也很详细, 对入门者来说很有帮助!

    有19位网友表示赞同!

新手数据库入门指南
来瓶年的冰泉

我觉得这篇指南缺少一点互动性。希望作者可以加入一些练习题或者代码挑战,这样能更有效地帮助读者巩固学习成果!

    有10位网友表示赞同!

新手数据库入门指南
不忘初心

我非常喜欢这篇文章的写作风格,语言幽默风趣,内容又很丰富,学习起来并不枯燥。 我已经推荐了很多同学来看这篇入门指南!

    有18位网友表示赞同!

原创文章,作者:小su,如若转载,请注明出处:https://www.sudun.com/ask/121302.html

(0)
小su's avatar小su
上一篇 2024年9月1日 下午2:17
下一篇 2024年9月1日 下午2:20

相关推荐

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注