如今,我国在大数据研究和应用方面走在世界前列。什么是大数据?
大数据定义
广义的定义。大数据是指将物理世界映射并改进为数字世界。通过发现数据的特征,您可以做出提高效率的决策。
狭义上是指技术工程师提供的——条大数据,是通过采集、存储、分析从大量数据中提取价值的新技术架构。
相比之下,技术定义还是比较容易理解的。
你会怎么做? —— 数据采集、数据存储和数据分析
给谁? ——大数据量
—— 价值发现的目的是什么?
获取数据、存储数据和分析数据并不是新活动。我们每天都使用电脑,我们每天都这样做。然而,当应用于大数据时,同样的行为就不起作用了。换句话说,传统计算机或传统软件无法处理的数据被称为“大数据”。
大数据,到底有多大?
传统个人计算机以GB/TB 级别处理数据。例如,目前我们的硬盘容量通常为500GB/1TB/2TB。
大数据的层级定位
1 KB=1024 B(KB – 千字节)
1 MB=1024 KB(MB – 兆字节)
1 GB=1024 MB(GB – 千兆字节)
1 TB=1024 GB(TB – 太字节)
1 PB=1024 TB(PB – 拍字节)
1 EB=1024 PB(EB – 艾字节)
1 ZB=1024 EB(ZB – 泽字节)
那么大数据是什么级别呢?大多数人可能从未听说过它。实际上,这意味着在TB的基础上继续乘以1024倍。单看这个角色,并不是很直观。让我们举个例子。
1TB,只需要一个硬盘即可存储。容量约为20万张照片、20万个MP3音乐文件、671本小说和《红楼梦》本书。
1PB大约需要2个机柜的存储设备。容量约为2亿张照片或2亿个MP3音乐文件。如果你不停地听这首音乐,你可以听1900年。
1EB需要大约2,000个存储设备柜。这些机柜并排放置时跨度可达1.2 公里。如果安装在机房内,机房的大小相当于21个标准篮球场。
据称,阿里巴巴、百度、腾讯等互联网巨头的数据量已接近EB级。
EB 尚未达到最大值。目前全人类的数据量是ZB级别的。 2011年,全球创建和复制的数据总量为1.8ZB。到2020年,全球电子设备存储的数据量预计将达到35ZB。如果建造一个计算机实验室来存储这些数据,其面积将比42 个鸟巢体育场还要大。
不仅数据量大,而且——每年还在以50%的速度快速增长。这意味着它每两年就会翻一番。目前大数据应用尚未达到ZB级别,主要集中在PB/EB级别。
大数据的特征与价值
大数据的特点可以概括为四个V。
体量指的是上面提到的数据量巨大。
各种数据有多种格式,包括数字(价格、交易、数据、人数等)、文本(电子邮件、网页等)、图像、音频、视频、位置信息等。这是数据。
速度(时效性) 数据产生和消费之间的时间间隔非常短。数据正在以越来越快的速度变化和处理。
价值(价值密度) 大数据包含大量数据,但事实证明,只有一小部分数据真正具有价值。
人类提出和研究大数据的主要目的是发现大数据的价值。大数据的价值是什么?
2012年,世界经济论坛表示,“数据已经成为一种新的经济资产类别,就像货币和黄金一样。”如今,大数据应用开始走进我们的生活,影响着我们的吃、穿、住、行方式。
概括起来,大数据的价值主要来自两个方面:
帮助您了解您的用户。大数据通过关联分析将客户与产品和服务连接起来,定位用户偏好,提供更精准、更有针对性的产品和服务,提高销售业绩。
一个典型的例子是电子商务。阿里巴巴淘宝等电商平台积累了大量的用户购买数据。在早期,这些数据既笨重又繁重,需要大量的硬件成本来存储。但这些数据现在是阿里巴巴最有价值的资产。通过这些数据,可以分析用户行为,精准识别目标客群的消费特征、品牌偏好、地域分布等,让商家进行运营管理、品牌定位、促销营销等。大数据可以直接影响性能。其效率和准确性远远超过传统的用户研究。
除了电子商务之外,能源、电影、电视、证券、金融、农业、工业、交通、市政等各个领域都可以利用大数据。
帮助您了解自己。大数据不仅帮助我们了解用户,还帮助我们了解自己。
企业的生产经营需要大量的资源,大数据可以分析并锁定资源的具体情况,如储量分布、需求趋势等。通过可视化这些资源,企业主可以更直观地了解自己的企业运营情况,更快地发现问题,及时调整运营策略,降低经营风险。
简而言之,“如果你了解自己和敌人,你就能赢得任何战斗。”大数据帮助我们做出决策。
原创文章,作者:小条,如若转载,请注明出处:https://www.sudun.com/ask/87253.html