㈠ 简述何为大数据分析,并简单阐述大数据5v特性

大数据(big data),是指在可承受的时间范围内用常规软件工具进行捕捉、管理和处理的数据集合。

大数据5V特征:

Volume(大体量):即可从数百TB到数十数百PB,并依据数据、整理、分析.

5Value(大价值):即大数据包含很多深度的价值,大数据分析挖掘和利用将带来巨大的商业价值

Veracity(准确性)、甚至EB的规模:即处理的结果要保证一定的准确性.

㈡ 什么是3V,4v,5V特征,这些特征对大数据计算过程带来什么样的挑战

IBM提出了大数据”5V”特点:

一、Volume:数据量大,包括采集、存储和计算的量都非常大。大数据的起始计量单位至少是P(1000个T)、E(100万个T)或Z(10亿个T)。

二、Variety:种类和来源多样化。包括结构化、半结构化和非结构化数据,具体表现为网络日志、音频、视频、图片、地理位置信息等等,多类型的数据对数据的处理能力提出了更高的要求。

三、Value:数据价值密度相对较低,或者说是浪里淘沙却又弥足珍贵。随着互联网以及物联网的广泛应用,信息感知无处不在,信息海量,但价值密度较低,如何结合业务逻辑并通过强大的机器算法来挖掘数据价值,是大数据时代最需要解决的问题。

四、Velocity:数据增长速度快,处理速度也快,时效性要求高。比如搜索引擎要求几分钟前的新闻能够被用户查询到,个性化推荐算法尽可能要求实时完成推荐。这是大数据区别于传统数据挖掘的显著特征。

五、Veracity:数据的准确性和可信赖度,即数据的质量。
————————————————
版权声明:本文为CSDN博主「arsaycode」的原创文章.........