【科技】对大数据理论的理解

对大数据理论的理解
王泓
2015-7-7

大数据是2008年由两名从事计算机软件研究的英国人舍恩伯格和库克耶提出的论点。
大数据基于计算机技术而言,不用随机抽样的分析方法,而采用全数据进行分析处理的方法。
其数据特点:数据量大,数据类型繁多,处理速度快,价值密度低。
大数据与计算机的关系:分布式数据挖掘--分布式数据处理--分布式数据库--云存储,虚拟化。
这个理论从表面上看是建立在计算机软件应用上的理论,但实际统计学的理论基础。计算机本身就是建立在数理统计学的基础之上的。
大数据的思维方式
1 定量思维:一切可测。
2 跨界思维:一切或可联。
3 操作思维:一切要可行。
4 实验思维:一切均可试。
大数据分析有其自身的重大缺陷:
非结构化数据与半结构化数据链的不完整性。
大数据的陷阱
1有数无据
2大而不全
3内生变量模糊了因果关系
大数据存在若多的不确定性。
中国在软件为什么形不成真正的产业的原因:
1中国对软件工程一知半解。
2中国人编程的随意性,
3中国软件工程有标准化,但从无人按标准化编程,其原因人工成本太高。
3软件工程没有完整的需求分析
4软件工程无标准化的软件开发数据字典。
5编程无中文英文注释。以致中国软件开发形成恶习,无人能够看懂,致使中国软件到今天都无法形成规模化软件产业,在国际软件界无一席之地。
对大数据而言:中国一知半解跟风潮的恶习不改,我们对大数据的理解连皮毛都知之甚少,更不要谈其核心问题了。现在中国在大数据问题上一是跟风,二是忽悠,根本没有一个科学的态度,去对待不成熟的大数据理论。

文章来自: 本站原创
引用通告: 查看所有引用 | 我要引用此文章
Tags:
相关日志:
评论: 0 | 引用: 0 | 查看次数: 2992