大数据需要学什么

阶段一、人工智能篇之Python核心
3、变量和基本数据类型
5、Python控制语句与函数
6.、Python数据库操作+正则表达式
7、Lambda表达式、装饰器和Python模块化开发
阶段二、人工智能篇之数据库交互技术
2、创建MySQL数据库和表
3、MySQL数据库数据管理
4、使用事务保证数据完整性
5、使用DQL命令查询数据
7、MySQL数据库备份和恢复

}

一、学习大数据需要的基础

Hbase--开放源代码非关系型,分布式数据库采用Google的BigTable建模,用Java编写并在HDFS上运行。

是一个通常在HDFS实例中的单独机器上运行的软件

个复制块,第一個复制块存储在同一机架的不同节点上最后一个复制块存储在不同机架的某个节点上。

通常以机架的形式组织机架通过一个交换机将所有系统连接起来。

的一个假设是:机架内部节点之间的传输速度快于机架间节点的传输速度

架构的优点是查询速度快通常在秒计甚至毫秒级以内就可以返回查询结果。

(但MPP 架构不适合大规模部署)

一个列的平凡列族当查询少量列时,列存储模型可以极大的减少磁盘IO 操莋提高查询性能。

在不同的 HDFS 节点上导致大量的数据跨越网络传输,从而降低查询性能

Sqoop(发音:skup)是一款开源的工具,一个用来将Hadoop和关系型数据库中的数据相互转移的工具

Sqoop项目开始于2009年,最早是作为Hadoop的一个第三方模块存在后来为了让使用者能够快速部署,

也为了让开发囚员能够更快速的迭代开发Sqoop独立成为一个Apache项目。

Kylin操作系统是国家高技术研究发展计划(863计划)的重大成果之一

是以国防科技大学为主導,与中软、联想等单位联合设计和开发的具有完全自主版权

可支持多种微处理器和多种计算机体系结构,具有高性能、高可用性和高咹全性

并与Linux应用二进制兼容的国产中文服务器操作系统。

下一篇大数据常识正在找资料完善中

}

我要回帖

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信