大数据新手入门的课程和书籍有什么推荐?

大数据新手入门的课程和书籍有什么推荐?,第1张

目前大数据技术体系已经非常庞大了,初学者要根据自己的发展规划来制定学习规划,入门大数据的方式也要结合自己的知识基础。

对于要进入IT互联网行业从事大数据开发岗位的同学来说,入门大数据可以先从编程语言开始,接着学习大数据平台知识,然后结合大数据平台来完成场景开发实践。在编程语言的选择上,可以重点考虑一下Java语言,相对于其他编程语言来说,目前Java岗位的人才需求量相对大一些。

对于要从事算法岗的同学来说,入门大数据也可以分成三个阶段,第一个阶段是编程语言的学习,第二个阶段是学习算法基础,这个阶段需要学习一下统计学、机器学习相关知识,为后续奠定一个基础,第三个阶段是结合场景来开展算法实践,这个阶段也需要掌握大数据平台的相关知识。

如果仅仅想通过学习大数据技术来提升自己的数据力,本身并没有从事大数据岗位的想法,那么入门大数据可以从学习Python语言开始,然后进一步学习基于Python语言来完成数据分析,这个过程同样要考虑到应用场景的问题,可以跟自己的专业方向相结合。

从整个大数据的技术体系结构来看,大数据技术涉及到数据采集、整理、存储、分析、呈现、应用和安全等领域,这些领域都可以采用单独学习的方式,比如既可以从数据采集开始学起,也可以从数据分析开始学起,但是不论从哪个领域开始学起,一定要重视与场景相结合,不能脱离场景来学习大数据技术。

最后,如果有学习大数据相关的问题,可以向我发起咨询。

《大数据处理之道》作者:何金池

分析比较了当下流行的大数据处理技术的优劣及适用场景,包括Hadoop、Spark、Storm、Dremel、Drill等,详细分析了各种技术的应用场景和优缺点;同时阐述了大数据下的日志分析系统,重点讲解了ELK日志处理方案;最后分析了大数据处理技术的发展趋势,重点从各种技术的起源、设计思想、架构等方面阐述大数据处理之道。

1、《Hadoop权威指南》

现在31版本刚刚发布,但官方并不推荐在生产环境使用。作为hadoop的入门书籍,从2x版本开始也不失为良策。

本书从Hadoop的缘起开始,由浅入深,结合理论和实践,全方位地介绍Hadoop这一高性能处理海量数据集的理想工具。刚刚更新的版本中,相比之前的版本增加了介绍YARN , Parquet , Flume, Crunch , Spark的章节,非常适合于Hadoop 初学者。

2、《Learning Spark》

《Spark 快速大数据分析》是一本为Spark 初学者准备的书,它没有过多深入实现细节,而是更多关注上层用户的具体用法。不过,本书绝不仅仅限于Spark 的用法,它对Spark 的核心概念和基本原理也有较为全面的介绍,让读者能够知其然且知其所以然。

3、《Spark机器学习:核心技术与实践》

以实践方式助你掌握Spark机器学习技术。本书采用理论与大量实例相结合的方式帮助开发人员掌握使用Spark进行分析和实现机器学习算法。通过这些示例和Spark在各种企业级系统中的应用,帮助读者解锁Spark机器学习算法的复杂性,通过数据分析产生有价值的数据洞察力。

大数据的基础知识,科普类的,自己去买本书就行了,大数据时代这样的书很多介绍的大数据的。另外大数据的技术,如数据采集,数据存取,基础架构,数据处理,统计分析,数据挖掘,模型预测,结果呈现。当然一些大数据的一些基础知识,比如java和hadoop等等,这个基本得自学。大学里面最接近这些的也就是计算机类专业。云计算的话,需要学习的知识应该包括但不限于:1、网络通信知识,包括互联网基础建设相关的所有知识;2、虚拟化知识,应该了解硬件运行原理以及虚拟化实现技术;3、数据库技术;4、网络存储技术;5、网络信息安全技术,最起码得明白什么是iso 17799;6、电子商务;7、容灾及备份技术;8、JAVA编程技术;9、分布式系统架构。。。

欢迎分享,转载请注明来源:表白网

原文地址:https://h5.hunlipic.com/biaobai/289580.html

(0)
打赏 微信扫一扫微信扫一扫 支付宝扫一扫支付宝扫一扫
上一篇 2023-07-04
下一篇2023-07-04

发表评论

登录后才能评论

评论列表(0条)

    保存