大数据开发工程师需要具备哪些技能

2024-01-08 14:55:19

大数据开发工程师需要具备哪些技能

大数据开发工程师需要具备的技能如下：

简单来说，大数据工程师需要负责创建和维护数据分析基础架构，包括大数据架构的开发、构建、维护和测试，例如数据库和大数据处理系统。另外，还负责大数据工程师还负责创建用于建模，挖掘，获取和验证数据集合等流程。

1、大数据架构工具与组件

企业大数据框架的搭建，多是选择基于开源技术框架来实现的，这其中就包括Hadoop、Spark、Storm、Flink为主的一系列组件框架，及其生态圈组件。

2、深入了解SQL和其它数据库解决方案

大数据工程师需要熟悉数据库管理系统，深入了解SQL。同样其它数据库解决方案，例如Cassandra或MangoDB也须熟悉，因为不是每个数据库都是由可识别的标准来构建。

3、数据仓库和ETL工具

数据仓库和ETL能力对于大数据工程师至关重要。像Redshift或Panoply这样的数据仓库解决方案，以及ETL工具，比如StitchData或Segment都非常有用。

4、基于Hadoop的分析(HBase，Hive，MapReduce等)

对基于Apache Hadoop的数据处理框架，需要有深入的了解，至少HBase，Hive和MapReduce的知识存储是必需的。

5、编码

编码与开发能力是作为大数据工程师的重要要求，主要掌握Java、Scala、Python三门语言，这在大数据当中非常关键。

大数据开发工程师需要具备哪些技能

大数据运维工程师的具体职责描述

大数据运维工程师需要负责公司大数据平台的运维管理工作，集群容量规划、扩容及性能优化。下面是我为您精心整理的大数据运维工程师的具体职责描述。

大数据运维工程师的具体职责描述1

职责：

1、负责数据平台的运维管理工作(部署、监控、优化、故障处理);

2、负责Hadoop/Spark/Flink/Elasticsearch/Kafka等系统的架构审核、容量规划、成本优化;

3、负责大数据平台的用户管理、权限分配、资源分配;

4、参与数据挖掘、机器学习的平台的设计、并给出可执行的运维方案;

5、参与数据平台的相关工具开发(包括自动化部署、监控、ETL等);

6、深入理解数据平台架构，发现并解决故障隐患及性能瓶颈;

7、ETL工具、调度工具、关系型数据库的运维。

任职资格：

1、本科以上学历，计算机软件相关专业;

2、1年以上大数据相关组件运维经验(hadoop/yarn/hbase/hive/spark/kafka等)，1年以上的CDH或HDP维护经验，3年以上系统运维相关经验;

3、深入理解Linux系统，能独立部署开源软件，熟练掌握一门以上脚本语言 (shell/perl/python等)，熟悉python开发语言优先;

4、逻辑思维能力强，做事有条理，责任心强，工作积极主动，执行力强，有良好的团队协作意识。

大数据运维工程师的具体职责描述2

职责

1. 负责大数据ETL系统，运维及保障服务稳定可用;

2. 负责数据采集交换方案以及联调测试;

3. 负责采集交换任务的评审和上线;

4. 负责及时排除ETL流程故障，形成知识库，完善运维文档;

5. 负责监控和优化ETL的性能,持续性地提出改进自动化运维平台建议

技能要求

1. 计算机科学或相关专业本科及以上学历;

2. 熟悉Linux系统,熟练编写shell/perl/python一种或多种脚本语言;

3. 熟悉Hive、Hadoop、MapReduce集群原理，有hadoop大数据平台运维经验者优先;

4. 熟悉数据库的性能优化、SQL调优，有相应经验;

5. 抗压能力强，有强烈的责任心，良好的沟通能力、学习能力及团队合作能力。

大数据运维工程师的具体职责描述3

职责：

1、负责分布式大数据平台产品的运维和运维开发，保证其高可用和稳定性;

2、负责大数据系统架构的可运维性设计、容量规划、服务监控，持续优化服务架构、集群性能;

3、通过技术手段控制和优化成本，通过自动化工具及流程提升大数据平台运维效率;

4、为项目开发人员提供大数据技术指导及解决大数据平台应用中遇到的技术难题;

任职资格：

1、三年以上大数据运维相关工作经验，有大型互联网公司工作经验者优先，全日制本科及以上学历;

2、熟练掌握至少一门开发语言，有Java或Python语言开发经验优先;

3、精通Hadoop生态及高性能缓存相关的各种工具并有实战经验，包括但不限于Hadoop、HBase、Hive、Presto、Kafka、Spark、Yarn、Flink、Logstash、Flume、ClickHouse等;

4、熟悉Mysql等常用关系数据库，熟练编写SQL语句，有分布式nosql数据库应用、性能调优经验优先;

5、熟悉Linux环境，能够熟悉使用shell脚本;

6、对大数据技术有强烈兴趣，有志于往大数据方向深层次发展;

7、具有很强的责任心、执行力、服务意识、学习能力和抗压能力;

8、具备较好的沟通能力、主动性及责任感。

大数据运维工程师的具体职责描述4

职责：

1、负责大数据集群的日常维护、监控、异常处理等工作，保障集群稳定运行;

2、负责大数据批处理管理以及运维;

3、负责大数据集群的用户管理、权限管理、资源管理、性能优化等;

4、深入理解数据平台架构，发现并解决重大故障及性能瓶颈，打造一流的数据平台;

5、跟进大数据前沿技术，不断优化数据集群;

6、有华为大数据平台运维经验优先;

岗位要求：

1、1年以上大数据运维或开发经验;

2、有良好的计算机和网络基础，熟悉linux文件系统、内核、性能调优，TCP/IP、HTTP等协议;

3、熟悉大数据生态，有相关(HDFS、Hive、Hbase、Sqoop、Spark、Flume、Zookeeper、ES、Kafka)的运维及开发经验;

4、熟练使用shell、python等脚本语言开发相关运维管理工具;

5、良好的文档撰写习惯;

大数据运维工程师的具体职责描述5

职责：

1、负责公司内部及项目中大数据集群的构建，任务调度、监控预警，持续完善大数据平台，保证稳定性、安全性;

2、负责集群容量规划、扩容、集群性能优化及日常巡检和应急值守，参与大数据基础环境的架构设计与改进;

3、深入研究大数据业务相关运维技术，探索新的运维技术及发展方向。

任职要求：

1、熟悉Linux基础命令操作，能够独立编写Shell脚本开展日常服务器的运维;

2、熟悉Hadoop 生态圈 Hadoop、Kafka、Zookeeper、Hbase、Spark的安装与调优;

3、熟悉软硬件设备，网络原理，有丰富的大数据平台部署，性能优化和运维经验;

4、工作认真负责，有较强的学习能力，动手能力和分析解决问题的能力;

5、能够利用各种开源监控工具、运维工具，HA、负载均衡软件完成工作任务;

6、熟悉JVM 虚拟机调优;

大数据开发工程师需要具备哪些技能

大数据运维工程师的基本职责

大数据运维工程师需要处理公司大数据平台各类异常和故障，确保系统平台的稳定运行。下面是我为您精心整理的大数据运维工程师的基本职责。

大数据运维工程师的基本职责1

职责:

1、技术保障各底层支撑系统的可靠性与稳定性;

2、负责车辆网平台的运行监控的解决方案编制、实施与二次功能开发;

3、负责技术文档手册编写，更新，经验总结沉淀，培训分享;

4、负责对新技术和方案进行调研，评估和引进，用技术去提升运维生产效率

任职资格:

1、熟悉常见的应用服务部署和调优(Nginx、MySQL、Redis、MongoDB、ELK，Hadoop等)，熟悉高可用集群、负载均衡集群的规划与搭建;

2、熟练使用Linux、TCP/IP网络协议栈，了解常用的Troubleshooting手段和常见性能指标

3、具有车联网平台运维的经验，精于容量规划、架构设计、性能优化;

4、熟悉主流PaaS云产品的使用，具有运维平台开发经验者、参与过开源产品的开发者优先;

5、优秀的沟通能力，出色的学习与钻研能力，良好的问题分析与解决能力;

6、对行业技术敏感度高且细致，善于思考，乐于发现，对解决具有挑战性问题充满激情。

大数据运维工程师的基本职责2

职责：

1、负责维护服务器的运行，包括巡检、故障排除、数据备份等业务，保证服务器高质量、高效率运行状态;

2、负责服务器漏洞整改及补丁升级;

3、负责hadoop运维相关工作;

4、负责大数据平台的日常部署、升级、扩容、迁移;

5、负责高并发，大存储和实时流的Hadoop/spark大数据平台规划，运维，监控和优化工作。

任职资格：

1、2年左右服务器运维经验;

2、对linux基础运维命令熟悉，shell,python至少精通一种，如会scala语言可优先考虑;

3、熟悉Linux的维护和管理，熟悉bat及Shell脚本开发，能看懂Python/Scala优先;

4、做过大规模hadoop集群优先;

5、大数据项目：包括不限于hadoop、hive、kafka、hbase、spark、Kudu、Impala等大数据生态的平台搭建，监控，运维，调优、生产环境hadoop集群trouble shooting 、hadoop版本升级管理及优化支持。

大数据运维工程师的基本职责3

职责:

1、负责Hadoop平台搭建，运维，管理，故障处理。

2、负责保障大数据平台的高效运转、提升系统稳定性和安全性。

3、对平台的Hadoop，Hbase，Kafka，Hive等进行优化。

4、建立Hadoop集群管理和维护规范，包括版本管理和变更记录等。

岗位要求:

1、有丰富的Hadoop生态系统的运维经验，了解Hadoop、Storm、Spark、Kafka这些组件的原理，具备部署、实施、维护hadoop 及相关组件的能力;

2、至少精通 Perl/Python/Shell脚本语言中的一种;

3、掌握Linux操作系统的配置，管理、优化以及各种常用命令，能够独立排查及解决操作系统层的各类问题;

4、分析问题能力优秀，善于从各种系统、应用日志中寻找出问题的原因。

5、有独立分析问题和解决问题的能力，能出差。

大数据运维工程师的基本职责4

职责：

1.负责Hadoop、spark、hbase、oozie、hive等平台运营和优化工作，保障平台服务运行稳定、高效。

2.负责大数据方案架构及方案落地;

3.开发Hadoop大数据管理平台与监控建设;

3.负责hadoop平台部署、维护;生产问题、告警、故障处理及服务器维护、日常值班;

4.负责集群网络架构、机器管理等。

任职资格：

1. 全日制本科以上学历，三年以上后台系统运营工作经验;

2. 熟悉hadoop原理，具有Hadoop平台应用及管理经验，熟悉hadoop、hive、spark、hbase、oozie、druid、kylin、flink等开源项目及部署、维护、调优;

3. 熟悉linux操作系统及调优;熟悉sql编程，熟悉Shell/Python/Java/Perl语言的一种或多种，有开发经验优先，熟悉nagios,cacti,ganglia,zabbix,zenoss优先;

4. 对大数据和自动化运维开发有浓厚兴趣，有大规模hadoop运维经验者优先;有hadoop/hbase/spark/hive 开发经验者优先。

大数据运维工程师的基本职责5

职责：

1. 负责大数据平台的稳定性和性能优化;

2. 负责大数据项目的运维工作;

3. 针对业务需求制定统一的运维解决方案;

4. 完善自动监控报警系统，对业务层面关键指标进行监控与报警通知;

任职要求：

1、熟练掌握hadoop平台搭建、维护，有平台优化经验;

2、熟悉HDFS、Hive、Spark、HBbase、Kafka、Flume等组件的原理，有阅读源码能力者优先;

3、熟悉腾讯云产品，有腾讯云EMR使用经验者优先考虑;

上一篇：开题报告简约ppt模板-开题报告PPT模板的制作步骤有哪些？下一篇：机械方面的怎么升职升职的步骤