首頁 > 制度大全 > 大數據(高級)研發工程師職位描述與崗位職責任職要求

大數據(高級)研發工程師職位描述與崗位職責任職要求

2024-07-26 閱讀 7574

職位描述

工作職責

1、負責在全球互聯網下頭條系產品短視頻用戶體驗的持續優化;

2、構建短視頻相關數據倉庫,分析和報表系統;

3、設計并優化視頻播放QoS數據上報機制,構建面向用戶體驗的APM系統;

4、通過建設實時數據分析,構建智能播放調度策略和自動報警歸因系統。

任職要求

1、本科及以上學歷,計算機、通信等相關專業,兩年及以上全職工作經驗;

2、有扎實的編程能力,有優秀的設計和代碼品位,有獨立的代碼實現能力;

3、深刻理解計算機原理,有良好的數據結構和算法基礎;

4、熟悉數據采集、清洗入庫、統計計算、Web展示核心要點,可實現指標計算需求;

5、熟悉至少一個分布式框架,如Hadoop/YARN、Hive、Spark、Storm、Kafka等,有Flink實時處理經驗優先;

6、優秀的理解溝通能力,能快速理解業務背景,責任心強,具有良好的團隊溝通與協作能力;

7、有大數據處理、數據平臺、數據倉庫經驗者或數據挖掘算法優先。

篇2:大數據研發崗位職責

大數據研發職位描述:

1、理解數據的產品應用場景邏輯,通過統計方法和通用分布式框架工具語言如hadoop,不斷加強數據服務質量;

2、負責數據清洗、轉換、建模等工作,對海量用戶行為數據通過hadoop/spark等進行離線和實時處理;

3、參與用戶畫像、個性化推薦系統等數據產品的開發工作

4、參與數據、工具平臺相關的功能接口、數據接口開發,完成業務功能;

崗位要求:

1、精通java或scala語言,具有面向對象編程思想,對底層實現有一定研究;

2、精通sparksql、sparkstreaming等編程,具有實際大型分布式集群項目開發經驗;

3、熟悉Linux操作系統,熟悉Linuxshell編程;

4、熟悉mysql,redis等常用數據庫,jetty等中間件;

5、熟悉分布式存儲或NoSQL數據庫技術,如hbase等;

6、熟悉Hadoop生態環境,精通以下一種或多種大數據技術,如flume、Kafka、Hdfs、MR、elasticsearch;

7、熟悉常用的數據挖掘算法優先。職位描述:

1、理解數據的產品應用場景邏輯,通過統計方法和通用分布式框架工具語言如hadoop,不斷加強數據服務質量;

2、負責數據清洗、轉換、建模等工作,對海量用戶行為數據通過hadoop/spark等進行離線和實時處理;

3、參與用戶畫像、個性化推薦系統等數據產品的開發工作

4、參與數據、工具平臺相關的功能接口、數據接口開發,完成業務功能;

崗位要求:

1、精通java或scala語言,具有面向對象編程思想,對底層實現有一定研究;

2、精通sparksql、sparkstreaming等編程,具有實際大型分布式集群項目開發經驗;

3、熟悉Linux操作系統,熟悉Linuxshell編程;

4、熟悉mysql,redis等常用數據庫,jetty等中間件;

5、熟悉分布式存儲或NoSQL數據庫技術,如hbase等;

6、熟悉Hadoop生態環境,精通以下一種或多種大數據技術,如flume、Kafka、Hdfs、MR、elasticsearch;

7、熟悉常用的數據挖掘算法優先。

篇3:高級大數據產品研發工程師職位描述與崗位職責任職要求

職位描述

崗位職責:

1.參與公司數據開發平臺、BI產品等大數據產品的設計和開發;

2.負責數據開發平臺、BI產品等大數據產品的部署和維護,保證其穩定和可靠;

3.關注和參與大數據方向開源產品的技術動態與演進,推動產品與技術架構持續更新;

任職要求:

1.計算機相關專業,本科及以上學歷,5年以上軟件開發經驗,3年以上互聯網產品或分布式系統開發設計經驗;

2.精通Java,Python,Scala等一種或幾種編程語言,并熟悉Linux操作系統及BashShell編程;

3.有Hadoop/Spark/Hive/Presto/HBase/ElasticSearch/Kafka等使用經驗,并熟悉上述常用的分布式系統架構設計和原理;

4.熟悉微服務框架及相關技術,如Dubbo,SpringCloud等;

5.熟悉MySQL、Redis,并了解或接觸過其他數據庫如Oracle,SqlServer,PostgreSQL,MongoDB等;

6.了解容器技術,如Docker,Kubernetes;

7.具有一定的軟件設計能力,熱愛大數據和技術,相信技術改變世界,學習能力強,認同數據價值,有面向業務的思維,較強的自主學習能力和英文技術文檔閱讀能力;

8.良好的溝通能力、團隊精神及服務意識,勇于接受挑戰,能承受較大的工作壓力;

9.有生產環境快速trouble-shooting的經驗和能力者優先;

10.有OLAP,多維度數據分析經驗優先,有對數據倉庫有較強的理論基礎和理解者優先;