一、工作職責
1. 為Scilit數據庫進行大數據數倉的設計、開發、維護工作,同瑞士數據和分析團隊協同,整合MDPI公司級數倉體系,建構豐富穩定的數據資產;
2. 建立和提高數據模型的準確性、易用性、靈活性、可擴展性,提升查詢效率,為可視化報表和開發、數據分析、工程項目和算法開發等數據應用提供良好的條件;
3. 收集、清洗、整理Scilit數據,提升Scilit數據質量、數據可用性和數據效率,使得數據準確、一致、完整、有效、及時。搭建數據質量校驗、報警、自動整理機制;
4. 協同相關方,將產品/數據分析/算法需求轉化為數據工程需求,構建數據Pipeline和ETL任務,增進相關合作方的數據理解;
5. 建立數據字典,將常用維度和指標的技術口徑文檔化;
6. 承擔大規模復雜指標的快速計算和維護任務,解決動態復雜指標的并發性請求問題;
7. 協助實體消歧等數據質量優化,構建網站用戶行為數據體系。
二、職位要求
1. 熟練運用書面和口語英語交流數倉技術,可以勝任同瑞士公司級數倉總部協同工作;
2. 計算機、信息技術、信息管理、數據管理、數據科學等相關專業本科及以上學歷;
3. 熟悉Hadoop生態相關技術并有獨立項目開發經驗:熟練掌握hdfs、MapReduce、HIVE、Spark、Airflow、HBase等相關技術;
4. 具備較好的維度建模方法論,獨立負責過 (主題數據模型架構) 數倉架構設計和優化,熟練ETL、數倉分層、性能調優,了解云生態,了解MySQL數據庫模型和數據結構;
5. 熟練掌握MySQL的復雜查詢分析、熟練掌握Python,熟悉Solr/Elasticsearch, Shell;
6. 熟悉一門或多門面向對象的編程語言:Python/Java//Scala/C ;
7. 熟悉從數據生產到數據消費的全鏈路,具有將技術和優秀的業務理解相結合的能力,發掘機會、解決問題;
8. 兩年以上對口行業經驗,優秀者工作年限可適當放寬;
9. 邏輯清晰嚴謹,對數據敏感,跨團隊協作能力、溝通能力強。
加分項:
1. 有學術出版行業、文獻計量學/科學計量學、實體消歧、用戶行為埋點和追蹤等知識、技能、經驗;
2. 了解數據分析/機器學習/NLP,或有將數據分析/算法和業務洞察能力結合的經驗;
3. 熟悉PHP語言;
4. 對前沿數據工程技術保持高度關注。
三、薪資福利
1. 薪酬待遇:20-40K;
2. 基礎福利:六險一金,帶薪年假,年度體檢,節日福利,活動經費,豐富茶歇,營養晚餐等;
3. 進階福利:子女福利,團隊獎勵,培訓津貼,崗位津貼;
4. 職業發展:導師培養,技能培訓,管理培訓。
四、辦公地點
北京市通州區觀音庵北街4號院保利大都匯T2寫字樓10層
乘車路線:地鐵6號線-通州北關站C口,步行600米
五、聯系方式
求職者請發送中英文簡歷(含照片),郵件標題格式請用:大數據工程師-姓名-學校-專業-學歷。
聯系電話:************
聯系郵箱:********************



-
媒體·出版·文化傳播
-
1000人以上
-
私營·民營企業
-
金成中心2202室