公司:杭州涂鸦信息科技有限公司,是一个全球云开发平台、AI+IoT开发者平台,连接消费者、制造品牌、OEM厂商和连锁零售商的智能化需求,为开发者提供一站式人工智能物联网的PaaS级解决方案。并且涵盖了硬件开发工具、全球云、智慧商业平台开发三方面,提供从技术到营销渠道的全面生态赋能,打造世界领先的IoT OS。
团队:云端开发部/数据平台
Base:杭州
组内招人啦,HC 巨多 ~~ 感兴趣的小伙伴,简历发过来,:kissing_heart:
微信:syk941020
备注:内推+岗位
- 精通Java开源框架,Java开发语言
- 对新技术有出色的学习能力,掌握 mybatis, Spring MVC等技术
- 参与公司大数据产品、核心架构的研发和方向预演;
- 思维开阔喜问乐学,以提升自己的能力和效率;
- 精通Java语言,对相关技术领域的开源产品有深入的理解;
- 希望你有3年以上java相关经验;
- 熟悉Linux下的常用系统工具, 能利用工具排查CPU, 内存, IO等系统问题;
- 从事过大规模 Web 应用开发,熟悉代码重构,性能优化,系统安全和高可用性;
- 熟悉非关系型数据库如Redis、Hbase等。
- 有过hbase,elasticsearch,flink,tidb,clickhouse的开发经验,对这5者有一个深入研究者优先。
- 有过数据应用产品相关开发经验优先。
- 负责大数据平台的设计与开发实现
- 负责大数据应用相关产品需求分析、架构设计以及开发实现
- 负责数据产品的服务接口开发和维护
- 本科及以上学历,2年及以上大数据相关技术背景
- 熟练进行Java的代码编写,良好的代码编写素养,良好的数据结构算法技能。
- 熟悉spring boot、mybatis、dubbo等开发框架,熟悉前后端分离开发流程
- 有大数据平台开发经验,包括但不限于离线开发平台、数据质量中心、元数据管理、数据资产管理,实时流平台,可视化报表等
- 熟悉开源大数据平台如HBase、ES、Kylin、tidb、clickhouse等相关技术
- 有过使用flink做实时计算平台成功案例者和用过hera系统做过离线任务平台者优先。
- 负责业务数据和用户行为日志的实时采集、计算、存储、服务,为业务团队提供直接数据决策;
- 负责部门实时计算体系架构建设及实时计算平台开发改进。
- 负责即时分析相关技术方案的探索
- 负责实时数据仓库的建设,完善实时计算方案
- 深入了解离线计算及相关开发,掌握实时计算技术体系包括数据采集、计算引擎flink等,对实时计算所涉及的事务、容错、可靠性有深入理解 并有实际项目经验;
- 熟悉 hadoop 生态包括 hdfs/mapreduce/hive/hbase,熟悉 kafka 等实时开源工具并有项目经验;
- 熟悉 mysql 等关系型数据库,熟悉 redis 内存数据库,熟悉 linux 系统;
- 掌握Java或Scala语言,如并发编程和JVM等,追求高标准的工程质量;
- 有flink实时计算开发经验,熟悉olap的相关技术。
- 有良好的沟通能力和自我驱动动力,具备出色的规划、执行力,强烈的责任感,以及优秀的学习能力,对技术有热情,愿意不断尝试新技术和业务挑战。
- 负责数据仓库架构设计、建模和ETL开发;
- 参与数据治理工作,提升数据易用性及数据质量;
- 理解并合理抽象业务需求,发挥数据价值,与业务、BI团队紧密合作。
- 有数据仓库需求调研和需求分析经验,能根据业务需求设计数据仓库模型,并对数据仓库数据模型进行管理,保证数据质量。
- 精通sql开发,有较丰富的spark sql性能调优经验优先;
- 精通数据仓库实施方法论、深入了解数据仓库体系,并支撑过实际业务场景;
- 熟悉数据治理的相关环节、有相关开发经验或者实际应用场景;
- 具备较强的编码能力,熟悉sql,python,hive,spark,kafka,storm中的多项;
- 对数据敏感,认真细致,善于从数据中发现疑点;
- 善于沟通,具备优秀的技术与业务结合能力。
- 为公司技术,运营,产品,业务策略等提供数据支持;
- 维护,完善数据报表体系,及时,准确监控运营状况,并提供专业分析报告;
- 通过数据来发现业务、流程中的问题、机会,从数据角度为业务部门提出相应的优化建议,并与多方合作实现流程改善,推动相关业务目标达成;
- 沉淀分析思路与框架,提炼数据产品需求,与相关团队协作并推动数据产品的落地;
- 本科以上学历,2年以上工作经验,有过互联网数据分析经验者优先;
- 扎实的数据分析、数据统计理论,善于对抽象问题进行概括;
- 精通Excel,熟练SQL查询等操作,熟练使用至少一种数据分析工具(R、Python、SPSS等)者优先;
- 具有良好的学习能力、沟通表达能力和团队协作能力。
- 负责涂鸦大数据平台的开发建设,建立数据生态服务,解决海量数据面临的挑战
- 参与大数据平台各类基础系统架构设计和引擎开发,集群优化,技术难点攻关
- 集群数据安全相关体系建设,各种存储,查询方案构建
- 协助管理、优化并维护Hadoop、Spark、flink等集群,保证集群规模持续、稳定;
- 负责大数据产品的自动化、离线与实时计算、即席计算、数据质量、数据安全等平台的设计和开发;
- 调研和把握当前的最新技术,将其中的先进技术引入到自己的平台中,改善产品,提升竞争力
- 本科及以上学历,5年以上工作经验,3年以上大数据领域工作经验,熟悉java,spark
- 熟悉开源大数据平台如HBase、ES、Kylin、Druid等,有实际的报表平台、多维度分析工具、etl平台、调度平台、实时平台中至少两种工具的实际建设经验。
- 有上述相关系统为基础的实际成功的复杂系统项目的架构和开发经验
- 热爱开源技术,熟悉一种或者多种大数据生态技术(Kafka、Hive、Hbase、Spark、Storm、Hadoop、Flink、kudu、clickhouse、tidb等),熟悉源码者优先
- 相关开源领域的活跃贡献者或大型互联网公司相关从业经验者优先.
- 有过使用flink做实时计算平台成功案例者和用过hera系统做过离线任务平台者优先。