一个年轻又欢乐的队伍等待对Python/大数据有热情的你~~

作者：LF猫咪 | 来源：互联网 | 2023-10-10 04:01

关于我们一面数据成立于 2014 年，是国内领先的人工智能（ AI ）商业数据分析解决方案提供商，助力企业客户连接数据和商业场景。客户通过一面数据的企业级数据引擎产品，能够全面、精准、快速地了解市场动

公司 logo

关于我们

一面数据成立于 2014 年，是国内领先的人工智能（ AI ）商业数据分析解决方案提供商，助力企业客户连接数据和商业场景。客户通过一面数据的企业级数据引擎产品，能够全面、精准、快速地了解市场动态，发现商业机会及规避经营风险。一面数据深耕消费行业，成功服务了包括宝洁、玛氏在内的国内外大型企业客户，产品现已打入海外市场。2019 年底，加入了全球专业化信息公司艾盛集团（伦敦证券交易代码 ASCLL ），以期在全球范围内服务更多的客户。

大数据工程师 15-30K 全职

职位描述：

负责大数据平台的设计开发，包括平台组件选型及搭建、平台服务开发；

参与设计数据仓库模型、构建分层体系、元数据管理及核心应用开发；

参与数据清洗、转换和加工（ ETL ）；

负责新技术的调研、选型、推广和应用。

任职要求：

本科及以上学历，计算机相关专业，3 年以上大数据工作经验；

熟悉 Hadoop 生态，对 HDFS, Hive, MapReduce, Spark, HBase, Impala 中至少一个有深入理解和使用经验；

熟练使用 SQL，至少熟悉一种关系型数据库；

深入理解维度模型，有数据仓库设计和开发经验；

熟练使用 Python，有良好的编码习惯；

熟悉 Kafka, Spark Streaming, Flink，有实际使用经验者优先；

熟悉 ElasticSearch, Solr, ClickHouse, Redshift 等技术优先；

提供技术博客 / GitHub 账号，有开源贡献和优质技术文章优先。

ETL 工程师 10-20K 全职 /实习

职位描述：

负责数据模型设计和 ETL 设计、开发和文档编写；

负责离线 /实时数据同步和清洗；

根据业务需求，输出报表，给分析师提供数据提取服务。

任职要求：

本科及以上学历，计算机相关专业，1 年以上相关工作经验；

熟练使用 Python，有良好的编码习惯。熟悉 Pandas, 正则表达式、文件处理、并行编程；

掌握数据仓库基础理论知识和 ETL 设计技术；

熟练使用 SQL，至少熟悉一种常用数据库，包括但不限于 MySQL 、Postgres 、SQL Server 、Oracle ；

了解 HDFS, Hive, Impala, Presto 等 Hadoop 大数据技术，有 Spark 经验尤佳；

熟练使用 Linux 系统；

良好的沟通、理解能力，工作细致、耐心、负责；

提供技术博客 / GitHub 账号，有开源贡献和优质技术文章优先。

Python 工程师（产品研发） 10-20K 全职

职位描述：

产品的需求调研、技术方案制定以及设计报告的撰写；

产品后端数据模型以及接口开发；

产品维护。

任职要求：

精通 Python，有良好的编码习惯；

有独立项目开发经验，开发过完整的产品；

熟练掌握至少一门 Python Web 开发框架（ Flask 优先，Django 、Tornado 等）；

熟悉 Redis 、MySQL 、MongoDB 等常用数据库，具备相关使用经验；

熟悉 Javascript，了解 HTML 、CSS，具备一定前端开发能力

熟练使用 Linux 操作系统；

有较强的学习能力、团队协作意识，有良好的沟通、需求理解能力，问题解决能力。

加分项：

有优质技术博客、GitHub 积极贡献者优先；

具备大数据技术使用或开发经验者优先。

高级爬虫工程师 18-30K 全职

职位描述：

负责分布式爬虫核心系统的架构设计与实现，满足每天亿级数据快速、稳定、精准的爬取；

深刻理解爬虫数据的价值，竭尽全力追求数据的完整性、及时性；

负责攻克各类反爬措施，包括验证码破解、JS/APP 加密参数破解、账号限制、设备环境检测、人机识别等等；

参与手机群控系统的规划、设计及开发；

任职要求：

喜欢钻研技术，喜欢阅读优秀开源项目源码，热衷于解决各类技术问题；

精通 Python，熟练使用 Requests 、Scrapy 进行爬虫开发，抓取过一个以上亿级数据的站点；

具有使用 Flask 、Tornado 、Django 等 Web 框架(包括其它语言)进行前后端开发的经验，深刻理解前后端的交互方式；

熟悉前端技术，包括 Javascript 、HTML5 、CSS 等等；熟悉前端浏览器 JS 环境，熟悉页面加载过程；

熟练调用模拟浏览器进行数据抓取，包括 Selenium 、Puppeteer 、Splash 等；

熟练使用各类抓包工具，如 Charles 、Fiddler 、Wireshark 、Mitmproxy 等等；

熟练应对 IP 封禁、参数加密、验证码、字体反爬、人机检测、账号封禁等反爬措施；

熟练掌握 Linux 平台开发，能独立安装、配置、搭建开发环境，能完成爬虫程序的部署(Docker, K8S)；

掌握至少一种分布式大规模数据存储系统，如 Tidb 、Hbase 、Cassandra 、Mongodb 、Hive 等；

了解 APP 抓取方案，了解 Appnium，了解 Android 逆向手段(Xposed 、Frida 、JEB)，了解手机群控系统。有实际的 APP 抓取经验、Android 逆向经验更优。

Python 爬虫工程师 20-30K 全职

职位描述：

负责各类大型网站的爬虫开发，解决高并发请求、海量数据存储等问题；

深刻理解爬虫数据的价值，竭尽全力追求数据的完整性、及时性；

主动思考现有爬虫框架的迭代方向，为提高开发效率及质量努力；

学习探索爬虫新技术新方向，如手机群控、Android 逆向、拟人化爬取等；

任职要求：

喜欢钻研技术，喜欢阅读优秀开源项目源码，热衷于解决各类技术问题；

精通 Python，熟练使用 Requests 、Scrapy 进行爬虫开发;

编程基础扎实，熟练使用多进程、多线程、协程，熟悉异步编程；

熟练掌握 Linux 平台开发，能独立安装、配置、搭建开发环境;

熟悉 Web 开发技术、尤其是前端技术，有实际 Web 开发经验者优先;

熟悉常用数据库，包括 MySQL 、Redis 、MongoDB 等；

熟练使用各类抓包工具，如 Charles 、Fiddler 、Wireshark 、Mitmproxy 等；

可以应对 IP 封禁、参数加密、验证码、字体反爬、人机检测、账号封禁等反爬措施；

有手机群控或 Android 逆向经验者优先。

公司福利

有竞争力的薪酬：工资、一年一次调薪机会、五险一金、商业保险、季度奖金包、年终奖、节假日福利、生日礼物等。既有情怀，又有钱途；

合理的工作时间：我们有弹性工作时间制度，并追求使用技术去高效解决问题，不提倡加班；

团队活动：YiMBA 系列课程、每周的篮球和羽毛球运动，每周分享会，每月聚餐、生日会等。我们是一个有凝聚力的团队；

年度体检：豪华体检，健康强壮的身体是工作的基础；

零食饮料：不间断的供应丰富优质的零食饮料；

年度旅游：前脚去巴厘岛后脚去日本韩国，随着团队的壮大，以后能去的地方更丰富多彩；

舒适的工作环境：我们有一个漂亮的办公室，开放式的设计和十分开阔壮观的窗景。

在这里，我们为你提供足够大的舞台实现心中所想。快加入我们吧！期待你的到来~Come Come Come ！ JOIN US ！づ￣ 3 ￣)づ

想了解我们日常更多？请猛戳链接： https://www.yimian.com.cn/blog/

> 长期接受全职和实习申请,期待你的加入

> 欢迎发送简历至： [email protected]

> 公司地址：深圳市南山区科技园南科苑南路 3099 号中国储能大厦 47 楼

推荐阅读

uri
Hadoop发行版本选择指南：技术解析与应用实践

本文详细介绍了Hadoop的不同发行版本及其特点，帮助读者根据实际需求选择最合适的Hadoop版本。内容涵盖Apache Hadoop、Cloudera CDH等主流版本的特性及应用场景。 ... [详细]

蜡笔小新 2024-12-22 20:38:12
uri
58同城的Elasticsearch应用与平台构建实践

本文由58同城高级架构师于伯伟分享，由陈树昌编辑整理，内容源自DataFunTalk。文章探讨了Elasticsearch作为分布式搜索和分析引擎的应用，特别是在58同城的实施案例，包括集群优化、典型应用实例及自动化平台建设等方面。 ... [详细]

蜡笔小新 2024-12-11 19:31:21
rsa
HBase RegionServer 故障分析与解决

本文详细记录了一次 HBase RegionServer 异常宕机的情况，包括具体的错误信息和可能的原因分析。通过此案例，探讨了如何有效诊断并解决 HBase 中常见的 RegionServer 挂起问题。 ... [详细]

蜡笔小新 2024-12-01 16:21:27
rsa
初探Hadoop：第一章概览

本文深入探讨了《Hadoop》第一章的内容，重点介绍了Hadoop的基本概念及其如何解决大数据处理中的关键挑战。 ... [详细]

蜡笔小新 2024-11-24 11:40:47
export
全面解析运维监控：白盒与黑盒监控及四大黄金指标

本文深入探讨了白盒和黑盒监控的概念，以及它们在系统监控中的应用。通过详细分析基础监控和业务监控的不同采集方法，结合四个黄金指标的解读，帮助读者更好地理解和实施有效的监控策略。 ... [详细]

蜡笔小新 2024-12-22 14:02:29
export
从码农到创业者：我的职业转型之路

在观察了众多同行的职业发展后，我决定分享自己的故事。本文探讨了为什么大多数程序员难以成为架构师，并阐述了我从一家外企离职后投身创业的心路历程。 ... [详细]

蜡笔小新 2024-12-21 15:55:02
export
深入解析Hadoop的核心组件与工作原理

本文详细介绍了Hadoop的三大核心组件：分布式文件系统HDFS、资源管理器YARN和分布式计算框架MapReduce。通过分析这些组件的工作机制，帮助读者更好地理解Hadoop的架构及其在大数据处理中的应用。 ... [详细]

蜡笔小新 2024-12-19 17:17:51
export
Hive中Map任务数量的确定方法

本文探讨了Hive作业中Map任务数量的确定方式，主要涉及HiveInputFormat和CombineHiveInputFormat两种InputFormat的分片计算逻辑。通过调整相关参数，可以有效控制Map任务的数量，进而优化Hive作业的性能。 ... [详细]

蜡笔小新 2024-12-19 11:36:41
get
MapReduce原理是怎么剖析的

这期内容当中小编将会给大家带来有关MapReduce原理是怎么剖析的，文章内容丰富且以专业的角度为大家分析和叙述，阅读完这篇文章希望大家可以有所收获。1 ... [详细]

蜡笔小新 2024-12-16 18:23:06
get
深入解析Spark核心架构与部署策略

本文详细探讨了Spark的核心架构，包括其运行机制、任务调度和内存管理等方面，以及四种主要的部署模式：Standalone、Apache Mesos、Hadoop YARN和Kubernetes。通过本文，读者可以深入了解Spark的工作原理及其在不同环境下的部署方式。 ... [详细]

蜡笔小新 2024-12-14 20:02:45
get
深入解析：主流开源分布式文件系统综述

本文详细探讨了几款主流的开源分布式文件系统，包括HDFS、MooseFS、Lustre、GlusterFS和CephFS，重点分析了它们的元数据管理和数据一致性机制，旨在为读者提供深入的技术见解。 ... [详细]

蜡笔小新 2024-12-08 19:30:59
get
探讨毕业论文撰写的策略与方法

本文基于作者的个人经验和学术背景，详细探讨了撰写毕业论文的过程，包括选题、研究方向的选择、资料收集、论文结构的构建以及最终的写作和修改过程。文章旨在为即将面临毕业论文撰写的本科生和研究生提供实用的建议。 ... [详细]

蜡笔小新 2024-12-06 14:08:55
python
深入浅出：Hadoop架构详解

Hadoop作为大数据处理的核心技术，包含了一系列组件如HDFS（分布式文件系统）、YARN（资源管理框架）和MapReduce（并行计算模型）。本文将通过实例解析Hadoop的工作原理及其优势。 ... [详细]

蜡笔小新 2024-11-26 13:26:40
get
Hadoop MapReduce 实战案例：手机流量使用统计分析

本文通过一个具体的Hadoop MapReduce案例，详细介绍了如何利用MapReduce框架来统计和分析手机用户的流量使用情况，包括上行和下行流量的计算以及总流量的汇总。 ... [详细]

蜡笔小新 2024-11-23 20:11:23
get
HDFS数据读写流程详解

本文详细解析了HDFS（Hadoop分布式文件系统）中的数据读写过程，包括从客户端发起请求到最终完成数据传输的每一个关键步骤。 ... [详细]

蜡笔小新 2024-11-23 15:28:24

LF猫咪

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章