更新于 3月5日

爬虫开发工程师

1.5-2万
  • 北京东城区
  • 灯市口
  • 3-5年
  • 本科
  • 全职
  • 招1人

职位描述

数据挖掘数据清洗
1、对指定的多个网站进行网页分析、数据爬取和提取、破解反爬策略;
2、负责数据清洗、入库、服务化等研发和优化工作;
3、分析目标站网页结构,并选取最优爬取方式,监控目标数据变化,定时更新,保证数据时效性;
4、参与开发和设计分布式网络爬虫系统,进行信息的抓取和分析工作;
5、研究爬虫策略和防屏蔽规则,解决身份、验证码、IP限制、页面跳转、动态标签等难点,提升网页抓取的效率和质量;
6、沟通和理解相关部门的爬取需求,并给出专业的建议和解决方案;

职位要求:
本科及以上学历,计算机相关专业,具备3年以上爬虫开发相关经验;
精通Python语言、开源爬虫框架、数据抽取技术;熟悉HTTP/HTTPS协议、爬虫相关前端技术;
熟悉常见的反爬虫机制,并能使用相应的技术手段进行应对,如IP 代理、用户代理、验证码识别等;
熟悉数据库技术,如 MySQL、MongoDB等,能够进行数据的存储和查询;
具备优秀的逻辑思维能力,对解决挑战性问题充满热情,善于分析问题/解决问题;
有爬虫结合AI经验优先。

工作地点

北京市东城区东华门灯市口大街33号(灯市口地铁站A西北口步行460米)
以担保或任何理由索要财物,扣押证照,均涉嫌违法。一经发现,
我要招人

职位发布者

张女士/人事经理

三日内活跃
立即沟通
北京小希教育科技有限公司
小希教育是一家专注国际教育的互联网企业,致力于把互联网技术应用于传统国际教育机构,以科技创新为驱动,共享优质国际教育资源,优化服务流程,提升服务品质,让更多留学生享受人性化、高品质的服务。旗下独立研发的国内智能留学生态系统-一小希留学平台,以第三方身份链接学生、海外院校和国内外留学服务机构,始终秉承“实时对话海外院校”的理念,打破学生与学校间消息不对称的壁垒。通过AI大数据和30余年国际教育服务经验积累,实现学生和学校间的智能匹配,更准确、更高效地完成学校申请。并建立安全防护系统,层层把关、全程透明,保护用户隐私和权益,让用户在平台上的每笔留学服务交易都能安全放心。小希留学平台矢志国际教育,坚持初心,携手院校和顾问,共同为中国留学生提供优质的留学服务,帮助他们实现留学梦想,助力中国国际化人才的培养。
公司主页

上智联,你更值3.74亿+ 职场人的选择 780万+ 高新职位精准推荐