更新于 1月16日

python爬虫工程师

1.6万-1.7万
  • 深圳南山区
  • 1-3年
  • 大专
  • 全职
  • 招1人

雇员点评标签

  • 工作环境好
  • 同事很nice
  • 氛围活跃
  • 人际关系好
  • 免费班车
  • 管理人性化
  • 团队执行强
  • 交通便利

职位描述

Python爬虫开发HadoopSpark
工作内容:
1.设计和实现高效的网络爬虫,用于抓取结构化和非结构化数据。
2.处理和解析各种数据格式,包括HTML、XML和JSON。
3.优化爬虫性能,确保数据抓取的效率和准确性。
4.实现数据去重和清洗逻辑,提高数据质量。
5.监控爬虫运行状态,及时处理异常和失败情况。
6.与团队合作,不断改进爬虫策略和工具。
岗位要求:
1.计算机科学或相关专业。
2.必须有爬虫开发经验,熟悉splash/Scrapy/Selenium优先
3.精通Python
4.熟悉至少一种数据库技术,例如 MySQL、PostgreSQL 或 MongoDB。
5.熟悉 Linux 操作系统。
6.良好的沟通和团队合作能力。
7.工作经验2年及以上

工作地点

深圳百度国际大厦百度国际大厦

职位发布者

常先生/HR

立即沟通
公司Logo上海微创软件股份有限公司
上海微创软件股份有限公司2002年由微软与上海市政府共同创办,是微软在华投资的第一家合资公司。微创始终秉承高标准的服务品质与“成就客户”的服务理念,在全球设有20余处交付中心,分布在中国、美国、日本、澳大利亚,凭借在汽车、保险、高科技、金融、互联网等行业的深厚积累和丰富经验,与2500余家企业与政府客户达成了长期、稳定、友好的合作。
公司主页