更新于 2月18日

数据采集处理工程师(评估数据研究部)

1.5-2.8万
  • 北京海淀区
  • 3-5年
  • 硕士
  • 全职
  • 招1人

职位描述

反爬虫PythonJava验证码识别自然语言处理网络/信息安全计算机软件
(一)岗位职责 1.负责分析项目所需要的数据采集与处理需求; 2.负责网页信息、APP数据等采集、解析、处理和入库; 3.研究策略和防屏蔽机制,解决关键技术难点,提升数据抓取效率和质量。 (二)岗位要求 1.硕士以上学历,计算机信息系统及相关专业,3年以上工作经验;工作经验丰富者优先; 2.熟悉Java/Python等主流语言,熟悉反爬虫、验证码识别、自然语言处理等技术者优先; 3.对现有主流的网站、APP有一定数据采集经验; 4.具有外文数据采集、分析能力,有大规模数据采集与处理经验者优先; 5.拥有良好的发现、分析、解决问题的能力,学习能力强,有责任感,具有团队精神与服务意识;研究策略和防屏蔽机制,解决关键技术难点,提升数据抓取效率和质量; 6.面试提供自己编写的相关代码案例。

工作地点

海淀区北京大数据先进技术研究院闵庄路3号玉泉慧谷6号楼
以担保或任何理由索要财物,扣押证照,均涉嫌违法。一经发现,

职位发布者

刘雅文/hr

昨日活跃
立即沟通
北京(海淀)大数据先进技术研究院(北京大数据先进技术研究院)
北京大数据先进技术研究院(Advanced Institute of Big Data,Beijing,AIBD)是由中央批准设立,面向国家大数据发展战略需求,由我国计算机领域著名院士领衔,融合多方优势资源,集需求、市场、技术于一体的高水平新型研发机构,是北京市海淀区具有独立法人资格的新型事业单位。研究院以梅宏院士团队为核心,聚集了一批杰出科技英才及其创新团队,并联合北京大学、上海交通大学等高校开展博士、博士后联合培养,着力汇聚和培养一支拥有战略科学家、学术领军人才、多学科交叉创新人才的数据空间创新队伍。基于国家技术发明一等奖先进技术成果基础,聚焦一体化大数据互操作系统研制,致力于打破信息孤岛、盘活数据资源,推进数联网新型基础设施建设,实现数据空间中数据资源的可信、可管、可控,推动我国构建万物互联、人机交互、天地一体的网络数字空间。“基于数字对象架构的数联网与大数据互操作技术”2022年入选世界互联网15项领先科技成果,于世界互联网大会乌镇峰会发布。研究院2022年获批“数据空间技术与系统”全国重点实验室。实验室面向国家数联网和数据空间建设的中长期战略需求,聚焦我国数据空间面临的技术发展路径受制、应用基础理论薄弱、核心系统技术缺失的“卡脖子”问题,采用“总部+基地+网络”的系统创新模式,整合北京大学、中国电子等国内优势力量和资源,开展国家战略导向的体系化应用基础研究。重点围绕数据空间的架构、运行、应用构造和可信保障等四个方向,持之以恒、成体系地开展高水平应用基础研究、前沿技术探索和关键技术攻关,形成数联网基础软件和数据空间操作系统等标志性成果,建立自主原创、世界一流、具有重要国际影响力的数联网和数据空间“中国方案”,打造支撑有力、前沿领先、根基深厚的数联网和数据空间领域国家战略科技力量。研究院北京总部坐落于海淀区玉泉慧谷,依三山、傍五园,科研工作环境优美,高端创新要素聚集,人才区位优势明显,创业创新条件优越。研究院分别在长三角、大西南等区域设有分支机构。
公司主页