岗位职责:
1、负责网络爬虫的架构设计、开发与优化;
2、负责抓取数据的清洗、落地、分析;
3、抓取策略算法的更新维护,以及确保数据抽取准确、高效。
任职要求:
1、两年及以上互联网或软件行业工作经验;
2、理解http协议,熟悉html、dom、xpath;
3、熟悉linux开发环境,至少熟悉python/go/java/node、js中的一种编程语言;
4、有爬虫、信息抽取、文本分类、大数据处理相关经验优先;
5、有自然语言处理、机器学习经验优先;
6、熟悉浏览器内核、渲染机制优先;
7、工作认真,细心,有条理,积极性高;良好的沟通能力及团队合作精神。