电子工业出版社-网上书店 

官网首页 | 您好,欢迎光临电子工业出版社有限公司!

首页  >  科技  >  计算机  >  编程语言

网络爬虫全解析——技术、原理与实践  

著        者:

作  译  者:罗刚

出版时间:2017-03 千 字 数:585 版     次:01-01 页 数:444

开       本:16开 装      帧: I S B N :9787121310713

换       版:

纸质书定价:¥79.0

库存:有

分享到:

共有图书评论0条 【查看评论摘要】       

看了又看

内容简介

目 录

前 言

上架建议

作者简介

获奖信息

编辑推荐

音视频专区

本书介绍了如何开发网络爬虫。内容主要包括开发网络爬虫所需要的Java语法基础和网络爬虫的工作原理,如何使用开源组件HttpClient和爬虫框架Crawler4j抓取网页信息,以及针对抓取到的文本进行有效信息的提取。为了扩展抓取能力,本书介绍了实现分布式网络爬虫的关键技术。另外,本书介绍了从图像和语音等多媒体格式文件中提取文本信息,以及如何使用大数据技术存储抓取到的信息。最后,以实战为例,介绍了如何抓取微信和微博,以及在电商、医药、金融等领域的案例应用。其中,电商领域的应用介绍了使用网络爬虫抓取商品信息入库到网上商店的数据库表。医药领域的案例介绍了抓取PubMed医药论文库。金融领域的案例介绍了抓取股票信息,以及从年报PDF文档中提取表格等。本书适用于对开发信息采集软件感兴趣的自学者。也可以供有Java或程序设计基础的开发人员参考。

  
 

对不起,暂无音视频资源!

查看更多 > 图书评论

暂无评论

发表图书评论
评论标题:
评论内容:
验 证 码:
看不清楚
点击刷新
 

您还没有登录,请登录后再评论。

购买过本书的顾客还买过