1、需要一个八爪鱼帐号,官网免费注册一个。
2、注册好后,点击官网上方靠中间的软件下载标签,点击立即下载按钮下载最新版八爪鱼采集器软件。
3、下载到本地后,解压进行安装。
4、打开软件,输入之前注册的用户名密码进行登录。
5、点击官网上方靠中间的规则市场。
6、进入规则市场后,选择需要的规则进行下载。
7、进入八爪鱼采集器,在左侧任务栏右键新建任务组,然后在新建的任务组上右键导入任务,选择之前从规则市场下载来的规则,打开导入即可
Excel怎么从提取网页数据?
单击【数据】--【获取外部数据】--【自网站】,单击进入。
请点击输入图片描述
在弹出的新建web页面,在地址栏中输入需要查询数据的网址。
请点击输入图片描述
页面打开后,会在页面上有一个黄色矩形框嵌套的箭头,单击一下,让它变成小勾,这样我们就能选中需要引用的数据了。
请点击输入图片描述
请点击输入图片描述
选中之后,在页面的下端有一个【导入】按钮,单击便会进行数据导入了。
请点击输入图片描述
导入时excel会提醒数据导入的的区域,用户自己可以根据自身放需要进行选择区域,若不,单击确定就可以了。
请点击输入图片描述
请点击输入图片描述
请点击输入图片描述
网页上的数据都是实时更新的,同样,我们获取的数据也能够实现,选中需要更新的一个单元格或是一块区域,右键--【数据范围属性】,将【允许后台刷新】和【刷新频率】钱的小勾打上,并且还可以对时间进行调整。
请点击输入图片描述
请点击输入图片描述
7
这样,我们需要的数据就可以从网络上直接获取了。
请点击输入图片描述
怎么用VBA或网络爬虫程序抓取网站数据
VBA网抓常用方法
1、xmlhttp/winhttp法:
用xmlhttp/winhttp模拟向服务器发送请求,接收服务器返回的数据。
优点:效率高,基本无兼容性问题。
缺点:需要借助如fiddler的工具来模拟http请求。
2、IE/webbrowser法:
创建IE控件或webbrowser控件,结合htmlfile对象的方法和属性,模拟浏览器操作,获取浏览器页面的数据。
优点:这个方法可以模拟大部分的浏览器操作。所见即所得,浏览器能看到的数据就能用代码获取。
缺点:各种弹窗相当烦人,兼容性也确实是个很伤脑筋的问题。上传文件在IE里根本无法实现。
3、QueryTables法:
因为它是excel自带,所以勉强也算是一种方法。其实此法和xmlhttp类似,也是GET或POST方式发送请求,然后得到服务器的response返回到单元格内。
优点:excel自带,可以通过录制宏得到代码,处理table很方便
。代码简短,适合快速获取一些存在于源代码的table里的数据。
缺点:无法模拟referer等发包头
也可以利用采集工具进行采集网页端的数据,无需写代码。
相关推荐: