怎么批量提取网页链接中的链接

正则表达式提取网页所有的超链接
[问题点数:40分,结帖人liujiancheng1018]
正则表达式提取网页所有的超链接
[问题点数:40分,结帖人liujiancheng1018]
不显示删除回复
显示所有回复
显示星级回复
显示得分回复
只显示楼主
2014年5月 Web 开发大版内专家分月排行榜第二2014年4月 Web 开发大版内专家分月排行榜第二
2014年3月 Web 开发大版内专家分月排行榜第三2014年2月 Web 开发大版内专家分月排行榜第三2013年7月 .NET技术大版内专家分月排行榜第三2013年6月 .NET技术大版内专家分月排行榜第三2012年9月 .NET技术大版内专家分月排行榜第三
2016年10月 .NET技术大版内专家分月排行榜第一2016年8月 .NET技术大版内专家分月排行榜第一2016年7月 .NET技术大版内专家分月排行榜第一
2016年9月 .NET技术大版内专家分月排行榜第二2016年6月 .NET技术大版内专家分月排行榜第二2016年3月 .NET技术大版内专家分月排行榜第二2016年1月 .NET技术大版内专家分月排行榜第二2015年12月 .NET技术大版内专家分月排行榜第二2015年2月 .NET技术大版内专家分月排行榜第二2015年1月 .NET技术大版内专家分月排行榜第二2014年11月 .NET技术大版内专家分月排行榜第二2014年5月 .NET技术大版内专家分月排行榜第二2014年4月 .NET技术大版内专家分月排行榜第二2012年2月 多媒体/设计/Flash/Silverlight 开发大版内专家分月排行榜第二
2015年3月 .NET技术大版内专家分月排行榜第三2015年2月 .NET技术大版内专家分月排行榜第三
2014年3月 扩充话题大版内专家分月排行榜第三
匿名用户不能发表回复!|
每天回帖即可获得10分可用分!小技巧:
你还可以输入10000个字符
(Ctrl+Enter)
请遵守CSDN,不得违反国家法律法规。
转载文章请注明出自“CSDN(www.csdn.net)”。如是商业用途请联系原作者。网页链接批量复制_技巧_电脑爱好者
网页链接批量复制
电脑爱好者
条评论 标签:
因为工作关系,我要经常复制论坛中的标题和链接后再进行分析,如果一个个复制比较麻烦,也试过导出到Word或Excel中,但是出来的数据不准确,还要手工删减。网上找的一些小程序有的不好用还有的要收费,能否用简单常用的程序或方法解决这个问题?
【解题思路】
使用默认的方式复制带有链接的文字,如果直接粘贴到Word中就可以将文字和链接一起复制到文件中。因此要解决上述问题,其实是可以直接使用Word的,不过还需要进一步做一些处理才行。这里以复制CFan论坛的帖子为例。
【解题方法】
首先在浏览器中打开.cn/forum-41-1.html,然后使用鼠标复制帖子的内容,这里注意不要选择帖子表格外的内容,完成内容的选择后按Ctrl+C进行复制,接着切换到Word窗口粘贴即可。可以看到,复制得到的是一个类似Excel表格的内容(图1)。
图1 复制所需的内容到Word
因为我们只需要帖子的标题和链接,所以按提示在Word中依次选中1、3、4、5列的内容,右击选择&删除列&,这样即可将无关的内容全部删除(同时设置帖子字体、颜色一致),只保留了帖子标题和链接,按下Ctrl键可以直接访问链接(图2)。
图2 删除无关列
如果需要将帖子的链接全部删除,则只要复制内容,然后选择&选择性粘贴&无格式文本&即可。如果要批量提取其中的超链接,可以借助Word的宏功能实现。首先开启Word的宏功能,然后新建一个名为&提取超链接&的宏,代码如下:
Sub 提取级链接()
For Each aHyperlink In ActiveDocument.Hyperlinks
With Selection
InsertAfter aHyperlink.Name
Collapse Direction:=wdCollapseEnd
InsertParagraphAfter
Next aHyperlink
这样以后只要运行上述建立的宏,在原来正文的下方就会将每个帖子对应的超链接全部复制出来(图3)。当然,可以根据自己工作的实际需要,对这个宏进行更多的细节处理。
图3 运行宏后可以自动提取出超链接数据
          
增值电信业务经营许可证编号:合字B2-
Copyright(C) .cn,All rights reserved
法律顾问:周涛律师&&
&&新出网证(京)字038号红软基地:您身边最放心的安全下载站!
您所在的位置:&>&&>&&>& > 网页链接提取精灵 V1.1 绿色免费版【快速收集网页里所包含的网页地址】
网页链接提取精灵 V1.1 绿色免费版【快速收集网页里所包含的网页地址】
  网页链接提取精灵,是一款很实用的网页链接抓取、收集工具,只需输入要抓取的网页,程序就可以快速的收集网页里所包含的网页地址。
该软件暂无小提示!
网络辅助小分类
热门软件推荐
网络辅助下载排行日:升级至V3.11、添加常用正则的选择列表,更简单易用
日:1、添加百度等真实url的获取2、修复某些相对路径url不能被获取的情况,完全依靠正则来输出url结果3、可自定义批量替换结果中的字符串4、只要是页面里面有的链接都能被提取
日:1、添加采集完成自动保存到本地的功能,以及提醒功能
日:1、支持批量页面url采集,从此告别复制粘贴的重复操作。2、支持页面的等差范围选择,比如第1页,11页,21页,类似采集方式。3、修复部分网站不能采集的问题
日:1、修复相对路径的URL未被提取的情况,此问题已完美解决,感谢“无名”反馈。2、修复“官网反馈”的链接错误。
SEO工具系列}

我要回帖

更多关于 网页源代码批量提取 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信