淘博客

最新消息

[置顶]火车头采集器常用正则表达式经验分享

作为一名站长,网站内容纯原创难度不小,一是需要坚持,二是要有知识储备,三是要持续输出内容,否则坚持不会太久。淘博客做站一直在经历这个痛苦的过程。有时使用火车头采集器借用一下他站内容进行充实未尝不可,但...

[置顶]抢注域名实用工具词库下载即用

淘博客(taoboke.com)网络创业,域名先行。工欲善其事,必先利其器。淘博客当时最焦虑的,一是钱包不够掏,二是工具不称手,这个工具不是域名注册工具,而是对应域名品种的词库,即需要查询的域名词库。...

火车头采集器文本批量替换的正则表达式

1、去掉第三世第十三世之类的前缀:^(第)(\w{1,})(世)($|\W|\s)2、去掉行首名字加公的“公”字^(\w)(公,)3、去掉某某公之子的“公”字(\W\w.?)(公)(\w子\W)替换为:\1\34、把“名字+字什么号什么+某某之子”调为“名字+...

​火车头采集器正文内容过滤秘籍

 为了得到一个标准的内容,在采集上必须下足功夫才行!我对标准内容的衡量:每一个段落都是<p></p>没有多余的HTML标签和与主题无关的字符提取数据方式选择 正则提取,组合结果填 <p>[参数1]</p>...
咨询