DELPHI读取网页源文件和获取字符串
0 个评论
嗯,这个是前几天弄网页下载工具的时候查找到的,帮助很大,保存一份
说到网页采集,通常大家以为到网上偷数据,然后把到收集到的数据挂到自己网上去其实也可以将采集到的数据做为公司的参考,或把收集的数据跟自己公司的业务做对比等
目 前网页采集多为3P代码为多(3P即ASPPHP JSP)用得最有代表的就动易科技公司BBS中新闻采集系统,和网上流传的新浪新闻采集系统等都是用ASP程序来使用,但速度从理论上来说不是很好如果尝 试用其它软件的多线程采集是不是更快?答案是肯定的用DELPHIVCVBJB都可以,PB似乎比较不好做以下用DELPHI来解释采集网页数据
一 简单的新闻采集
新闻...
阅读全文
delphi中的字符串操作
0 个评论
uses StrUtils;
【字符串函数大全】
首部 function AnsiResemblesText(const AText, AOther: string): Boolean;
$[StrUtils.pas
功能 返回两个字符串是否相似
说明 ANSI(American National Standards Institute)美国国家标准协会;不区分大小写
参考 function StrUtils.SoundexProc; var StrUtils.AnsiResemblesProc
例子 CheckBox1.Checked := AnsiResemblesTe...
阅读全文
delphi 字符串切割
0 个评论
这个还是很有用的,我经常用到,还是记录一下,有空可以复习下
TStrings是一个抽象类,在实际开发中,是除了基本类型外,应用得最多的。
常规的用法大家都知道,现在来讨论它的一些高级的用法。
先把要讨论的几个属性列出来:
1、CommaText
2、Delimiter & DelimitedText
3、Names & Values & ValueFromIndex
先看第一个:CommaText。怎么用呢?用代码说话:
const
constr :String = ‘aaa,bbb,ccc,ddd’;
var
strs :...
阅读全文
delphi 统计一个文本的文字重复次数并且排序
0 个评论
今天做关键词排序的时候用到的排序,记录一下,防止丢失
统计一个文本的文字重复次数
比如: 1,1,2,3,4,5,1,5,5,1,2,3,
结果:1,5,2,3,4
1出现4次 所以排第一
5出现3次 排第二
function MySort(List: TStringList; Index1, Index2: Integer): Integer;
var
I,J:Integer;
begin
I:=Integer(List.Objects[Index1]);
J:=Integer(List.Objects[Index2]);
if i>j then
Result:=-...
阅读全文
花了半天做了个自动生成TAG的小软件
0 个评论
前两天申请了新空间,装上了WP,今天就开始换了新皮肤,挂上GG了
然后开始采集文章,想起以前让人蛋疼的autotag插件就觉得不爽
好像是直接利用YAHOO的相关搜索关键词,其实很多tag都风马牛不相及
我还是喜欢DEDE那种在文章内部直接提取关键词的
当然我没那么有空去弄什么词库,然后对比什么词库里的词的出现频率
我想直接就读取文章,然后去掉所有垃圾代码,只剩下单词,单词中间用空格隔着
然后进一步去掉一些短的词,把剩下的词按出现频率排序,取前面几个词就可以了
有了思路就好办了,花了半天时间去弄,但是中间有一些具体的函数啥的,我都不太懂,只好GOOGLE了
不过最终都解决了...
阅读全文
delphi复制memo等控件里面的中文文字到记事本变乱码
0 个评论
以前一直没这个问题,但是今天发现竟然出错了
上网找了很久的资料~都说是在复制的时候切换的中文输入法就可以了
可是很多网站都没说出个所以然出来,让我很是郁闷,没复制一次都要切换一次也是很麻烦的
后来看到了一个网站上说由于delphi是ANSI的API,所以复制到粘贴板的时候会有两套内容,一套是ANSI的,一套是UNICODE的,而记事本使用的是unicode的那一套,所以容易出现乱码
解决的办法仍然是切换到中文输入法,虽然暂时解决问题,但并非一劳永逸的办法
我不死心继续查找,终于又有新的发现
找到一篇文章:
消除WindowsXP中的复制乱码技巧
摘录一段:
我发现从金山词霸...
阅读全文
StringReplace貌似对太长的字符串容易出错
0 个评论
我把StringReplace放到了一个循环里面,替换的值随着循环而改变
但是却没得到我预期的结果
我查看了一下,貌似定位不准确,很多本来应该往后几个字符再替换的,却跑到了前面去,把前面的几个字符给吃掉了一样,而且有些还重复替换了,循环了15次,有一小半的是重复替换了的
上网查了一下,有人说这个函数效率低,想想是有可能,但是为什么会出现这种状况我就没能力去追究了
网上说可以用效率高的函数替代,我想了一下,还是用正则自己写个
...
阅读全文
delphi 字符串切割
0 个评论
TStrings是一个抽象类,在实际开发中,是除了基本类型外,应用得最多的。
常规的用法大家都知道,现在来讨论它的一些高级的用法。
先把要讨论的几个属性列出来:
1、CommaText
2、Delimiter & DelimitedText
3、Names & Values & ValueFromIndex
先看第一个:CommaText。怎么用呢?用代码说话:
const
constr :String = ‘aaa,bbb,ccc,ddd’;
var
strs :TStrings;
i :Integer;
begin
str...
阅读全文
SpinnerChief对火车头采集的英文文章进行伪原创1.0版本出炉了
1 个评论
还是蛮有成就感的
虽然自己都知道还有很多BUG,不过没关系,我的目的是能用就行
哈哈,接下来的打算就是更新英文站内容了
...
阅读全文
几天弄SP接口的时候,需要用到正则,去下了一个TRegExpr
0 个评论
以前下过一个乱七八糟的版本,安装上去的时候出错,也许是当时我比较菜,没弄好
今天去他们官方网站http://regexpstudio.com去下了,然后看了下安装方法,非常简单啊,不想装组件的话只要把RegExpr.pas复制到程序目录,然后在工程里添加,最后一调用就搞定了
正在测试规则中
...
阅读全文