当前位置:新云网络 → Delphi源码 → 算法相关 → 从指定网页格式分离单词的小程序下载
从指定网页格式分离单词的小程序
运行环境:Windows
源码语言:简体中文
源码类型:编程源码 - Delphi源码 - 算法相关
授权方式:免费源码
源码大小:699 KB
推荐星级:
更新时间:2006-11-3 6:07:38
联系方式:暂无联系方式
官方主页:http://www.newasp.net
图片预览: ![]()
插件情况:![]()
解压密码:本站默认解压密码:www.newasp.net
下载统计:数据载入中...
这是一个从指定网页格式分离单词的小程序,自动从http://www.fane.cn/article_list.asp?c_id=1&s_id=1链接抓取分析其它可用链接,然后对所有链接进行分析找到可用页面然后分离中英文单词,并进行分类。
使用了多线程处理,遇到了很有趣的多个不同功能的许多线程相互协调工作的问题,由于采用主线程进行消息处理安排线和工作流程所以会产生主程序窗口被堵死情况,特别是在开的线程很多的时候。
优化方案:
1.应再写个控制线程,让一个单独的线程去管理其它工作线程协调问题,防止主程无响应,主程通过定时刷新共享区数据获取运行状况。
2.多线程情况下效率问题没有做过多考虑,特别是ADO产生多线程锁冲突时使程序效率更低下,应考虑先将抓取的数据先放到缓冲区中,开适当的线程数来将数据插入数据库中。
3.没有测试其它正则表达式控件的效率问题(对正则表达式的算法没有做过仔细研究)
使用TPerlRegEx正则表达式控件分离.htm中所需要数据
该程序没有经过严格测试,主要精力用于提高抓取速度、精度和解决主程无响应问题上,希望这些简陋的代码能给正在学习使用多线程的朋友们一定的参考。
使用了多线程处理,遇到了很有趣的多个不同功能的许多线程相互协调工作的问题,由于采用主线程进行消息处理安排线和工作流程所以会产生主程序窗口被堵死情况,特别是在开的线程很多的时候。
优化方案:
1.应再写个控制线程,让一个单独的线程去管理其它工作线程协调问题,防止主程无响应,主程通过定时刷新共享区数据获取运行状况。
2.多线程情况下效率问题没有做过多考虑,特别是ADO产生多线程锁冲突时使程序效率更低下,应考虑先将抓取的数据先放到缓冲区中,开适当的线程数来将数据插入数据库中。
3.没有测试其它正则表达式控件的效率问题(对正则表达式的算法没有做过仔细研究)
使用TPerlRegEx正则表达式控件分离.htm中所需要数据
该程序没有经过严格测试,主要精力用于提高抓取速度、精度和解决主程无响应问题上,希望这些简陋的代码能给正在学习使用多线程的朋友们一定的参考。
本站提供从指定网页格式分离单词的小程序免费下载,版权归其软件公司或作者所有。如果你喜欢,请支持正版!
* 为了达到最快的下载速度,推荐使用网际快车或迅雷下载本站软件。
* 请一定升级到最新版WinRAR3.70才能正常解压本站提供的软件!
* 如果您发现下载链接错误,请点击报告错误谢谢!
* 站内提供的所有软件包含破解及注册码均是由网上搜集,若侵犯了你的版权利益,敬请来信通知我们!
* 本站为非营利性站点,所有资源均是网上搜集或私下交流学习之用,任何涉及商业盈利目的均不得使用,否则产生的一切后果将由您自己承担!本站仅仅提供一个观摩学习的环境,将不对任何资源负法律责任。
* 请一定升级到最新版WinRAR3.70才能正常解压本站提供的软件!
* 如果您发现下载链接错误,请点击报告错误谢谢!
* 站内提供的所有软件包含破解及注册码均是由网上搜集,若侵犯了你的版权利益,敬请来信通知我们!
* 本站为非营利性站点,所有资源均是网上搜集或私下交流学习之用,任何涉及商业盈利目的均不得使用,否则产生的一切后果将由您自己承担!本站仅仅提供一个观摩学习的环境,将不对任何资源负法律责任。


