网页数据抓取并分析

来源: BlogBus 原始链接: http://flyby.blogbus.com:80/logs/2005/06/1237074.html 存档链接: https://web.archive.org/web/20061105183233id_/http://flyby.blogbus.com:80/logs/2005/06/1237074.html


倾程记 诚实和信用是我们最最需要的。 我不反对广告,但是对于弹出广告深恶痛绝。 我喜欢增值服务,但是强盗服务将是我永远的黑名单。 我喜欢绿色,我希望自己做的每一件事情都是绿色的。 绿的信息,绿色的软件,绿色的服务。 Add Comment Updated 返回 Blog 首页 << 小青石的Blog简介 | 网页抓取分析软件完成 >> 网页数据抓取并分析 Time: 2005-06-04 近来在考虑一个程序:抓取网页数据并分析,最后保存为固定格式的xml文件,供分析使用。最终考虑使用C#作为开发工具,用WebRequest、WebResponse获取网页数据,用正则表达式分析数据,生成XML文件保存到指定目录。 该程序应主要有两点: 一、抓取网页数据,保存文件到指定目录 用WebRequest、WebResponse获取网页数据,用StreamWriter将数据写入文件。 获取网页中相关链接,重复获取网页数据。 二、分析数据,生成XML文件 读取第一步生成的文件,用正则分析数据,生成XML文件,保存到本地目录。 flyby Posted at 2005-06-04

11:01:00 Edit | Trackback( 0 ) Comments 山东[大老杨]专业网站数据抓取服务中心 数据抓取的定义 从任意网站抓取任意信息经过处理分捡保存到自己的数据库中。 数据抓取的分类 数据抓取分为两种一种是 一次性抓取 ,一种是动态跟踪 一次性抓取就是通过为用户定制程序一次性的从网站上抓数据到数据库并保存为用户指定的数据格式 动态跟踪就是 定制跟踪软件 当目标网站发生变化时用户的网站动态的同步 客户案例 1 200万条中英文句子对照 2 北京乐享彩铃铛 全国各网站彩铃数据抓取 3 阿里巴巴公司库 4 sohu招商数据 更多问题 请咨询 Q Q : 597196782 或者电话联系 大老杨 13964486680 大老杨数据抓取服务器中心blog演示地址 http://blog.csdn.net/laoyang2000 Posted by 大老杨 ( ) at 2006-07-03 05:25:31 正则表达式是关键,良好的正则表达式可以加快速度。这些天对正则在C#中的使用系统的学习了一下。 Posted by flyby ( 正则表达式是关键 ) at 2005-06-08 08:55:12 能够自动自动抓取数据。 Posted by samsu ( samsu.blogbus.com ) at 2005-06-05 13:49:04