在 做一些天气预报或者RSS订阅的程序时,往往需要抓取非本地文件,一般情况下都是利用PHP模拟浏览器的访问,通过http请求访问URL地址, 然后得到html源代码或者xml数据,得到数据我们不能直接输出,往往需要对内容进行提取,然后再进行格式化,以更加友好的方式显现出来。
下面简单说一下PHP抓取页面的几种方法及原理:
<FONT style="COLOR: #ff0000">一、 PHP抓取页面的主要方法:
1. file()函数 2. file_get_contents()函数
3. fopen()->fread()->fclose()模式
4.curl方式
5. fsockopen()函数 socket模式
6. 使用插件(如:http://sourceforge.net/projects/snoopy/)