php获取网页内容注意什么

php获取网页内容注意什么

内容导读

收集整理的这篇技术教程文章主要介绍了php获取网页内容注意什么,小编现在分享给大家,供广大互联网技能从业者学习和参考。文章包含1705字,纯文字阅读大概需要3分钟

内容图文

PHP获取网页内容注意事项

1、网络会出错,任何错误都可能。例如机器宕了,网线断了,域名出错了,网络超时了,页面没有了,网站跳转了,服务被禁了,主机负载不够了…

2、服务器加上了限制,只让常见浏览器访问

3、服务器加上了防盗链的限制

4、某些网站不管你HTTP请求里有没有Accept-Encoding头部,也不管你头部具体内容是什么,反正总给你发gzip后的内容

5、URL链接千奇百怪,带汉字的也罢了,有的甚至还有回车换行

6、某些网站HTTP头部里有一个Content-Type,网页里有好几个Content-Type,更过分的是,各个Content-Type还不一样,最过分的

是,这些Content-Type可能都不是正文里使用的Content-Type,从而导致乱码

7、网络链接很慢,乘分析几千个页面的时间,建议你可以好好吃顿饭去了

PHP获取网页内容的方法

方法一、使用file_get_contents方法实现

$url = "http://news.sina.com.cn/c/nd/2016-10-23/doc-ifxwztru6951143.shtml";

$html = file_get_contents($url);

//如果出现中文乱码使用下面代码

//$getcontent = iconv("gb2312", "utf-8",$html);

echo "<textarea style='width:800px;height:600px;'>".$html."</textarea>";

方法二、使用curl实现

$url = "http://news.sina.com.cn/c/nd/2016-10-23/doc-ifxwztru6951143.shtml";

$ch = curl_init();curl_setopt($ch, CURLOPT_URL, $url);curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);curl_setopt($ch, CURLOPT_CONNECTTIMEOUT, 10);curl_setopt($ch, CURLOPT_FOLLOWLOCATION, 1);$html = curl_exec($ch);curl_close($ch);echo "<textarea style='width:800px;height:600px;'>".$html."</textarea>";curl_setopt($ch, CURLOPT_FOLLOWLOCATION, 1);

加上这句代码,表示如果请求被重定向时,可以访问到最终的请求页面,不然请求的结果会显示如下内容:

<head><title>Object moved</title></head><body><h1>Object Moved</h1>This object may be found <a href="some link." rel="external nofoll

推荐教程:PHP视频教程

以上就是php获取网页内容注意什么的详细内容,更多请关注Gxl网其它相关文章!

内容总结

以上是为您收集整理的php获取网页内容注意什么全部内容,希望文章能够帮你解决php获取网页内容注意什么所遇到的程序开发问题。 如果觉得技术教程内容还不错,欢迎将网站推荐给程序员好友。

内容备注

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。


本文关键词:

联系我们

在线咨询:点击这里给我发消息

邮件:w420220301@qq.com