频道导航

c# – 如何使用HtmlAgilityPack检查是否是404错误页面(页面不存在)

2019-11-21 C# 前端之家

前端之家收集整理的这篇文章主要介绍了c# – 如何使用HtmlAgilityPack检查是否是404错误页面(页面不存在)，前端之家小编觉得挺不错的，现在分享给大家，也给大家做个参考。

在这里,我试图阅读网址并在页面中获取图像.我需要排除页面,如果它是404并停止从404错误页面获取图像.如何使用 HtmlAgilityPack？这是我的代码

var document = new HtmlWeb().Load(completeurl);
var urls = document.DocumentNode.Descendants("img")
          .Select(e => e.GetAttributeValue("src",null))
          .Where(s => !String.IsNullOrEmpty(s)).ToList();

解决方法

您需要在HtmlWeb实例上注册PostRequestHandler事件,它将在每个下载的文档之后引发,您将可以访问HttpWebResponse对象.它具有StatusCode的属性.

HtmlWeb web = new HtmlWeb();
 HttpStatusCode statusCode = HttpStatusCode.OK;
 web.PostRequestHandler += (request,response) =>
 {
     if (response != null)
     {
         statusCode = response.StatusCode;
     }
 }

 var doc = web.Load(completeUrl)
 if (statusCode == HttpStatusCode.OK)
 {
     // received a read document
 }

查看GutHub上HtmlAgilityPack的代码,它甚至更简单,HtmlWeb有一个属性StatusCode,其值设置为：

var web = new HtmlWeb();
var document = web.Load(completeurl);

if (web.StatusCode == HttpStatusCode.OK)
{
    var urls = document.DocumentNode.Descendants("img")
          .Select(e => e.GetAttributeValue("src",null))
          .Where(s => !String.IsNullOrEmpty(s)).ToList();
}

更新

AgilityPack API已有更新.诀窍仍然是一样的：

var htmlWeb = new HtmlWeb();
var lastStatusCode = HttpStatusCode.OK;

htmlWeb.PostResponse = (request,response) =>
{
    if (response != null)
    {
        lastStatusCode = response.StatusCode;
    }
};

原文链接：/csharp/238953.html

上一篇：c# – 我可以在Windows服务中托管(下一篇：c# – 如何找到我在app.config中声

猜你在找的C#相关文章

C#使用SharpZipLib创建压缩文件，并指定压缩文件夹路径（解决SharpZipLib压缩长路径显示问题）

在项目中使用SharpZipLib压缩文件夹的时候，遇到如果目录较深，则压缩包中的文件夹同样比较...

作者：踏平扶桑时间：2024-09-29

C#使用Parallel处理数据同步写入Datatable并使用BulkInsert批量导入数据库

项目需要，几十万张照片需要计算出每个照片的特征值（调用C++编写的DLL）。业务流...

作者：踏平扶桑时间：2024-09-29

C# byte和10进制、16进制相互转换

var array = new byte[4]; var i = Encoding.UTF8.GetBytes(100.ToString("x2&am...

作者：踏平扶桑时间：2024-09-29

Winform下的Combox根据值来选中项

其实很简单，因为Combox的Item是一个K/V的object，那么就可以把它的items转换成IEnumerabl...

作者：踏平扶桑时间：2024-09-29

HM NIS Edit制作安装包时检测是否有.net4.6环境，没有的时候自动安装。

把.net4.6安装包打包进安装程序。关键脚本如下：头部引用字符串对比库 !include &qu...

作者：踏平扶桑时间：2024-09-29

WPF下使用FreeRedis操作RedisStream实现简单的消息队列

Redis Stream简介 Redis Stream是随着5.0版本发布的一种新的Redis数据类型：高效消费者组...

作者：踏平扶桑时间：2024-09-29

C#进行图片压缩（对jpg压缩效果最好）

直接上代码 1 public static class ImageCompress 2 { 3 /// <summary> 4 /...

作者：踏平扶桑时间：2024-09-29

CefSharp访问需要认证网页或接口(在Request的Headers中添加认证Token)

然后在使用的时候，就可以获取到Header的内容了。

作者：踏平扶桑时间：2024-09-29

C#使用FileSystemWatcher来监控指定文件夹，并使用TCP/IP协议通过Socket发送到另外指定文件夹

项目需求：局域网内有两台电脑，电脑A(Windows系统)主要是负责接收一些文件（远程桌面粘贴...

作者：踏平扶桑时间：2024-09-29

绿色版Mysql自动建立my.ini和命令行启动并动态指定datadir路径

1、先去下载绿色版的Mysql(https://cdn.mysql.com//archives/mysql-5.7/mysql-5.7.20-winx...

作者：踏平扶桑时间：2024-09-29

编程分类

PHP Java Java SE Python C#C&C++Ruby VB asp.Net Go Perl netty Django Delphi Jsp .NET Core Spring Flask Springboot SpringMVC Lua Laravel Mybatis Asp Groovy ThinkPHP Yii swoole

最新文章