.net解析csv(C#导表工具)

前言

解析Excel有知名的NPOI库,(Java语言是POI),但是NPOI是不支持解析csv的。

csv本质上也是文本文件,可以进行差异对比,更利于解决冲突。

本文对解析csv的几个.net的开源库进行调研

性能测试

本次性能测试结果来自:.NET Core中的CSV解析库

当测试100000行数据的时候

@H_404_30@

当测试1000000行数据的时候

从测试结果上看
Tiny Csv Parser的效率比CSVHelper高很多,内存占用也少很多。

最终结论
当不需要支持字符串换行的时候,请使用Tiny Csv Parser
当需要支持字符串换行的时候,请使用CSVHelper

测试csv

第二行中有人为换行符,在Tiny Csv 和 csv中会解析不出来,而CSVHelper则可以

Make Model Comment
内容1 内容2 这是一个换行,
内容
内容2-1 内容2-1 单行注释

CSVHelper示例

如果要读取某行的原始数据,基本内容是在 csvReader.Context 字段

public static void ParseCsvDemo(string filePath)
{
	CsvReader csvReader = null;
	using (FileStream fileStream = new FileStream(filePath,FileMode.Open,FileAccess.Read))
	{
		using (StreamReader reader = new StreamReader(fileStream,Encoding.GetEncoding("GB2312")))
		{
			csvReader = new CsvReader(reader);
			//设置之后,不读取第一列,且列数也会减少
//                    csvReader.Configuration.HasHeaderRecord = false;

			int rowCount = 0;
			while (csvReader.Read())
			{
				//列数
				var columnCount = csvReader.Context.Record.Length;
				//每行的原始数据
				var raw = csvReader.Context.RawRecord;
				rowCount = rowCount + 1;
				if (rowCount == 2)
				{
					var fileName = csvReader.GetField<string>(2);
					Console.WriteLine("输出名:{0}",fileName);
				}
				Console.WriteLine("行:{0},列:{1},内容:{2}",rowCount,columnCount,raw);
			}
		}
	}
}

注:对于csvhelper提供的映射关系(把表的一行数据结构转成 class类型),我未使用到,因为我们主要是提取表的数据。

使用情景

使用C#开发的导表工具,可以导出excel和csv,支持把excel数据插入到sql数据库,且Excel的格式可以自定义

这个项目已开源,可参考我之前的文章

TableML Excel编译/解析工具

TableML-GUI篇(C# 编译/解析 Excel/CSV工具)

遇到问题

问题:未能加载文件或程序集,或它的某一个依赖项。找到的程序集清单定义与程序集引用不匹配

解决方案: 使用nuget更新使用到的库或者检查库所依赖的.net framework版本和项目的基于的.net framework版本是否一致。

相关文章

在项目中使用SharpZipLib压缩文件夹的时候,遇到如果目录较深,则压缩包中的文件夹同样比较深的问题。比...
项目需要,几十万张照片需要计算出每个照片的特征值(调用C++编写的DLL)。 业务流程:选择照片...
var array = new byte[4]; var i = Encoding.UTF8.GetBytes(100.ToString(&quot;x2&quot;));//...
其实很简单,因为Combox的Item是一个K/V的object,那么就可以把它的items转换成IEnumerable&lt;Dic...
把.net4.6安装包打包进安装程序。 关键脚本如下: 头部引用字符串对比库 !include &quot;WordFunc....
项目需求(Winform)可以批量打印某个模板,经过百度和摸索,使用iTextSharp+ZXing.NetʿreeSp...