如何分析.NET程序中的正则表达式性能问题

这篇文章将为大家详细讲解有关如何分析.NET程序中的正则表达式性能问题,文章内容质量较高,因此小编分享给大家做个参考,希望大家阅读完这篇文章后对相关知识有一定的了解。

之前在web程序中错误的使用了RegexOptions.Compiled 选项,导致每个页面打开整度慢了接近0.5秒..
因为是在httpModule里过滤关键字,对性能比较敏感,做了个简单测试. 

Stopwatch w = new Stopwatch();            w.Start();            Regex r = new Regex(@".*", RegexOptions.Compiled );              Match m = r.Match("aaa");              if (m.Success)              {                  w.Stop();                  Response.Write(w.Elapsed.TotalSeconds.ToString("0.0000000"));                        }

不加RegexOptions.Compiled ,计时器显示0.0000x,添加RegexOptions.Compiled 后计数器显示0.00x
如果正则式写的在复杂一些,那么仅编译时间都要0.x秒了. 看来大部分应用使用RegexOptions.Compiled 反而会降低性能,除非是很BT的应用

.NET的正则表达使用NFA引擎,NFA引擎正则式的写法对性能的很大. 

 Regex r = new Regex(@"(a|[^a]+)*^" );   string  str="111111111111111111111111111111111";  Match m = r.Match(str);               if (m.Success)               {                   Response.Write(w.Elapsed.TotalSeconds.ToString("0.0000000"));                               }


只要str长度超过26基本上很匹配难完成.
以下这些都类似

(b|[^b]+)*^  (c|[^c]+)*^   (^|[^^]+)*(^|[^^]+)*^    (^|[^^]+|[^^]*)*^

看来正则的写法对性能影响挺大的

关于如何分析.NET程序中的正则表达式性能问题就分享到这里了,希望以上内容可以对大家有一定的帮助,可以学到更多知识。如果觉得文章不错,可以把它分享出去让更多的人看到。