为了账号安全,请及时绑定邮箱和手机立即绑定

RegEx用于匹配/替换JavaScript注释(多行和内联)

RegEx用于匹配/替换JavaScript注释(多行和内联)

C++
POPMUISE 2019-12-12 10:10:13
我需要使用JavaScript RegExp对象从JavaScript源中删除所有JavaScript注释。我需要的是RegExp的模式。到目前为止,我发现了这一点:compressed = compressed.replace(/\/\*.+?\*\/|\/\/.*(?=[\n\r])/g, '');此模式适用于以下情况:/* I'm a comment */或用于:/* * I'm a comment aswell*/但是似乎不适用于内联:// I'm an inline comment我不是RegEx及其模式的专家,所以我需要帮助。另外,我想有一个RegEx模式,该模式将删除所有这些类似HTML的注释。<!-- HTML Comment //--> or <!-- HTML Comment -->还有那些条件HTML注释,可以在各种JavaScript来源中找到这些注释。谢谢。
查看完整描述

3 回答

?
交互式爱情

TA贡献1712条经验 获得超3个赞

我一直在给togethor一个需要做类似事情的表情。

成品是:


/(?:((["'])(?:(?:\\\\)|\\\2|(?!\\\2)\\|(?!\2).|[\n\r])*\2)|(\/\*(?:(?!\*\/).|[\n\r])*\*\/)|(\/\/[^\n\r]*(?:[\n\r]+|$))|((?:=|:)\s*(?:\/(?:(?:(?!\\*\/).)|\\\\|\\\/|[^\\]\[(?:\\\\|\\\]|[^]])+\])+\/))|((?:\/(?:(?:(?!\\*\/).)|\\\\|\\\/|[^\\]\[(?:\\\\|\\\]|[^]])+\])+\/)[gimy]?\.(?:exec|test|match|search|replace|split)\()|(\.(?:exec|test|match|search|replace|split)\((?:\/(?:(?:(?!\\*\/).)|\\\\|\\\/|[^\\]\[(?:\\\\|\\\]|[^]])+\])+\/))|(<!--(?:(?!-->).)*-->))/g

吓人吧?


为了分解,第一部分匹配单引号或双引号内的所有内容,

这是避免匹配带引号的字符串所必需的


((["'])(?:(?:\\\\)|\\\2|(?!\\\2)\\|(?!\2).|[\n\r])*\2)

第二部分匹配以/ * * /分隔的多行注释


(\/\*(?:(?!\*\/).|[\n\r])*\*\/)

第三部分匹配单行注释,该注释从该行的任何地方开始


(\/\/[^\n\r]*(?:[\n\r]+|$))

第四到第六部分匹配正则表达式文字中的所有内容,

这取决于前面的等号或正则表达式调用之前或之后的文字


((?:=|:)\s*(?:\/(?:(?:(?!\\*\/).)|\\\\|\\\/|[^\\]\[(?:\\\\|\\\]|[^]])+\])+\/))

((?:\/(?:(?:(?!\\*\/).)|\\\\|\\\/|[^\\]\[(?:\\\\|\\\]|[^]])+\])+\/)[gimy]?\.(?:exec|test|match|search|replace|split)\()

(\.(?:exec|test|match|search|replace|split)\((?:\/(?:(?:(?!\\*\/).)|\\\\|\\\/|[^\\]\[(?:\\\\|\\\]|[^]])+\])+\/))

我最初忘记的第七个删除了html注释


(<!--(?:(?!-->).)*-->)

我的开发环境为正则表达式发出错误而导致行中断,因此我遇到了问题,因此我使用了以下解决方案


var ADW_GLOBALS = new Object

ADW_GLOBALS = {

  quotations : /((["'])(?:(?:\\\\)|\\\2|(?!\\\2)\\|(?!\2).|[\n\r])*\2)/,

  multiline_comment : /(\/\*(?:(?!\*\/).|[\n\r])*\*\/)/,

  single_line_comment : /(\/\/[^\n\r]*[\n\r]+)/,

  regex_literal : /(?:\/(?:(?:(?!\\*\/).)|\\\\|\\\/|[^\\]\[(?:\\\\|\\\]|[^]])+\])+\/)/,

  html_comments : /(<!--(?:(?!-->).)*-->)/,

  regex_of_doom : ''

}

ADW_GLOBALS.regex_of_doom = new RegExp(

  '(?:' + ADW_GLOBALS.quotations.source + '|' + 

  ADW_GLOBALS.multiline_comment.source + '|' + 

  ADW_GLOBALS.single_line_comment.source + '|' + 

  '((?:=|:)\\s*' + ADW_GLOBALS.regex_literal.source + ')|(' + 

  ADW_GLOBALS.regex_literal.source + '[gimy]?\\.(?:exec|test|match|search|replace|split)\\(' + ')|(' + 

  '\\.(?:exec|test|match|search|replace|split)\\(' + ADW_GLOBALS.regex_literal.source + ')|' +

  ADW_GLOBALS.html_comments.source + ')' , 'g'

);


changed_text = code_to_test.replace(ADW_GLOBALS.regex_of_doom, function(match, $1, $2, $3, $4, $5, $6, $7, $8, offset, original){

  if (typeof $1 != 'undefined') return $1;

  if (typeof $5 != 'undefined') return $5;

  if (typeof $6 != 'undefined') return $6;

  if (typeof $7 != 'undefined') return $7;

  return '';

}

这将返回由引号引起来的字符串文本捕获的任何内容以及在正则表达式文字中完整保留的任何内容,但对于所有注释捕获均返回一个空字符串。


我知道这太过分了,很难维护,但是到目前为止,它确实对我有用。



查看完整回答
反对 回复 2019-12-13
  • 3 回答
  • 0 关注
  • 320 浏览

添加回答

举报

0/150
提交
取消
意见反馈 帮助中心 APP下载
官方微信