热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

使用正则表达式查找没有alt属性的img标记。-Usingregularexpressionstofindimgtagswithoutanaltattribute

Iamgoingthroughalargewebsite(1600+pages)tomakeitpassPriority1W3CWAI.Asaresult,th

I am going through a large website (1600+ pages) to make it pass Priority 1 W3C WAI. As a result, things like image tags need to have alt attributes.

我正在浏览一个大的网站(1600多页),使它通过优先级1 W3C WAI。因此,像图像标签这样的东西需要有alt属性。

What would be the regular expression for finding img tags without alt attributes? If possible, with a wee explanation so I can use to find other issues.

查找没有alt属性的img标记的正则表达式是什么?如果可能的话,给我一个简短的解释,这样我就能找到其他的问题。

I am in an office with Visual Web Developer 2008. The Edit >> Find dialogue can use regular expressions.

我和Visual Web Developer 2008在一个办公室。编辑>找到对话可以使用正则表达式。

6 个解决方案

#1


0  

This is really tricky, because regular expressions are mostly about matching something that is there. With look-around trickery, you can do things like 'find A that is not preceded/followed by B', etc. But I think the most pragmatic solution for you wouldn't be that.

这很棘手,因为正则表达式主要是关于匹配的东西。使用“查找”技巧,你可以做一些事情,比如“找到一个之前没有/后面没有B的A”等等。

My proposal relies a little bit on your existing code not doing too crazy things, and you might have to fine-tune it, but I think it's a good shot, if you really want to use a RegEx-search for your problem.

我的建议有点依赖于您的现有代码,而不是做太疯狂的事情,您可能需要对它进行微调,但是我认为,如果您真的希望对您的问题使用regex搜索,这是一个很好的尝试。

So what I suggest would be to find all img tags, that can (but don't need to) have all valid attributes for an img-element. Whether that is an approach you can work with is for you to decide.

因此,我建议查找所有img标记,它们可以(但不需要)拥有img元素的所有有效属性。这是否是一种你可以使用的方法,由你来决定。

Proposal:

建议:

//

The current limitations are:

当前的局限性是:

  1. It expects your attribute values to be delimited by double quotes,
  2. 它期望您的属性值被双引号分隔,
  3. It doesn't take into account possible inline on*Event attributes,
  4. 它没有考虑到*事件属性的内联,
  5. It doesn't find img elements with 'illegal' attributes.
  6. 它没有发现含有“非法”属性的img元素。

#2


28  

Building on Mr.Black and Roberts126 answers:

基于布莱克先生和罗伯特126回答:

/(]*)(>)/

This will match an img tag anywhere in the code which either has no alt tag or an alt tag which is not followed by ="" or ='' (i.e. invalid alt tags).

这将匹配代码中任何没有alt标记的img标记或不后跟=""或="的alt标记(即无效的alt标记)。

Breaking it down:

分解:

(          : open capturing group
(['"])]*      : match anything following the alt tag up to the closing '>' of the img tag
)          : close capturing group
(>)        : match the closing '>' of the img tag

If your code editor allows search and replace by Regex you can use this in combination with the replace string:

如果您的代码编辑器允许使用Regex进行搜索和替换,那么您可以结合使用替换字符串:

$1 alt=""$3

To find any alt-less img tags and append them with an empty alt tag. This is useful when using spacers or other layout images for HTML emails and the like.

查找无alt标记的img标记并使用空alt标记附加它们。这在使用分隔符或HTML电子邮件等布局图片时非常有用。

#3


11  

Here is what I just tried in my own environment with a massive enterprise code base with some good success (found no false positives but definitely found valid cases):

以下是我在自己的环境中尝试过的方法,使用大量的企业代码库,并取得了一些成功(没有发现假阳性,但肯定找到了有效的案例):

]*\balt=)[^>]*?>

What's going on in this search:

在这个搜索中发生了什么?

  1. find the opening of the tag
  2. 找到标签的开头
  3. look for the absence of zero or more characters that are not the closing bracket while also …
  4. 查找不属于结束括号的0或更多字符的缺失,同时……
  5. Checking for the absence of of a word that begins with "alt" ("\b" is there for making sure we don't get a mid-word name match on something like a class value) and is followed by "=", then …
  6. 检查是否缺少一个以“alt”开头的单词(“\b”是为了确保我们不会在类值之类的东西上获得一个中间单词的名称匹配),然后是“=”,然后……
  7. look for zero or more characters that are not the closing bracket
  8. 查找不是结束括号的零或多个字符
  9. find the closing bracket
  10. 找到个括号

So this will match:

这将匹配:


But it won't match either of these:

但这两者都不匹配:


I have a value.

#4


8  

This works in Eclipse:

这在Eclipse工作:

I'm updating for Section 508 too!

我也在更新第508节!

#5


6  

This worked for me.

这为我工作。

^

This matches any string beginning with that doesn't contain any number of characters before an alt attribute. It even works for src="" type of attributes.

它匹配任何以 ”类型的属性。

#6


0  

Simple and effective:

简单而有效:

This regex works for find tags missing the alt attribute.

这个regex用于查找标记,缺少alt属性。


推荐阅读
  • 本文记录了 JavaScript 中正则表达式的使用方法和常见操作,包括匹配、替换、搜索等。 ... [详细]
  • Python正则表达式(Python RegEx)
    Python正则表达式快速参考常用函数:re.match():从字符串的起始位置匹配一个正则表达式。re.search():扫描整个字符串并返回第一个成功的匹配。re.s ... [详细]
  • 本打算教一步步实现koa-router,因为要解释的太多了,所以先简化成mini版本,从实现部分功能到阅读源码,希望能让你好理解一些。希望你之前有读过koa源码,没有的话,给你链接 ... [详细]
  • URL参数格式http:localhos:8080demo?ab&cd&ef匹配参数a对应的表达式为^a([^&]*)&匹配参数b对应的表达式为&b([^&]*)&匹配参数c对应 ... [详细]
  • python模块之正则
    re模块可以读懂你写的正则表达式根据你写的表达式去执行任务用re去操作正则正则表达式使用一些规则来检测一些字符串是否符合个人要求,从一段字符串中找到符合要求的内容。在 ... [详细]
  • 本文节选自《NLTK基础教程——用NLTK和Python库构建机器学习应用》一书的第1章第1.2节,作者Nitin Hardeniya。本文将带领读者快速了解Python的基础知识,为后续的机器学习应用打下坚实的基础。 ... [详细]
  • 本文介绍了如何使用Visual Studio Code、Sublime Text等编辑器批量删除MATLAB代码中的注释和空行,同时提供了一些高级技巧以确保代码的整洁。 ... [详细]
  • 全面升级的中文PubMed——Medreading
    Medreading 是一款由科研者之家(HOME for Researchers)推出的中文版PubMed,提供强大的文献检索和分析功能,支持AI辅助全文下载。 ... [详细]
  • Python内置模块详解:正则表达式re模块的应用与解析
    正则表达式是一种强大的文本处理工具,通过特定的字符序列来定义搜索模式。本文详细介绍了Python内置的`re`模块,探讨了其在字符串匹配、验证和提取中的应用。例如,可以通过正则表达式验证电子邮件地址、电话号码、QQ号、密码、URL和IP地址等。此外,文章还深入解析了`re`模块的各种函数和方法,提供了丰富的示例代码,帮助读者更好地理解和使用这一工具。 ... [详细]
  • 本文将详细介绍如何在 MongoDB 中实现不区分大小写的查询,包括使用正则表达式和转换字段值的方法。希望通过本文的介绍,读者能够掌握这些技巧并应用于实际项目中。 ... [详细]
  • java解析json转Map前段时间在做json报文处理的时候,写了一个针对不同格式json转map的处理工具方法,总结记录如下:1、单节点单层级、单节点多层级json转mapim ... [详细]
  • 自然语言处理(NLP)——LDA模型:对电商购物评论进行情感分析
    目录一、2020数学建模美赛C题简介需求评价内容提供数据二、解题思路三、LDA简介四、代码实现1.数据预处理1.1剔除无用信息1.1.1剔除掉不需要的列1.1.2找出无效评论并剔除 ... [详细]
  • PHP 5.5.31 和 PHP 5.6.17 安全更新发布
    PHP 5.5.31 和 PHP 5.6.17 已正式发布,主要包含多个安全修复。强烈建议所有用户尽快升级至最新版本以确保系统安全。 ... [详细]
  • 在Linux系统中,find和grep是两个常用的命令,用于文件和文本的查找。本文将详细介绍这两个命令的区别及其常见用法。 ... [详细]
  • 通过将常用的外部命令集成到VSCode中,可以提高开发效率。本文介绍如何在VSCode中配置和使用自定义的外部命令,从而简化命令执行过程。 ... [详细]
author-avatar
646579262
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有