Ecosyste.ms: Awesome
An open API service indexing awesome lists of open source software.
https://github.com/zhuangzhu-74/find_invalid_link
find all invalid href from html
https://github.com/zhuangzhu-74/find_invalid_link
html
Last synced: about 1 month ago
JSON representation
find all invalid href from html
- Host: GitHub
- URL: https://github.com/zhuangzhu-74/find_invalid_link
- Owner: ZhuangZhu-74
- License: apache-2.0
- Created: 2020-04-03T07:36:08.000Z (over 4 years ago)
- Default Branch: master
- Last Pushed: 2023-05-22T22:42:57.000Z (over 1 year ago)
- Last Synced: 2024-06-28T09:43:58.987Z (5 months ago)
- Topics: html
- Language: Python
- Homepage:
- Size: 14.6 KB
- Stars: 0
- Watchers: 1
- Forks: 0
- Open Issues: 1
-
Metadata Files:
- Readme: README.md
- License: LICENSE
Awesome Lists containing this project
README
# find_invalid_link
language: [English Version](README_en.md)
我在 `Python3.7.5` 环境下使用 `pip` 安装了 `requests`、`requests-file`、`beautifulsoup4`。
安装 `requests-file` 是因为我要检查的 URL 是 `file:///` 形式的开头 (即 file 协议,详见
[这里](https://github.com/ZhuangZhu-74/open/tree/master/URI))。编写这个脚本的主要原因是,当我阅读 `JMeter` 安装目录下的 `printable_docs/usermanual/component_reference.html` ,发现访问 `BeanShell_Assertion`
章节时, `Parameters` 表格 `Reset*` 行 `Desc` 列的单元格超链接错误,于是我决定编写一个脚本查看所有的html文件是否有类似的问题。该 bug 已经上传到 [ASF Bugzilla](https://bz.apache.org/bugzilla/) ,[点击这里查看Bug的处理进度](https://bz.apache.org/bugzilla/show_bug.cgi?id=64302)。