看小说缙哥哥还是很喜欢的,但是在网页看小说经常有广告还耗流量,在特殊的地方(如涵洞、山沟沟等偏远地区)没有网络信号,就没办法继续看了。所以缙哥哥喜欢直接下载小说 TXT 文本文件到设备上,可以随时随地的看。这个格式还可以导入 Kindle 设备,让其避免成为泡面盖……今天,就来跟大家分享下如何快速批量的将 HTML 转 TXT 格式。
准备工具
- TextForever Version 1.79 汉化版.7z: http://ct.dujin.org/f/5210373-485789755-a7b8e3
- 迅雷(任意版本)
- 文本编辑器(如 EmEditor 之类)
首先找到你喜欢的小说,进入目录列表,F12
或Ctrl+U
获取所有章节地址,这里缙哥哥随机罗列一个给小伙伴参考。
由于章节太多,这里随便截取一段。将所有章节都复制到文本编辑器中,通过替换补全网址,href=
后面引号的内容,部分会隐藏网址,如:
<a href="/jianlai/ 补全替换成 <a href="https://www.dujin.org/jianlai/
执行全部替换即可,上面网址作为示例,具体更换成你自己要下载的小说网址。
然后分隔每一章地址,同样可以通过批量替换,如:<a href="
和" title="
两者分别批量替换成,
(注意,是半角的逗号),然后另存为 CSV 格式文件(对于该格式文件来说,半角逗号就是分隔符),只用 Excel 打开,就可以直接复制地址那一列到迅雷下载,这样比较精准。如果章节ID连贯,还可以使用迅雷。
迅雷批量下载完毕之后,运行 TextForever 工具,按照下图序号顺序,分别设置一下,当然,具体还要根据自己的实际情况进行设置。这里缙哥哥只是常规判断的设置。
首先选择典型中文 HTML
(这个主要是区别英文中的空格换行之类的),再取消勾选UTF-8 转 ANSI
(由于目前大多数网站都是UTF-8,所以就不要转编码了,否则反而变成乱码),最后点转换选定文件
(点击后选择刚刚迅雷批量下载的HTML文件,记得全选)。
就这么简单3步,就可以迅速的将 HTML 小说转换成 TXT 格式了,再通过该软件自带的文件合并
功能,合并成一个 TXT 文件即可。
最后缙哥哥再建议使用文本编辑器打开简单看下,选中使用正则表达式
进行简单排版,让其他设备看起来更加舒适!
麻烦,用代码爬不香吗?
那是明天的文章