正则表达式请教
我使用安卓手机上Anki Helper这个软件时(https://github.com/mmjang/ankihelper),由于它对西班牙语支持不好,根据主页的介绍,想做一个西英词典。由于缺乏基础,前几天得到的比较详尽的西语词典无法改造,只有一本手头的vox口袋词典和要求详尽。我已经手动、自动删除了一些内容,但是到了这个地方难住了:<p class="indenthanging"><strong>adelantamiento</strong> <em>nm</em> overtaking.
<font size='1' >•</font><strong>hacer un adelantamiento</strong> to overtake.
<p class="indenthanging"><strong>adelantar</strong> <em>vt</em> <strong>1</strong> <em>(mover adelante)</em> to move forward. <strong>2</strong> <em>(reloj)</em> to put forward. <strong>3</strong> <em>(pasar adelante)</em> to pass; <em>(vehículo)</em> to overtake. <strong>4</strong> <em>(dinero)</em> to pay in advance [<em>pt & pp</em> <strong>paid</strong>].
如何把上述的蓝色词条留下,红色删除,并在词条后面添加一个制表符(\t)呢?即变成adelantamiento\t
因为根据该软件需求,只能使用制表符分割单词和释义,不知道以上办法可不可以把单词和解释分成两部分?可是一个词条下面又分成多行,该怎么办?
另外,我手动删除了三百多处冗余,但是这并不是好办法。即<a id="page_Vol(不同编号)"/>,请问这个地方可以一起用表达式删掉吗?
请论坛大神指教。
宁冷越 发表于 2019-11-9 22:51
顺便请教一下,要写一个这样的程序,需要学习哪些编程知识,比如哪种编程语言?谢谢。 ...
要想快速写出这种程序,学学Python基础知识和正则表达式的库就行 mrfu 发表于 2019-11-9 14:58
多谢多谢!!!在这还有一个问题请教,mdx词典导出成txt后,都是词头加上一个link,然后到词条,有什么办 ...
这个需要写一个程序来实现,取@@@LINK跳转的词的意项,然后组合 是不是需要先去掉所有的换行符,然后在上述红色的地方前面再加一个换行符,这样保证每个词条只占一行? 你说的都可以用正则实现,先去学学正则吧推荐:https://deerchao.cn/tutorials/regex/regex.htm
第一个:
替换<p class="indenthanging"><strong>(.*?)</strong>
为\1\t
第二个:
替换: <a id="page_Vol[^"]*"/>
为 空字符 nullname 发表于 2019-11-9 07:18
你说的都可以用正则实现,先去学学正则吧推荐:https://deerchao.cn/tutorials/regex/regex.htm
第一个 ...
多谢多谢!!!在这还有一个问题请教,mdx词典导出成txt后,都是词头加上一个link,然后到词条,有什么办法取消link,直接把词头和词条放在一起呢? nullname 发表于 2019-11-9 19:18
这个需要写一个程序来实现,取@@@LINK跳转的词的意项,然后组合
顺便请教一下,要写一个这样的程序,需要学习哪些编程知识,比如哪种编程语言?谢谢。 nullname 发表于 2019-11-10 10:20
要想快速写出这种程序,学学Python基础知识和正则表达式的库就行
好的,谢谢你。
页:
[1]