掌上百科 - PDAWIKI

 找回密码
 免费注册

QQ登录

只需一步,快速开始

查看: 1125|回复: 7

[求助] 正则表达式请教

[复制链接]
  • TA的每日心情
    奋斗
    2020-12-22 18:46
  • 签到天数: 43 天

    [LV.5]常住居民I

    发表于 2019-11-9 01:25:42 | 显示全部楼层 |阅读模式
    我使用安卓手机上Anki Helper这个软件时(https://github.com/mmjang/ankihelper),由于它对西班牙语支持不好,根据主页的介绍,想做一个西英词典。由于缺乏基础,前几天得到的比较详尽的西语词典无法改造,只有一本手头的vox口袋词典和要求详尽。我已经手动、自动删除了一些内容,但是到了这个地方难住了:
    ' y. \( [( K' ?# s! h7 E! N
    <p class="indenthanging"><strong>adelantamiento</strong> <em>nm</em> overtaking.& Y8 h" u9 Z; Z; U( B: n5 V5 h
    &nbsp; <font size='1' >•</font><strong>hacer un adelantamiento</strong> to overtake.: F+ s3 ~; E# F1 V" l/ b
    <p class="indenthanging"><strong>adelantar</strong> <em>vt</em> <strong>1</strong> <em>(mover adelante)</em> to move forward. <strong>2</strong> <em>(reloj)</em> to put forward. <strong>3</strong> <em>(pasar adelante)</em> to pass; <em>(vehículo)</em> to overtake. <strong>4</strong> <em>(dinero)</em> to pay in advance [<em>pt &amp; pp</em> <strong>paid</strong>].
    如何把上述的蓝色词条留下,红色删除,并在词条后面添加一个制表符(\t)呢?即变成adelantamiento\t; @8 |  u1 h# \; U1 I+ \
    因为根据该软件需求,只能使用制表符分割单词和释义,不知道以上办法可不可以把单词和解释分成两部分?可是一个词条下面又分成多行,该怎么办?: u' e* e2 w' I# q$ D$ f
    另外,我手动删除了三百多处冗余,但是这并不是好办法。即<a id="page_Vol(不同编号)"/>,请问这个地方可以一起用表达式删掉吗?8 _6 Y, Y4 |7 V" E# s$ o" F
    请论坛大神指教。
    9 a2 k  O8 j( U! q& j) t
  • TA的每日心情
    开心
    2023-9-27 20:45
  • 签到天数: 847 天

    [LV.10]以坛为家III

    发表于 2019-11-10 10:20:58 | 显示全部楼层
    宁冷越 发表于 2019-11-9 22:51; b2 w+ Z+ [8 n5 U5 f. P; n
    顺便请教一下,要写一个这样的程序,需要学习哪些编程知识,比如哪种编程语言?谢谢。 ...

    " x1 M  q+ I# u$ D0 y" {要想快速写出这种程序,学学Python基础知识和正则表达式的库就行

    评分

    1

    查看全部评分

  • TA的每日心情
    开心
    2023-9-27 20:45
  • 签到天数: 847 天

    [LV.10]以坛为家III

    发表于 2019-11-9 19:18:21 | 显示全部楼层
    mrfu 发表于 2019-11-9 14:586 U! G/ w/ z3 b; q( G2 P
    多谢多谢!!!在这还有一个问题请教,mdx词典导出成txt后,都是词头加上一个link,然后到词条,有什么办 ...

    2 b6 ?7 v2 p+ e! @1 z( H这个需要写一个程序来实现,取@@@LINK跳转的词的意项,然后组合
  • TA的每日心情
    奋斗
    2020-12-22 18:46
  • 签到天数: 43 天

    [LV.5]常住居民I

     楼主| 发表于 2019-11-9 01:31:56 | 显示全部楼层
    是不是需要先去掉所有的换行符,然后在上述红色的地方前面再加一个换行符,这样保证每个词条只占一行?
  • TA的每日心情
    开心
    2023-9-27 20:45
  • 签到天数: 847 天

    [LV.10]以坛为家III

    发表于 2019-11-9 07:18:35 | 显示全部楼层
    你说的都可以用正则实现,先去学学正则吧  推荐:https://deerchao.cn/tutorials/regex/regex.htm
    2 a$ X" i/ i( X2 l8 i! ~/ F5 g
    4 c( P, a; N! p8 r- V8 x第一个:
    4 ?' g" r. v  `0 d$ O. P替换  <p class="indenthanging"><strong>(.*?)</strong>7 s# d# F; f5 B. j" {
    ( l% u  ~; ^1 [5 r1 ^
    为  \1\t* W' _- r* b, t& C

    6 W' D0 `5 ~6 W第二个:" C6 z7 o6 M5 A6 Z: b( [5 d/ k
    替换: <a id="page_Vol[^"]*"/>
    & m9 x5 d: [0 d3 s( ~9 F8 M  O
    + c% A, P8 F4 Y( c* h7 s  s1 c8 ^" {为   空字符
  • TA的每日心情
    奋斗
    2020-12-22 18:46
  • 签到天数: 43 天

    [LV.5]常住居民I

     楼主| 发表于 2019-11-9 14:58:55 | 显示全部楼层
    nullname 发表于 2019-11-9 07:18+ B& g/ r! U7 o. z. \& E( W; E
    你说的都可以用正则实现,先去学学正则吧  推荐:https://deerchao.cn/tutorials/regex/regex.htm% `: Y3 A8 O( T+ m2 I
    ; `2 z' }# @3 V8 N0 Z& Y4 L9 a( @7 g+ i
    第一个 ...
    3 F* \' r$ V# U  H
    多谢多谢!!!在这还有一个问题请教,mdx词典导出成txt后,都是词头加上一个link,然后到词条,有什么办法取消link,直接把词头和词条放在一起呢?
  • TA的每日心情
    擦汗
    2023-3-25 13:49
  • 签到天数: 147 天

    [LV.7]常住居民III

    发表于 2019-11-9 22:51:30 | 显示全部楼层
    nullname 发表于 2019-11-9 19:184 m( q" z7 O2 b# Q
    这个需要写一个程序来实现,取@@@LINK跳转的词的意项,然后组合

    - z. j2 T- [/ ^. l5 o, P, \9 l* o顺便请教一下,要写一个这样的程序,需要学习哪些编程知识,比如哪种编程语言?谢谢。
  • TA的每日心情
    擦汗
    2023-3-25 13:49
  • 签到天数: 147 天

    [LV.7]常住居民III

    发表于 2019-11-10 15:42:06 | 显示全部楼层
    nullname 发表于 2019-11-10 10:20! B7 I) n# l' s6 x0 D$ [" K
    要想快速写出这种程序,学学Python基础知识和正则表达式的库就行

    # F. ?2 b3 p2 q  Q, k- D, {3 I) {好的,谢谢你。
    您需要登录后才可以回帖 登录 | 免费注册

    本版积分规则

    小黑屋|手机版|Archiver|PDAWIKI |网站地图

    GMT+8, 2024-4-20 02:49 , Processed in 0.066846 second(s), 10 queries , MemCache On.

    Powered by Discuz! X3.4

    Copyright © 2001-2023, Tencent Cloud.

    快速回复 返回顶部 返回列表