掌上百科 - PDAWIKI

 找回密码
 免费注册

QQ登录

只需一步,快速开始

查看: 602|回复: 14

[求助] 如何才能批量添加关键字和音频?

[复制链接]
  • TA的每日心情
    慵懒
    2018-9-28 00:22
  • 签到天数: 273 天

    [LV.8]以坛为家I

    发表于 2018-11-18 12:04:59 | 显示全部楼层 |阅读模式
    本帖最后由 Saxons 于 2018-11-18 12:17 编辑
    6 Y2 @. f0 z* \3 ~( n3 d) |
    * s( T4 L  ]- V& x; ]8 D& o
        最近用一些数据制作词典,转换时发现所有的词条都没关键字,需手工一个一个的添加。
        如果词条少一点,手工操作还可以接受,问题是实际的词条数有十几万,这叫人如何操作?光复制粘贴这十几万的关键字,就够呛。
        我估计非正则或其他技术手段不可以解决。
        这里举一个数据的例子供大家参考:
       
       原始数据如下:
       <font size="3"color="#002984"><b>dab·bler</b></font></span><imghspace="0" align="middle" src="Image00172.gif"src2="Image00173.gif" src1="Image00171.gif" /><imghspace="0" align="middle" src="Image00220.gif"src2="Image00221.gif" src1="Image00219.gif" /><imghspace="0" align="middle" src="Image00250.gif"src2="Image00251.gif" src1="Image00249.gif" /><imghspace="0" align="middle" src="Image00187.gif"src2="Image00188.gif" src1="Image00186.gif" /><imghspace="0" align="middle" src="Image00012.gif"src2="Image00013.gif" src1="Image00011.gif" /><imghspace="0" align="middle" src="Image00220.gif"src2="Image00221.gif" src1="Image00219.gif" /><imghspace="0" align="middle" src="Image00190.gif" src2="Image00191.gif"src1="Image00189.gif" /><img hspace="0"align="middle" src="Image00232.gif"src2="Image00233.gif" src1="Image00231.gif" /><imghspace="0" align="middle" src="Image00012.gif"src2="Image00013.gif" src1="Image00011.gif" /><imghspace="0" align="middle" src="Image00214.gif"src2="Image00215.gif" src1="Image00213.gif" /><imghspace="0" align="middle" src="Image00172.gif"src2="Image00173.gif" src1="Image00171.gif"/><i><font color="#333333"><spantitle="neuter, north, northern, noun">n</span></font></i></div><imghspace="0" vspace="0" align="middle"src="Image00180.gif" /><blockquotealign="left"><div align="left">(1611)<b>:</b>one that dabbles: as</div><divalign="left"><b><fontcolor="#930605">a</font></b><b>:</b>onenot deeply engaged <span title="inch">in</span>orconcerned with something</div><divalign="left"><b><fontcolor="#930605">b</font></b><b>:</b>a duck(as a mallard or shoveler) that feeds by dabbling <img hspace="0"align="middle" src="Image00048.gif"src2="Image00049.gif" src1="Image00047.gif" />calledalso dabbling duck, puddle duck, river duck<b><i>Syn</i></b>see <ahref="text00001.html#filepos0005374794"><fontcolor="#DE2C38" size="9px"><img hspace="0"align="middle" src="Image00202.gif"src2="Image00203.gif" src1="Image00201.gif"/></font><fontcolor="#002984"><b>amateur</b></font></a></div></blockquote><div><imghspace="0" vspace="0" align="middle"src="Image00181.gif" /></div><div><tablewidth="100%" bgcolor="#7593CD"><tr><thwidht="100%"height="2px"></th></tr></table></div>
    * M8 V4 L1 p% T$ d7 A+ }1 D
        上面的原始数据,根据MDict格式排列:
        1.关键字:
        缺失
        2.正文:
        有。
        <span><fontsize="3" color="#002984"><b>dab·bler</b></font></span>……<i><fontcolor="#333333">
    <span title="neuter, north,northern, noun">n</span></font></i></div><imghspace="0" vspace="0" align="middle"src="Image00180.gif" /><blockquote align="left"><divalign="left">(1611) <b>:</b>one that dabbles:as</div>
       3. 结束标志符</>:
        这个可以很快捷地批量添加。
        问题的关键是:如何给没有关键字的词条批量添加关键字?
        所以在这里恳请各位大神、半神、大仙、小仙、散仙、大隐、小隐、高手、侠客、兄弟、姐妹、朋友、过客,有知道便捷方法的,告知详细的操作方法。
        在下感激不尽!
        另一个为单词批量添加音频,也是上一问题的延续,大同小异,如有知道详尽步骤的方家、兄弟请出手相助,在下感谢了!
    0 A$ q" j6 a2 X7 [  }

    $ J' r* Z1 W7 P  S7 u; h( q) s- v
    6 \/ m: h" j- X2 A- V

    本帖子中包含更多资源

    您需要 登录 才可以下载或查看,没有账号?免费注册

    x
  • TA的每日心情
    开心
    2019-6-27 08:03
  • 签到天数: 8 天

    [LV.3]偶尔看看II

    发表于 2018-11-18 18:11:07 | 显示全部楼层
    本帖最后由 menglongma 于 2018-11-18 18:12 编辑   E0 V% q4 H. U  ]& Q
    . u( \, \0 x9 p
    我没理解太好。9 b* \$ Y8 D- L+ F. P
    你所说的关键词是指这个此条前边加 dab·bler 吗? 变成类似8 X" R0 [! [9 r* }6 q5 U: I. i
    dab·bler
    " d' g) K- y' E* v& W5 `2 L* N, Z+ o4 j$ U* f. x
    <span><fontsize="3" color="#002984"><b>dab·bler</b></font></span>……<i><fontcolor="#333333">" v- d5 u1 I6 `, C, p6 |
    . c/ k! I! a' ?. d9 E" |
    <span title="neuter, north,northern, noun">n</span></font></i></div><imghspace="0" vspace="0" align="middle"src="Image00180.gif" /><blockquote align="left"><divalign="left">(1611) <b>:</b>one that dabbles:as</div>" M; L* D  b; ], W4 d
    </>
    " V: ^  y. v- `# l9 J( u+ Z- u$ R) Q这样子吗? 如果是,我感觉还是可以通过编辑一次性加入你所谓的 关键词 的 。
  • TA的每日心情
    开心
    2019-3-26 21:36
  • 签到天数: 178 天

    [LV.7]常住居民III

    发表于 2018-11-18 18:12:49 | 显示全部楼层
    本帖最后由 流星冲击 于 2018-11-18 18:19 编辑 " p5 w# f8 p! h# G. E7 e

    $ w+ A# I' ]* B0 ^0 [# ]4 x十几万,估计要批量添加词头,例如两个词头:nice和well是两个html文件(nice.html和well.html),先批量删除所有html的空行(只剩一行),然后批量在每个html(需要对应关系)的第一行添加 词头@,最后合并所有html为一个文件,每行的末尾用正则添加\n</>,词头@改成词条\n。音频在词头另起一行再添加或者在特定标签前面或者后面的位置插入亦可。
    + d' I/ i8 b/ U' S( t0 V
  • TA的每日心情
    开心
    2019-5-28 07:39
  • 签到天数: 339 天

    [LV.8]以坛为家I

    发表于 2018-11-18 18:40:13 | 显示全部楼层
    ^(<font size="3"color="#002984"><b>)(.{1,30})(</b></font>)1 v4 e, x9 ?/ H
    替换为\1TTT<font size="3"color="#002984"><b>\1</b></font>+ ~0 e' X. Z; C: H( x, Z

    $ y' ~  {1 j% c) w( J2 ~在EmEditor中替换,选择正则表达式。TTT 可以用来改成\r\n 。- [# }% W* d0 N
    不一定对。

    点评

    感谢解答。  发表于 2018-11-20 10:35
  • TA的每日心情
    开心
    2023-1-18 23:24
  • 签到天数: 211 天

    [LV.7]常住居民III

    发表于 2018-11-18 23:02:25 | 显示全部楼层
    楼主,您可否重新编辑帖子,把代码插入代码编辑器<>,或者上传论坛附件呢?复制起来一堆乱码
  • TA的每日心情
    慵懒
    2018-9-28 00:22
  • 签到天数: 273 天

    [LV.8]以坛为家I

     楼主| 发表于 2018-11-20 10:38:47 | 显示全部楼层
    menglongma 发表于 2018-11-18 18:11
      M8 j% h$ Z. u: b/ q) K我没理解太好。
    0 h* M; v" H& l! Z$ b, o, x6 a) L! C你所说的关键词是指这个此条前边加 dab·bler 吗? 变成类似
    $ W9 G6 Y  v6 l; ]' u! ?$ h$ c3 V1 t; Sdab·bler

    ) r4 @( W( k# ]' _. U是这样的。其实就是Mdict检索单词的词表,没这个你无法制作mdx。
  • TA的每日心情
    慵懒
    2018-9-28 00:22
  • 签到天数: 273 天

    [LV.8]以坛为家I

     楼主| 发表于 2018-11-20 10:40:04 | 显示全部楼层
    流星冲击 发表于 2018-11-18 18:126 W+ V- v4 N. F; {& _' g- w
    十几万,估计要批量添加词头,例如两个词头:nice和well是两个html文件(nice.html和well.html),先批量删除 ...
    : _3 T. ]3 K/ @- e7 N+ V
    我只能慢慢的摸索弄了。
  • TA的每日心情
    慵懒
    2018-9-28 00:22
  • 签到天数: 273 天

    [LV.8]以坛为家I

     楼主| 发表于 2018-11-20 10:43:25 | 显示全部楼层
    本帖最后由 Saxons 于 2018-11-20 10:53 编辑
    . v$ y& {6 e& P& |
    kyletruman 发表于 2018-11-18 23:02
    & Y) T- j, _0 B4 t6 @, V2 X楼主,您可否重新编辑帖子,把代码插入代码编辑器,或者上传论坛附件呢?复制起来一堆乱码 ...

    6 w# i" B5 V4 L; f3 A代码编辑器里也是混淆有乱码。论坛这个防盗措施个人觉得该改一改。+ k8 e& \2 Z6 `& j7 m
    关于批量添加关键字和给单词批量添加发音的方法,K兄如果有好办法,请不吝赐教。我举的只是一个例子,用其它的例子来说明批量添加关键字和给单词批量添加发音的方法,也是一样的。
    & q. v% {1 S! T8 e: t其实我想知道的只是添加这些东西的正则方法。2 Y" E6 h) s1 r; N  T) X( m( _
    能解答的兄弟、朋友,可以不必拘泥于我举的例子,用你们顺手的例子来解释也是可以的。- Q0 R7 J+ G# j; `
    / v+ Z, u* ~$ Q, U+ W# \4 @$ A# S

    点评

    你把代码上传论坛附件就没有问题了  发表于 2018-11-20 10:46
  • TA的每日心情
    慵懒
    2018-9-28 00:22
  • 签到天数: 273 天

    [LV.8]以坛为家I

     楼主| 发表于 2018-11-20 10:53:00 | 显示全部楼层
    kyletruman 发表于 2018-11-18 23:02
    # g3 Q$ y) n0 n. K$ T8 Z' {4 _楼主,您可否重新编辑帖子,把代码插入代码编辑器,或者上传论坛附件呢?复制起来一堆乱码 ...
    % o' s/ P' J. p" [: g. Z
    K兄如果知道批量添加关键字和给单词批量添加发音的方法,还请指教。
    5 a: o2 A7 ~8 M/ x+ T你可以不必管我的例子,你举你好用的例子解答也一样的。7 B- y2 L  G6 i* O6 ?5 `' s
  • TA的每日心情
    开心
    2019-6-27 08:03
  • 签到天数: 8 天

    [LV.3]偶尔看看II

    发表于 2018-11-21 15:59:09 | 显示全部楼层
    我是菜鸟 不会专业的正则表达式 但我认为你完全可以用UE和EXCEL搞定
  • TA的每日心情
    开心
    2019-6-27 08:03
  • 签到天数: 8 天

    [LV.3]偶尔看看II

    发表于 2018-11-21 16:10:29 | 显示全部楼层
    用UE把每个词条变成一行 然后保存一个文件 另复制一个同样文件 用UE来编辑 通过删除就会非常简单的得到你所要的词条 即每行只留一个词条单词 每个词条一行 复制粘贴到到EXCEL表格中第一列 再把你原来保存的文件同样复制 粘贴到EXCEL表格第二列 在把EXCEL表格全部复制粘贴到UE就大功告成了 我看见你这里没有音标 如有音标 可能会有乱码
  • TA的每日心情
    慵懒
    2018-9-28 00:22
  • 签到天数: 273 天

    [LV.8]以坛为家I

     楼主| 发表于 2018-11-22 03:01:52 | 显示全部楼层
    menglongma 发表于 2018-11-21 16:10
    2 C; u& [; {7 X7 b8 P- Z) ]; V用UE把每个词条变成一行 然后保存一个文件 另复制一个同样文件 用UE来编辑 通过删除就会非常简单的得到你所 ...
    5 P0 q+ G/ j9 P
    这个非常实用。条条路通罗马。感谢。
  • TA的每日心情
    开心
    2019-6-27 08:03
  • 签到天数: 8 天

    [LV.3]偶尔看看II

    发表于 2018-11-22 09:25:21 | 显示全部楼层
    不必客气   我没有学过正则表达式 只好用特土办法 但好用
    您需要登录后才可以回帖 登录 | 免费注册

    本版积分规则

    小黑屋|手机版|Archiver|PDAWIKI |网站地图

    GMT+8, 2024-4-19 15:04 , Processed in 0.067014 second(s), 15 queries , MemCache On.

    Powered by Discuz! X3.4

    Copyright © 2001-2023, Tencent Cloud.

    快速回复 返回顶部 返回列表