掌上百科 - PDAWIKI

 找回密码
 免费注册

QQ登录

只需一步,快速开始

查看: 890|回复: 11

[讨论] 一口气删除了30多万词条

[复制链接]
  • TA的每日心情
    难过
    2023-4-9 16:51
  • 签到天数: 116 天

    [LV.6]常住居民II

    发表于 2023-2-21 13:53:18 | 显示全部楼层 |阅读模式
    词头超过50个字符,相信没有多少人会搜,即便是搜,也难保不会错一两个字幕。。8 _' @; v" b/ V: Q

    本帖子中包含更多资源

    您需要 登录 才可以下载或查看,没有账号?免费注册

    x

    评分

    1

    查看全部评分

  • TA的每日心情

    前天 16:47
  • 签到天数: 600 天

    [LV.9]以坛为家II

    发表于 2023-2-21 14:44:23 | 显示全部楼层
    呜呜呜期待成品!
  • TA的每日心情
    慵懒
    2024-3-22 22:25
  • 签到天数: 632 天

    [LV.9]以坛为家II

    发表于 2023-2-21 14:56:34 | 显示全部楼层
    删掉有点可惜啊,如果不带占空间的语音、图片等就不用删除了吧,反正也占不了多少空间,也不大影响打开速度。
  • TA的每日心情
    难过
    2023-4-9 16:51
  • 签到天数: 116 天

    [LV.6]常住居民II

     楼主| 发表于 2023-2-21 19:14:22 | 显示全部楼层
    wiray 发表于 2023-2-21 14:56* d6 c  Z& n  w4 L
    删掉有点可惜啊,如果不带占空间的语音、图片等就不用删除了吧,反正也占不了多少空间,也不大影响打开速度 ...
    3 Q: G2 v- |" F) b
    现在总共有六百多万词头。文件几个G能保留的我都尽量保留了
  • TA的每日心情
    慵懒
    2024-3-22 22:25
  • 签到天数: 632 天

    [LV.9]以坛为家II

    发表于 2023-2-21 21:39:13 | 显示全部楼层
    gjj 发表于 2023-2-21 19:14) k7 y" ^) {; n5 ~* e
    现在总共有六百多万词头。文件几个G能保留的我都尽量保留了
    % F9 j' G$ A" i3 w$ Q- h
    文件几个G这么大啊,那应该是带语音图片了吧
  • TA的每日心情
    难过
    2023-4-9 16:51
  • 签到天数: 116 天

    [LV.6]常住居民II

     楼主| 发表于 2023-2-21 21:58:18 | 显示全部楼层
    wiray 发表于 2023-2-21 21:39& p3 m8 ~; t: S8 R3 w) S0 e
    文件几个G这么大啊,那应该是带语音图片了吧
    : j3 n4 N+ b; \1 c* l1 y
    ! ~4 T) A) G5 \/ ]! R' Z
    纯文本

    本帖子中包含更多资源

    您需要 登录 才可以下载或查看,没有账号?免费注册

    x
  • TA的每日心情
    慵懒
    2024-3-22 22:25
  • 签到天数: 632 天

    [LV.9]以坛为家II

    发表于 2023-2-21 22:11:48 | 显示全部楼层
    gjj 发表于 2023-2-21 21:58
    2 n" Y% f+ d4 l, W9 b' j  G0 c$ a纯文本
    " d* j9 K# ]2 ^! S
    俺滴个天,纯文本都这么大啦,什么情况?网上那个上千万的例句文本才700M
  • TA的每日心情
    难过
    2023-4-9 16:51
  • 签到天数: 116 天

    [LV.6]常住居民II

     楼主| 发表于 2023-2-21 23:20:17 | 显示全部楼层
    wiray 发表于 2023-2-21 22:11
    ' H7 J6 @. X' C  q! e% c2 s$ `! O* Q俺滴个天,纯文本都这么大啦,什么情况?网上那个上千万的例句文本才700M ...

    . J9 k, `4 j- b( u& L/ {5 i! S4 V  j+ a. E
    你看看行数,本来想给你看看列数。80G内存直接干死了,看来还得精简精简。

    本帖子中包含更多资源

    您需要 登录 才可以下载或查看,没有账号?免费注册

    x
  • TA的每日心情
    慵懒
    2024-3-22 22:25
  • 签到天数: 632 天

    [LV.9]以坛为家II

    发表于 2023-2-22 10:03:56 | 显示全部楼层
    gjj 发表于 2023-2-21 23:20
    * k2 i# r  v5 N4 A( C% E- X你看看行数,本来想给你看看列数。80G内存直接干死了,看来还得精简精简。 ...
    ! F7 G6 ?  }+ T
    汗……原来连单词的变形也当一个词啊(比如play、plays、played被当成三个词),那肯定是删了好!还有,看截图好像单词的意思(红色标记部分跟前面的)重复了,那确实不好!另外,要是楼主能把牛津、朗文、剑桥等词典去掉英文解释和所有例句而只保留中文词义而弄个这样的词典就好了
  • TA的每日心情
    难过
    2023-4-9 16:51
  • 签到天数: 116 天

    [LV.6]常住居民II

     楼主| 发表于 2023-2-22 10:25:31 | 显示全部楼层
    wiray 发表于 2023-2-22 10:03- s/ A9 v6 _8 o- @, D
    汗……原来连单词的变形也当一个词啊(比如play、plays、played被当成三个词),那肯定是删了好!还有, ...
    ; l2 m( J3 e" C7 T  ~
    前面是简要,后面是详细。牛津搞了,大同小异,而且数据量太大,校对起来相当耗时。
  • TA的每日心情
    难过
    7 天前
  • 签到天数: 1822 天

    [LV.Master]伴坛终老

    发表于 2023-2-23 09:30:40 | 显示全部楼层
    请问能否提供上述使用的批处理替换工具,谢谢!
  • TA的每日心情
    慵懒
    2021-3-4 19:47
  • 签到天数: 1 天

    [LV.1]初来乍到

    发表于 2023-9-4 15:14:52 | 显示全部楼层
    海词很多例句是不能使用的,是网上搜索到的中式英语。
    您需要登录后才可以回帖 登录 | 免费注册

    本版积分规则

    小黑屋|手机版|Archiver|PDAWIKI |网站地图

    GMT+8, 2024-5-24 01:04 , Processed in 0.057922 second(s), 10 queries , MemCache On.

    Powered by Discuz! X3.4

    Copyright © 2001-2023, Tencent Cloud.

    快速回复 返回顶部 返回列表