|
 
- UID
- 21126
- 帖子
- 1334
- 精华
- 1
- 积分
- 7215
- 银币
- 34600 枚
- 金币
- 364 枚
- 贡献
- 2 点
- 技术
- 3 点
- 威望
- 0 点
- 信用
- 0 分
- 阅读权限
- 70
- 在线时间
- 679 小时
- 注册时间
- 2008-4-26
- 最后登录
- 2010-3-15
|
这不再是一个简单的词库。决不是将10万词条拼在一起就是词库的做法。这个词库精心考虑并且解决了很多问题,可谓举世无双,世间仅有,不可多得,我对它的敬佩,简直如滔滔江水,延绵不绝!
1:经过复杂而精心考虑的词频分配,配合点讯的词库压制分为2500个频段的特点,词频越高,频段越细。比起上一版本明显提高输出速度,特别是3字词的速度。同时避免调整词频产生的词频混乱问题。
2:分离2,3,4以及以上的字数词条,实现2字词条比3字词条优先,3字又比4字优先等,避免输入两个字的词语的时候点讯会按声母匹配出来一堆长长的词条的麻烦。如果需要简拼,请用隔音符。
3:2字词分离第二字读音为zi,ci,si的词条,实现zi,ci,si的词条比zh,ch,sh的词条优先,避免了要输入“燕子”而优先输出的是“研制”等按Zh优先匹配的做法。
这是拇指键盘和梅花按词频和声母双重优先匹配的特有问题,只有通过此办法解决。所以此词库特别适合拇指键盘使用。输出优先法则为:
字数词条:
2字>3字>4字以上
第二个字读音:
ai,bi,ci>chx,
pi,qi,ri,si>shx,
xi,yi,zi>zhx,
a>bx,
e>dx,
i>gx,
o>mx,
u>tx.
4:去掉废词若干,改掉错音词若干。
技术公开。但是主要是耗费大量人力物力,相信没人会为这事自己重复做一遍。
---------------以上规则点讯已经实现,所以不再做这方面努力了--------------
输入请注意:
1,绝大部分聊天用语都已包含,比如:有空聊,下次聊,很久不见了,想死你了,烦死了,吃了吗,下次见……等等,大可以放心随意输入即可,充分利用,速度大大的提高了,不需要自己造词。成语包含10000条以上,请不要两个字分开输入,以免造成使用不便。请充分利用使用点讯“‘”隔音符号,输入长词条时候尤其有效。
词条部分组成如下:
2字:5万
3字:3万
4字:1.5万
5字以上:1万
2,另外出一个医学版,包含部分医学词汇,仅少量基础词汇和常见药物,仅足够日常生活使用,打论文还是必须得在电脑上完成。大部分长词条可以通过基础词汇组合得到。所以这个词库更适合医学专业的朋友使用,输入的时候也不需要单个字输入,尽可以打词组。
本词库的特点是:精〔精挑细选〕,准〔准确校正〕,全〔力求包含最多专业基础词汇〕,快〔速度不会明显延迟〕,偏〔偏重于聊天口语〕
20090325-------附件过于大,难以上传,请移步点讯论坛下载。
气缸——
难捱——
形而上——
名声大振——
之迷——
不止是——
做出贡献——作
风烟——
为人处事——
眼睁睁的——地
姨夫——
相当地——
做参考——作
跑的快——
不只一次——
不惟——
情深义重——
声名大振——
醉熏熏——
引伸出——申
劈啪声——
引伸到——申
称砣——
意气洋洋——
豆牙菜——
绿豆芽
浑球儿——
无遮敝的——蔽
横折勾——钩
太过份了——过分
再那里呢——
礼轻情义重——
急来报佛脚——抱
经年——
南纬——
英磅——
三级管——
核实验——
重振旗鼓——重整旗鼓,注意改音
另外改正几个:已-己 混淆问题。
着--增加多音字(非纠错,增加同一词不同读音不同用法)
以下省略100多条
。。。
20080309
成份
签定
交待
渡假
涅磐
降伏
精减
卤莽
苞谷
倾刻
浮浅
捣腾
欠收
屏除
分枝
日圆
欢渡
烟雾弹
茄克衫
满州里
喝采声
雷锋塔
坚忍不拔
惊惶失措
满山遍野
不加思索
倍受青睐
倍受欢迎
钮扣电池
反覆无常
不良份子
长嘘短叹
不知所错
彻头彻底
20090214,英文修正词库加码表。
20090213,没人为我流泪。码表密码就是特征码声母。
2009.02.13 17:30
这个词库,整整做了一年。
作者,是一个每一次都用心去爱,
却,每一次都得不到爱情的男孩。
爱,
在何处?
我苦苦追寻。
她就在我的身旁,
能抚摸到她柔软的秀发,
闻到她幽幽的馨香,
却牵不到她的小手,
却触摸不着她的心,
读懂不了她的思想。
苦,
何为边?
何处是岸?
我奋力遨游,
迷失了方向,
始终找不到终点。
恋,
何为恋?
我努力追求,
用心去付出,
失去了自我,
却有始无终。
得到无言的结局,
她不声不响。
情,
为何物?
摧人心肺,
却教人忘却了痛楚!
孰对孰错?今生无悔。
爱过,痛过,恨过。
我还是一如既往的我。
我还是会用心去爱,
如果还能遇到真爱。
如果一定要加一个期限,
我愿意,
用一生一世。
如果非要定一个程度,
我愿意,
是我的所有。
2009年2月7日。还是14万。并没有改正什么,只是加了几百口语词。特征码是“失去情人的情人节”。既然不存在希望,就不要再苦苦坚持,说一声再见,各自分飞。纪念昨天2009年2月6日失去我所喜欢的人。情人节,没有情人的人,或者被人抛弃的人,一定要好好生活。
只看该作者
为了祖国的下一代,遵循1985年多音字异读标准,如下:
1.阴yin1〔第一音,不再有第四音〕,荫yin4。
按此规定,树阴,林X道,林阴路……等全部是yin1,不再有“树荫”等。封妻荫子,荫庇……等是yin4。〔注意以后教小孩子是这样的,已经是法律层面问题〕
2.露lou,露丑,露阴,露臀,露脐,露脸……等不经意的露,读lou〔一般都是口语〕。其余读lu,如:面露微笑,目露凶光,显山露水,真人不露相……。
3.粘zhan〔不再有nian音〕,作为动词,如:粘连,胶粘……
黏nian,作为形容词,如:黏性,黏液,黏结,黏人〔这是个形容词〕,很黏,黏合……
词库词汇量极其丰富,如果你用以往的拼音输入无法发现词语,就要想一下是不是输错了。如发现错误,可以反馈。
20090113更新一个。新加6000常用词条。改正多初错误。因为压缩包体积超过帝国允许最大限制,所以并没有上传到这里来。如有需要,请到点讯官方论坛查询我的帖子下载即可。
20081115更新一个,增加自造词3333个总词汇量为11万5百,多数包括在2、3字部分,输入的时候请充分利用。兼容点讯6,6.1内核版本。
20081106更新一个。不等点讯了。调整了部分很常用的词频,首选会更合理。加入小量自造词,删除小量错词,精简小量废词,太过繁琐,所以没有记录。词汇量10.7万。
20081027最后一个大幅度校正版本将会随着点讯新内核的推出而推出。精简,排错,整编查对。点讯新版将可以支持至少20万词库而不会有明显的延迟,精确匹配将减少重码60%,找词不再困难。所以,不分医学版本了。之后,前路茫茫,不知该去何方..............
20080926发现:〔因是手机上传,我的手机上网不包月,流量要费用,所以只传医学版,此个版本只比普通版多出1300医学基础词条,普通人使用完全不受影响,暂时不打算上传普通版。〕
——已经修正——
乍暖还寒——错音,huan
上窜下跳——错词〔正确:上蹿下跳〕
像模像样——错音,mu
综合症——错词〔正确:综合征〕
另外加上一些常用短语,如〔这类词组不需要全部打完,只要在点讯上打出前四五个字就会自动上屏〕:
哑巴吃黄连有苦说不出;
落花有意流水无情;
麻雀虽小五脏俱全;
明枪易挡暗箭难防;
嫁鸡随鸡嫁狗随狗;
医学词条举例〔包括名词和药物〕:
整联蛋白zheng'lian'dan'bai
[ 本帖最后由 wulishui 于 2009-4-27 18:01 编辑 ]
|
-
10
评分次数
-
|