LinuxSir.cn,穿越时空的Linuxsir!

 找回密码
 注册
搜索
热搜: shell linux mysql
查看: 1458|回复: 9

给 SCIM 添加 SunPinyin 模块 (中文输入法)

[复制链接]
发表于 2009-3-26 21:54:17 | 显示全部楼层 |阅读模式
  1. #HOMEPAGE
  2. # http://www.opensolaris.org/os/project/input-method/
  3. # http://www.opensolaris.org/os/project/input-method/files/
  4. # hg clone ssh://anon@hg.opensolaris.org/hg/nv-g11n/inputmethod
  5. wget -c http://www.opensolaris.org/os/project/input-method/files/inputmethod-repo-snapshot-20090106.tar.bz2
  6. tar -xvf inputmethod-repo-snapshot-20090106.tar.bz2
  7. # http://www.opensolaris.org/os/project/input-method/documents/sunpinyin_code_tour_slm/
  8. # http://src.opensolaris.org/source/xref/nv-g11n/inputmethod/sunpinyin/ime/data/
  9. wget -c http://src.opensolaris.org/source/raw/nv-g11n/inputmethod/sunpinyin/ime/data/lm_sc.t3g.le
  10. wget -c http://src.opensolaris.org/source/raw/nv-g11n/inputmethod/sunpinyin/ime/data/pydict_sc.bin.le
  11. mv lm_sc.t3g.le pydict_sc.bin.le inputmethod-repo-snapshot-20090106/sunpinyin/ime/data/
  12. cd inputmethod-repo-snapshot-20090106/sunpinyin/ime/
  13. # http://www.opensolaris.org/os/project/input-method/documents/building_sunpinyin/
  14. ./autogen.sh --prefix=/usr --disable-cle --enable-scim
  15. make
  16. make install
复制代码

如果对详细过程有兴趣,请不要错过 "#" 后的 链接。
请根据您 SCIM 安装位置调整 安装路径 /usr。

想到安装这个是因为对其词库有点兴趣,可惜其训练用的 语料库 不能开源。
发表于 2009-3-26 22:00:04 | 显示全部楼层
弱问:新拼音有什麽过人之处?
回复 支持 反对

使用道具 举报

 楼主| 发表于 2009-3-26 22:12:09 | 显示全部楼层
据说 词库智能一点,用 语料库 训练出来的。
http://www.opensolaris.org/os/pr ... nyin_code_tour_slm/

最近玩语音识别,发现没开源 中文语料库、中文语音库 支持,对 词库、分词 就来了兴趣,仅此而已。

可能是 SCIM 自带的 智能拼音 用多了,用这个挺不自然的,确实智能一些。
回复 支持 反对

使用道具 举报

发表于 2009-3-26 22:17:54 | 显示全部楼层
sunpinyin不是很好
回复 支持 反对

使用道具 举报

发表于 2009-3-26 23:00:13 | 显示全部楼层
Post by 三翻领;1966004
sunpinyin不是很好


有哪些方面不是很好?
回复 支持 反对

使用道具 举报

发表于 2009-3-27 15:07:38 | 显示全部楼层
模糊拼音,记忆用户词库,词频调整等,整体上弱于scim-pinyin和ibus-pinyin。如果ibus-pinyin能够改进模糊拼音的运行效率,并能够自定义具体模糊拼音的内容,那么应该是目前最好的
回复 支持 反对

使用道具 举报

 楼主| 发表于 2009-3-27 17:45:13 | 显示全部楼层
回复 支持 反对

使用道具 举报

 楼主| 发表于 2009-3-27 18:00:46 | 显示全部楼层
Post by 三翻领;1966287
模糊拼音,记忆用户词库,词频调整等,整体上弱于scim-pinyin和ibus-pinyin。如果ibus-pinyin能够改进模糊拼音的运行效率,并能够自定义具体模糊拼音的内容,那么应该是目前最好的

SunPinyin 使用过程中一直有读盘操作,相当不爽。

一直不看好 ibus,相当反感其宣传方式,最后不还是用 c 重写。
ibus-pinyin 词库 倒是 可以参考一下。
http://code.google.com/p/open-phrase/
有拼音,无声调,长词居多,可以当做小型"语料库",
唯一缺点是没有提供 原始语料库、分词工具、拼音标注工具,
不过从其词库质量看,像是 以 人民日报 之类的 作 语料库。

大批 菜菜们 说 scim 怎么不稳定、与什么软件冲突,可惜偶一样没看到。
回复 支持 反对

使用道具 举报

发表于 2009-3-27 18:39:54 | 显示全部楼层
其实我个人认为排除尝鲜的冲动,应该还是scim-pinyin是最好的,词频排老二,用户词库排老二,模糊拼音排老大。要不是skim还没有移植到kde4,我是不会用其它的
回复 支持 反对

使用道具 举报

发表于 2009-3-27 20:09:58 | 显示全部楼层
用五筆的,漂過。。。
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

快速回复 返回顶部 返回列表