庖丁解牛 中文分词 版本号 2.0.1
---------------------------------------------------
相对2.0.0版本变更如下:
重构(!):
svn上的代码和字典从原来的GBK编码转化为UTF-8编码(使用Eclipse下载代码的同学需要改变工程的encoding)
->从统计上,更多人使用UTF-8而非GBK,故改之;望谅。
重构(!):
重构PaodingMaker使调用make获取Paoding对象,一个配置文件默认只会产生一个Paoding(通过记录文件的绝对路径并记录之实现)
->2.0.0如果多次调用PaodingMaker.make会多次载入词典,虽然这是有意的。2.0.1不必有如此担心了,同一个配置文件的Paoding不会多次创建。
重构(!):
重构PaodingMaker使可以调用多次make方法根据不同配置文件(类路径或普通文件路径)产生不同的Paoding
->这个特性目的是为了支持根据不同的应用场合扩招Paoding的分词针对性(庖丁能够根据配置不同的Knife而具有完全不同的分词效果)
->2.0.0不能同时根据不同的配置文件产生Paoding对象
重构:
删除几乎无用的net.paoding.dictionary.support.Util类(其中有一个函数被move到其他位置)
重构:
增加Constants接口记录配置文件中配置项的name
增强:
当指定的词典安装目录或其子目录下没有任何词典文件时,抛出PaodingAnalysisException,并提示:Not found any dictionary files, have you set the 'paoding.dic.home' right?
增强:
可以在配置文件中指定字符集读取字典文件,如果没有配置则使用UTF-8。配置项名为paoding.dic.charset
增强:增加build.xml文件
错误:
当没有noiseWord、noiseCharactor、unit、confucianFamilyName等特定词典时无法使用,应为忽略之而正常使用
错误:
非词典直接目录下的设置词典忽略前缀无效
错误:
将错误的命名paoding-analy[s]is.jar纠正为paoding-analysis.jar
之前jar命名少了中括号标注的字母
---------------------------------------------------
任务表(还未实现的任务)
1、繁简体的支持[优先级:中]
2、动态转载变更的词典[优先级:高]
3、针对高级使用者的文档[优先级:低]
---------------------------------------------------
示例:
请参考:
庖丁解牛 2.0.0版本发布 之《"庖丁解牛" 使用指南》
---------------------------------------------------
相关地址
svn地址:
http://paoding.googlecode.com/svn/trunk/paoding-analysis
zip下载:
http://code.google.com/p/paoding/downloads/list
论 坛:
http://groups.google.com/group/paoding
JavaEye:
http://analysis.group.iteye.com/
分享到:
相关推荐
findbugs最新版本2.0.1 最新版本
Sublime Text 2.0.1 简体中文版
dwr2.0.1apidwr2.0.1apidwr2.0.1apidwr2.0.1apidwr2.0.1apidwr2.0.1apidwr2.0.1apidwr2.0.1apidwr2.0.1apidwr2.0.1apidwr2.0.1apidwr2.0.1apidwr2.0.1api
OllyDbg 中文帮助手册 2.0.1
ckfinder2.0.1最新破解(已经去除注册提示,支持ASP,.NET,PHP等所有版本) 直接覆盖到ckfinder根目录就可以,请注意,一定是2.0.1版本的 请一定要看清楚版本号,否则可能不能用
sharetronix是一款免费开源微博客系统,最新版本为中文版2.0.1(基于官方sharetronix1.4.2) sharetronix最新中文版包括以下功能: 一、方便更新 1、对聊天工具的支持:支持用QQ来更新微博 2、对手机的支持:支持...
包含翻译后的API文档:validation-api-2.0.1.Final-javadoc-API文档-中文(简体)版.zip; Maven坐标:javax.validation:validation-api:2.0.1.Final; 标签:javax、api、validation、jar包、java、API文档、中文版;...
OCPP是开放充电桩协议,是充电桩和云端管理平台之间的通信协议。最新的2.0.1版本所有文件
nacos2.0.1 windows和linux都有从外网GitHub上下载原版
NPOI2.0.1 dll .net里用到的dll..
文件内包含RxJava和RxAndroid两个架包,版本是2.0.1。
资源全名:Python-2.0.1.exe
开放充电点协议(OCPP)是业界支持的充电之间通信的事实标准 充电站和充电站管理系统(CSMS),旨在适应任何类型的充电技术。 OCPP是一个开放的标准,没有成本或使用许可的障碍。这是OCPP 2.0版本的规范。
python读取xlsx
C# 汉字转拼音库 版本:2.0.1 更新:拼音数据库放进资源文件中。
rxandroid-2.0.1.aar
sangfor pshell v2.0.1
Goby是一款新的网络安全测试工具,由赵武Zwell(Pangolin、JSky、FOFA作者)打造,它能够针对一个目标企业梳理最全的攻击面信息,同时能进行高效、实战化漏洞扫描,并快速的从一个验证入口点,切换到横向。...
rA9发布了一款全新A7降级工具LeetDown 支持A7处理器完美降级iOS 10.3.3 ...支持的型号5s、iPad Air1、iPad mini2,可以从任何iOS版本降级到10.3.3 使用该工具并不需要越狱才能使用,只是需要MacOS系统
iReport-2.0.1