搜索

大约有 300 项符合查询结果, 库内数据总量为 3,513 项。 (搜索耗时:0.2921秒)

141.scws-1.0.0 正式发布 (含php扩展及2文本词典)

更新时间:2010-01-29 13:01 t By hightman

...选] SCWS 是 Simple Chinese Words Segmentation 的缩写(简易中文分词系统)。 它是一套基于词频词典的机械中文分词引擎,它能将一整段的汉字基本正确的 切分成词,因为词是汉语的基本语素单位,而书写的时候像英语会在词之间 ...

142.一点疑惑

更新时间:2013-11-09 15:11 t By 子不语

...据是12345678 我搜索345却也能出结果!为啥?? 默认的分词行,:huh::huh:我用csv导入的 中文全都可以搜索和显示出来 [id] type = id [user] index = both tokenizer = full [q] index = both tokenizer = full [w] index = both tokenizer = full...

143.SCWS自定义修改问题

发布时间:2013-11-20 16:11 t By kimiduan

我们在修改的过程中想把书名号里的文字和单词进行分词处理,请问要如何修改?是是先判断书名号?

144.自定义词库如何使用?

发布时间:2013-05-12 11:05 t By hq22

网页设计 分词后变成 网页设计 网页 设计 我想把网页设计就分为网页设计一个词,需要搜索出含有网页跟设计的内容。 我在dict_user.txt加入 网页设计 这个词,好像并没有效果,还是搜索出来含有网页跟设计的文档。

145.哪个是scws的最新版?

发布时间:2007-12-18 17:12 t By hwin

我看了一下,有点晕乎乎,知道哪个是最新的 我想要一个php下的简单分词的实现, 词库用mysql效率高还是cdb高?

146.www.adminlink.net.cn上的xunsearch案例

更新时间:2011-12-08 12:12 t By adminlink

首页说下我为什么安装中文分词和全文搜索。 就是因为提取出更多的页面,让搜索引擎蜘蛛没完没了的爬,达到网页聚合的目的。这样做我估计对优化很有帮助。 选择scws的原因是比较了几个中文分词后,感觉scws是一个错的...

147.英文可以自定义词性吗?

发布时间:2013-08-30 05:08 t By mynoname

通常英文是需要分词的,但很多时候词性是需要的,比如nike,dior这类品牌英文。 目前默认词性都是en,有什么办法可否自定义词典来改变他的词性。 还有个问题,就是纯数字的词性为什么是en呢,是m? 望赐教。

148.RE: 实时加载字典,服务器严重吃消,有没有办法?

发布时间:2009-08-06 00:08 t By hightman

...ine='1247673062'] [quote='askie' pid='3233' dateline='1247660523'] 如果分词次数太多,很容易引起服务器假死,linux服务器! 请问老大有没有加载到内容进行调用的方法? [/quote] 当然有啊,你看一下说明吧. 我清楚你用的是什么方式,是PH...

149.RE: 关于词典中的词性标注

发布时间:2009-08-06 00:08 t By hightman

单字标为 @ 是以前遗留下来的, 未确定词性, 还有一部分被标为 un 了, 建议把 un 改为 '@' ,否则可能导致散字自动聚合成2元分词时会聚合.

150.RE: SCWS_XDICT_MEM模式

发布时间:2011-11-10 10:11 t By hightman

什么意思 SCWS_XDICT_MEM 应该会比普通的慢吧,要加载到内存。 这个方式适合于常驻程序多次分词,WEB上推荐。

  • 时间不限
  • 按相关性排序