搜索

大约有 211 项符合查询结果, 库内数据总量为 3,513 项。 (搜索耗时:0.0987秒)

191.疑惑:分词数上限和标点符号控制

发布时间:2013-05-10 17:05 t By Brady.Li

...------- 这个开源项目真心实用,最近在使用一切顺利不过关于两个函数比较疑惑。 使用的是php_scws.dll (1.2.1) ,php扩展 其一: strpos($w['word'],"5) 参数limit,设置分词数上限,可否不控制上限?参数是什么 其二: set_ignore(bool y...

192.“有空间”的分词有问题和扩充词典

更新时间:2013-05-18 14:05 t By lyjkensou

... 还有如何设置才能识别出网址和邮箱等格式? 另外关于scws-gen-dict,按照github上的说明,可以进行.xdb到.txt转换,但是实际测试时显示没有-U这个选项,请问是取消了吗?如果是取消了的话,就不能进行.xdb到.txt的转换了吗?...

193.中文分组粗分方法

发布时间:2010-05-26 12:05 t By baobao

...是一名大学生,对中文分词很感兴趣。 在网上看了很多关于中文分词的课件和论文。 词的粗分有几种: 最大匹配法 最大概率法 最短路径法 未登录词识别方法 等等 我下PSCWS4,学习了好久算法,由于个人水平还有限,很...

194.RE: [HELP]xunsearch安装好了,搜索没有结果集。。。

发布时间:2011-10-27 16:10 t By hightman

...己改词也必须转换成这个词典文件才能用。 词典转换关于SCWS的网站上有。

195.添加文档

...检索。 首先您必须创建类型为 [XSDocument] 的文档对象,关于文档对象的创建请参阅 [XSDocument 文档](class.document) 中关于**索引文档**的部分。特别要指出 的是,文档中的主键字段值必须明确指定(即类型为 `ID` 的字段),否则在...

196.体验 DEMO 项目

... Windows 的命令行下运行请使用 `Ctrl-Z` 来表示结束。 ~~~ 1,关于 xunsearch 的 DEMO 项目测试,项目测试是一个很有意思的行为!,1314336158 2,测试第二篇,这里是第二篇文章的内容,1314336160 3,项目测试第三篇,俗话说,无三不成礼,所以就有...

197.RE: 报告一个内存泄露bug,1.1.6版本

发布时间:2011-05-08 00:05 t By hightman

感谢关注和指出,关于汇露确实存在,修正PATCH文件如下,由于此处泄露量比较小导致的影响也比较轻,所以暂不强制提供升级版本。 [code] diff -c -r1.20 scws.c *** scws.c 19 Apr 2011 08:00:23 -0000 1.20 --- scws.c 7 May 2011 14:57:49 -...

198.请教如何在Xunsearch里面设置scws的M选项(multi-child words mode)

发布时间:2012-02-23 17:02 t By Milton.Lai

...方式都较另外二者灵活. 在今天做测试时, 有遇到一个关于复合分词问题, 类似于"官方網站"这样的词汇, 默认配置下是作为单一词划出, 于是搜索"網站"时不可见. 如果设定-M 为 3 (0011) 可以解决这个问题, 但是在xunsearch中未找到...

199.[特别发布] 纯PHP编写的xdb词典导入导出工具!!

发布时间:2009-07-01 17:07 t By hightman

...改为 true php make_xdb_file.php [导入的文本文件] --- 关于文本文件的说明,每行一条记录,#开头表示注释,每条记录由 word、TF、IDF、Attr组成,其中TF是词频系数,IDF是逆词频率系数 而Attr是北大标注法的词性,这四个字段...

200.在执行demo的时候出现这个事什么原因?Undefined data source type: `test.csv'

更新时间:2014-02-24 11:02 t By 情雨轩

...}[hr] 我在util下面增加了一个test.csv下如了下面这些数据 1,关于 xunsearch 的 DEMO 项目测试,项目测试是一个很有意思的行为!,1314336158 2,测试第二篇,这里是第二篇文章的内容,1314336160 3,项目测试第三篇,俗话说,无三不成礼,所以就有...

  • 时间不限
  • 按相关性排序