搜索

大约有 300 项符合查询结果, 库内数据总量为 3,513 项。 (搜索耗时:0.0067秒)

161.XSTokenizerScws的一个使用问题

发布时间:2013-01-29 10:01 t By tisswb

是这样的,我使用XSTokenizerScws进行分词 [php] $tokenizer = new XSTokenizerScws; $tk = $tokenizer->setIgnore(true)->setMulti(11)->getResult("是一"); print_r($tk); [/php] 结果是 [quote] Array ( [0] => Array ( [off] => 0 [attr] => m ...

162.LIBSCWS在WINDOWS下编译(C++调用,非PHP)

发布时间:2013-03-11 09:03 t By jasonniu

最近在搞分词相关的毕业设计 是C++开发的 想用大神的SCWS 把LIBSCWS编译成DLL来供我自己的程序调用 但是在WINDOWS下编译老是过了 给的VC++6的项目也编译成功,希望大神能指教下怎么在windows下编译

163.LIBSCWS在WINDOWS下编译(C++调用,非PHP)

发布时间:2013-03-11 09:03 t By jasonniu

最近在搞分词相关的毕业设计 是C++开发的 想用大神的SCWS 把LIBSCWS编译成DLL来供我自己的程序调用 但是在WINDOWS下编译老是过了 给的VC++6的项目也编译成功,希望大神能指教下怎么在windows下编译

164.修正utf-8版make_xdb_file.php的错误

发布时间:2011-06-09 09:06 t By itlong

...,提示93行处的TF、IDF、Attr存在,这明显示是:“[b]对分词分词[/b]”带来的结果,在65行处看到only support GBK dictionary 到80行,这是参对utf-8字符处理的,能对中文(中英混合)字符进行mb_substr($word, 0, $len)切分,[u]mb_substr($wor...

165.最新的主要变动

...化代码兼容性 - 增加用户案例文档:USERCASE - 改进自定义分词器 XSTokenizerScws 接受参数作为复合等级 - 升级 libevent 到 2.x 版 - 修正中文 stopwords 生效的问题 - 取消恼人的 NODB(S#506) 错误提示 - 新增获取文档匹配词表的接口 [XSSearch:...

166.php5.2.13的scws只能分割出人名

发布时间:2010-05-05 17:05 t By hight

我用的是 "陈凯歌并是《无极》的唯一著作权人,一部电影的整体版权归电影制片厂所有" 这段话,知道为什么就只能分割出来陈凯歌,如果是分词没起作用的话就会分割出陈凯歌的,这到底是为什么呢?麻烦高人帮帮我吧

167.RE: scws 词库与dict_user.txt文件有什么关系?

发布时间:2012-04-19 11:04 t By hightman

明白你说的。同义词是基于分词后的结果制作的。 如果你的索引先前制作,后面再添加自定义词,那么当然无效了。你要重建索引

168.scws1.2.2 php 扩展问题

发布时间:2013-10-13 02:10 t By kevinwang

...也被编译进去了这是怎么回事,即使需要set_dict也可以分词 另外这种情况下,set_dict感觉和add_dict一样,我的词典和编译进去的那个词典会一起使用 一些文章带有大量的链接http:// 结果 http com www 这些词 会被放到结果中,...

169.mysql 其实支持中文全文检索的

发布时间:2010-05-14 10:05 t By xiaolan

...果将ft_min_word_len改为2, 然后在程序里将内容用scws进行分词,然后存入数据库单独的字段里,用空格分开,检索的时候, 用mysql的全文检索,可以检索到结果, 然后在再程序里面对结果进行分析。 就比如说这样的sql语句是完...

170.自定义 SCWS 词库

...定义 SCWS 词库 如之前所说,我们所有的索引分词器默认为 scws,这也是我们开发的开源分词系统, 内置的词库基本上能满足绝大多数应用。但总有例外,这也就是即将说的如何自定义词库。 全局自定义词库 --------...

  • 时间不限
  • 按相关性排序