搜索

大约有 30 项符合查询结果, 库内数据总量为 3,513 项。 (搜索耗时:0.3890秒)

11.遇到一个分词错误的问题

发布时间:2014-02-08 16:02 t By robinjia

...j ? /un 后来发现可以通过修改rule.utf8.ini里的规则来调整分词结果,不知道有没有更好的办法?

12.求助scws分词bug

发布时间:2014-04-22 15:04 t By zhoutian

使用scws分词的时候,如果输入40多个“卡”字,最后分出来的那个词少了一个字节,就是说在utf8下原本3字节的一个“卡”字,变成了两个字节,形成了一个乱码。在线测试也会出现这种情况,大家怎么解决啊???

13.问个弱智的问题,不知道会不会收到回复?

发布时间:2011-09-19 13:09 t By strongfinger

用了网上的演示,这个分词系统挺好用的.但是本人是PHP新手,使用win7平台,hightman大侠提供的好像是一个中文分词引擎,不知道怎么直接在我的php空间上激活。请问我自己要怎么实现演示页面的显示效果呢?

14.scws1.2.2 php 扩展问题

发布时间:2013-10-13 02:10 t By kevinwang

...也被编译进去了这是怎么回事,即使不需要set_dict也可以分词 另外这种情况下,set_dict感觉和add_dict一样,我的词典和编译进去的那个词典会一起使用 一些文章带有大量的链接http:// 结果 http com www 这些词 会被放到结果中,...

15.关于自建字典问题

发布时间:2013-09-02 00:09 t By gwgwgw

先谢谢highman提供了这么方便的分词工具! 使用中发现,在字典的建立过程中,及php make_xdb_file.php 报了一大堆警告: Notice: Undefined index: tf in C:\xampp\php\xdb\make_xdb_file.php on line 93 Notice: Undefined index: idf in C:\xampp\php\xdb\make_xdb_file.p...

16.拼音搜索时遇到的问题

更新时间:2012-12-26 12:12 t By HiLinz

...”、“强者风范”等影片。我采用的方法是把影片名通过分词后再取其各关键词的首字母,如影片“强者风范” 分词后获取首字母得到拼音字段为“qz,ff”,查询时,根据 pinyin:ff 可查找到 “强者风范” 。 我遇到的问题是: 1...

17.scws与多线程

更新时间:2010-12-07 23:12 t By lauxinz

...在多线程环境下怎么使用libscws,每一个线程都需要进行分词? typedef struct { xdict_t d; rule_t r; unsigned char *mblen; unsigned int mode; unsigned char *txt; int zis; int len; int off; int wend; scws_res_t res0; scws_res_t res1; word_t **wmap; st...

18.sunsearch如何解决一对多数据结构索引(coreseek的sql_attr_multi属性可以解决这个问题)

发布时间:2013-03-30 10:03 t By fenglangyj

..."23,435,66,6",想要搜索出分类id为6的数据,可以使用自定义分词,用","分隔这样设置字段: [cat_id] index = self tokenizer = split(,) 然后使用字段索引搜索就可以解决问题了; 不过有下面需求的时候我就不知道怎么解决了: 有一个图...

19.关于扩展词库的问题

发布时间:2012-12-10 15:12 t By timeage

...生的词库对‘阿斯顿发斯蒂芬罗铭罗大大罗’这段话进行分词 其中结果为: 阿斯顿 阿斯 斯顿 阿 斯 顿 发 斯蒂芬 斯蒂 蒂芬 斯 蒂 芬 [b]罗铭罗 罗铭 铭罗[/b] 罗 铭 罗 大大 大 大 罗 [复合分词选项] 最短词 二元 重要单字 ...

20.帝国CMS安装迅搜_linux系统下

发布时间:2014-08-30 22:08 t By qiuxis

...道迅搜这个开源程序,因为我做的一个插件就是用迅搜的分词系统做的。 先按官方的操作,把程序安装到服务器上。我的部署是这样的: 1\运行下面指令下载、解压安装包 cd /home wget http://www.xunsearch.com/download/xunsearch-full-la...

123
  • 时间不限
  • 按相关性排序