搜索

大约有 182 项符合查询结果, 库内数据总量为 3,513 项。 (搜索耗时:0.2930秒)

71.scws自定义词库可否自定义词性?

发布时间:2012-04-28 14:04 t By yunxiaoad2

我想在$prefix/etc/dict_user.txt内添加一些自定义词汇,有几个问题: 1、添加完是否需要重启xunsearch主进程?(实验结果是,求确认) 2、只监视dict_user.txt,还是会扫描、装载etc目录下所有的txt? 3、自定义词库后,系统内置词库...

72.添加新的分词无效

发布时间:2013-12-04 15:12 t By mengaifan

...ws/etc/dict.utf8.xdb'); $cws->add_dict(ROOT_PATH."inc/spider/dict_extra.txt", SCWS_XDICT_TXT);//新增词库 $cws->set_ignore(true); //var_dump($cws); //添加中文分词 $cws->send_text($a); dict_extra.txt 已经增加了一行:享鑫 1 1 n,但是“享鑫金属”还是只...

73.“有空间”的分词有问题和扩充词典

更新时间:2013-05-18 14:05 t By lyjkensou

...结果是“有空 间” 即使通过scws_add_dict()添加了自定义的txt字典(里面只包含“空间 11.82 12.38”一行),仍然分不出“空间”这个词。 还有如何设置才能识别出网址和邮箱等格式? 另外关于scws-gen-dict,按照github上的说明,...

74.[特别提供] 纯PHP编写的sqlite词典工具!!

更新时间:2010-07-08 22:07 t By limaoxiang

...[/url]里面提到的,我花了一些时间DEBUG后也用不了(导出txt总是内存溢出,而由txt生成的XDB在scws23也无效)!最后,我放弃了XDB,但是嘛,直接用TXT也不好,内存占用太大,效率也低。后面,我分析了一下demo程序,就借用作者的...

75.RE: xunsearch-1.4.5 (基于 xapian 和 scws开源中文搜索引擎,高扛压不死锁)

发布时间:2013-03-28 12:03 t By vus520

...an' pid='3722' dateline='1364360180'] 你这个词典是在 etc/dict_user.txt 还是项目目录下的 data/app/dict_user.txt ? 如果是后者需要升级到 1.4.6-dev 才支持,前者必须在改词典后重启 xs-searchd [/quote] 我今天升级到1.4.6了,词典在etc/dict_user.txt...

76.RE: [2010] SCWS-1.1.3 发布,支持文本词典实现自定义词库啦!!

更新时间:2010-11-13 10:11 t By snakeyasin

... 参数 mode 包括三个值:SCWS_XDICT_XDB, SCWS_XDICT_MEM, SCWS_XDICT_TXT, TXT意未着 fpath 指向的词库文件为纯文本文件, 可以通过按位与(|)与另2项链接表示是否强制将词库加载到内存. 除TXT外只支持XDB格式的词库了。 2个函数...

77.RE: 在php cli 下测试自定义字典的更新问题

发布时间:2010-10-13 10:10 t By hightman

...完全没有这样的情况。改什么就是什么,前提是确定你的txt文件确实被成功修改了。 你建议你在 test.php 里的 scws_new() 之前加一句: echo "dict content: \n"; echo file_get_contents('/data/html/365search/dict.film.txt'); echo "\n-------\n"; 看看你的 dic...

78.RE: [2010] SCWS-1.1.3 发布,支持文本词典实现自定义词库啦!!

发布时间:2012-11-06 22:11 t By umland

... 参数 mode 包括三个值:SCWS_XDICT_XDB, SCWS_XDICT_MEM, SCWS_XDICT_TXT, TXT意未着 fpath 指向的词库文件为纯文本文件, 可以通过按位与(|)与另2项链接表示是否强制将词库加载到内存. 除TXT外只支持XDB格式的词库了。 2个函数...

79.RE: 三个问题需要求教

发布时间:2011-01-17 16:01 t By hightman

... if (ch == 0x25 && !SCWS_IS_DIGIT(txt[start+1])) + { + start++; + wlen++; + ...

80.RE: 请教:关于地市信息的分词结果,如何更准确?

发布时间:2010-09-26 20:09 t By hightman

...无用词汇,以下我写出来作参考,把下面的文字存成dict.txt,然后在原有的set_dict之后加上 scws_add_dict(s, 'path/to/this_ad_dict.txt', SCWS_XDICT_TXT); 这样使文本词典生效. 其中词典格式为 词 tf idf attr (当attr为!表示删除该词) [code] 市廛 1 1...

  • 时间不限
  • 按相关性排序