搜索

大约有 183 项符合查询结果, 库内数据总量为 3,513 项。 (搜索耗时:0.0983秒)

161.scws 1.2.2的问题,为什么PHP调用c扩展和直接在c语言环境下得到的分词结果不一样?

发布时间:2014-02-24 10:02 t By 562586756

比如说“这本书”,在用C语言编译调用scws分词结果为"这/本书",但是编译为php扩展后调用,结果为"这本书",没有分掉,同一份代码同一个词库同一个规则集,为什么会出现不一样的结果?

162.RE: 三个问题需要求教

更新时间:2011-01-17 16:01 t By hightman

...只允许一个.)。不过这样可能对于一些情况会误处理,比如代码中的 i = 300%2; 就会被认为是 300% 了。。。 3. 由于是根据词库来处理的,繁体词不在词库中就没有办法切分,不过你可以简单的打开 set_duality 功能,这样不认识的...

163.RE: 搜索蜘蛛来抓取,导致搜索日志不正常,热门搜索一直是不相关的内容

发布时间:2012-05-11 12:05 t By Mr.

...,似乎用户后者搜索引擎能通过别的域名访问你的网站 比如,你在代码中配置的是www.xxxx.com,而蜘蛛通过无www的域名访问 过滤蜘蛛应该用user_agent [/quote] 我不会去用user_agent的 麻烦 全部蜘蛛都给判断一次? 其实知道这个$...

164.英文模糊搜索问题

发布时间:2013-07-31 10:07 t By homingway

...,最下方是我的具体代码实现,我试验的对象是英文名,比如有两个名字:San Zhang和randy hong,我按照这种方式建立索引后,查询:name:randy后,返回的第一条结果是San Zhang,第二条才是randy hong,很不解啊,同时这个方法也不支持...

165.想在用索引搜索时,输入的关键字不被分词该怎么做?

发布时间:2014-11-20 15:11 t By pbin

...义词库的设置,然后根据文档使用了下,发现没达到效果。比如说,我想搜索拥有"味道恶心"这个词的文章,(我的文档库里面是有相关文章的了)搜索的时候出现了大多都是分成了"XX味道"+"XX恶心"的,所以我就在自定义词库"etc/dict_user...

166.www.adminlink.net.cn上的xunsearch案例

更新时间:2011-12-08 12:12 t By adminlink

...都用到了scws来提取tags. 提取到了tags,然后链接到搜索页比如服饰关键词链接到了 [url]http://www.adminlink.net.cn/websearch/search.php?q=%E6%9C%8D%E9%A5%B0[/url] 页面。 整个的搜索页在 [url]http://www.adminlink.net.cn/websearch/search.php[/url] 库内数据总量...

167.在 Xunsearch 使用 SCWS

...以自制一个词典,并将黑词统一设置为一个独特的属性,比如 "@", 那么就可以用该功能判断一段文本是否包含黑词。 ~~~ [php] $text = '...'; if ($tokenizer->hasWord($text, '@')) { // 包含词性为 '@' 的词 } else { // 为包含词性为 '@' 的词...

168.RE: 1.1.2的 自定义字典无法使用

更新时间:2010-05-23 22:05 t By 逆雪寒

...C%94%E8%AE%B0%E6%9C%AC%E7%94%B5%E8%84%91%E5%90%97&wq=%E6%90%9C%E7%B4%A2 比如这个:我搜得是 "那是你的笔记本电脑吗" 在 ff 浏览器下. ctrl + f5 强刷新下. 几次就会出现一两次 无法分词的问题. 去掉显式,就一点问题都没有了..我实在很无奈...

169.自定义分词器

...始终为 UTF-8 。 如果您需要编写带有参数支持的分词器,比如让用户传入按什么字符分割,请参照下面写法编写构造函数: ~~~ [php] class XSTokenizerXyz implements XSTokenizer { private $delim = '-'; // 默认按 - 分割 public function __construct...

170.复合分词的级别"multi" 可以设置分词的长度吗?

发布时间:2012-07-19 11:07 t By calvin

... 具体返回的json 见下面. 我想设置到 不要一个字的词, 比如说至少要返回的分词是有两个字符的. "multi"=>3 这个参数可以设置到吗? [code] object(stdClass)#1 (2) { ["status"]=> string(2) "ok" ["words"]=> array(7) { [0]=> object...

  • 时间不限
  • 按相关性排序