搜索

大约有 200 项符合查询结果, 库内数据总量为 3,513 项。 (搜索耗时:0.2010秒)

101.TF/IDF算法

发布时间:2014-07-21 11:07 t By clearchen

想做自定义词库的功能。 哪位大侠,是否可以告知, http://www.xunsearch.com/scws/demo/get_tfidf.php 的算法。 谢谢

102.RE: 搜索的log

发布时间:2012-04-05 10:04 t By hightman

这个xunsearch暂时还没有提供这项功能,但可以先变通的如下方式处理: 在提取API后面自己再简单加个判断?现在新版 1.3.1 提供了 scws 接口,只要把这些黑词加到自定义词典,并取一个独特的词性,那么就可以用 XSTokenizerScws::has...

103.[2013] SCWS-1.2.2 发布,BSD协议、支持自定义词库、PHP5.4

更新时间:2013-07-11 21:07 t By hightman

...以PHP扩展语言为例)。 最新版下载地址:[url]http://www.xunsearch.com/scws/download.php[/url] -- [b]scws-1.2.2 发布于 2013-7-11[/b] 1) 改进中英夹杂的长词复合分法,比如 "奥迪A6/奥迪/A6" 2) 修正 pscws23 演示文件的一些写法与新版 PHP 不兼容 ...

104.自定义分词器

自定义分词器 `Xunsearch` 默认内置了功能强大的 [SCWS][1] 分词系统,也附加提供了一些简单常见的分词规则, 但考虑到用户的个性需求,特意提供了自定义分词器的功能。 > note: 自定义分词器存在一个缺陷,它不支持存...

105.RE: 安装时出现错误

更新时间:2012-01-17 14:01 t By whoneed

...:error: scws_new() NOT found in libscws, please check it first http://bbs.xunsearch.com/showthread.php?tid=7 按照这个贴子处理,还是不行。 没有 ln -s libuuid.so.1.0 libuuid.so; 这个文件。[hr] 除了把系统重装,并且装成32位之外,还有什么好方法吗?

106.分享一个dict_user.txt

发布时间:2012-02-21 16:02 t By Dull

全部是英文单词 数据来源: twitter tumblr amazon alibaba flickr 等的标签 原来多是词组形式 改成了scws的单字形式 没有附加任何属性 也就是说全部使用默认属性 参考 http://www.xunsearch.com/doc/php/guide/index.dict

107.RE: 英文数字组合字符串分词问题

发布时间:2014-05-14 11:05 t By soarb

[quote='hpxl' pid='7811' dateline='1400033006'] sdk/php/app/demo.ini配置 [id] type = id [/quote] 是scws-1.2.2 的如何让它支持自已定义的英文词库? 像http://bbs.xunsearch.com/showthread.php?tid=3088 这样修改代码吗?

108.项目配置文件详解

...件详解 基础说明 ------- - 项目配置是一个 `Xunsearch` 项目的核心灵魂,非常重要,通常保存为 .ini 文件 - 以分号开头的行表示注释,空行直接被忽略不起任何作用 - 中括号包围的每个分区均为字段配置,字段个数根据...

109.RE: 我想使用系统自动的分词功能,可是只看到有接口

发布时间:2011-11-28 12:11 t By icebolt

如果只是想实现分词,为什么直接用scws呢,何必用xunsearch呢?

110.RE: 建议用户能设置数字不分词

更新时间:2013-06-18 14:06 t By hightman

...定义分词器来补充。。。 将你的词复制到 [url]http://www.xunsearch.com/scws/demo/v4.php[/url] 进行实测,分割结果为: E14188m E14188 14188 14188m 那么搜索以上4个词都是可以搜索到的,至于你从中提取 e1418 来检索,那是很难有合适的策略去...

  • 时间不限
  • 按相关性排序