搜索

大约有 90 项符合查询结果, 库内数据总量为 3,513 项。 (搜索耗时:0.5852秒)

51.自定义词库如何使用?

发布时间:2013-05-12 11:05 t By hq22

网页设计 分词变成 网页设计 网页 设计 我想把网页设计就分为网页设计一个词,不需要搜索出含有网页跟设计的内容。 我在dict_user.txt加入 网页设计 这个词,好像并没有效果,还是搜索出来含有网页跟设计的文档。

52.关于 Xunsearch PHP-SDK

...采用 C/C++ 编写,索引设计基于著名而悠久的 [Xapian][1],分词采用 自主研发同样也是开源的 [SCWS分词][2],两者完美结合,理论上单个搜索库支持 40 亿条 记录。可编译运行于 Linux/FreeBSD 等各种 UNIX 类型的系统。 *Xunsearch PHP-SDK* 是...

53.关于 misc/ 目录下的文件

发布时间:2007-06-06 10:06 t By hightman

CWS_cli.php - 命令行分词, 读取标准输入 CWS_query.class.php - PHP 访问 cscwsd 的类库 CWS_file.php - 针对文件分词 CWS_test.web.php - 网页测试 [code] cscwsd-0.0.x (PHP版查询交互程序示例...

54.RE: 结合搜索引擎来制作自动标签系统

发布时间:2011-12-07 13:12 t By hightman

多谢建议。这个部分要做得精准的话其实是比较尖端的,SCWS分词有提供一些热门词排序,如果简单归结为标签也是不妥的,我觉得需要有标签库进行匹配和比对。

55.我在Linux下安装成功了,php中也运行了,但是分词不对,不知道为什么?

发布时间:2010-05-08 00:05 t By xyliufeng

...作品,就必须经过作者授权,没有授权就是侵权。 [b]分词:[/b] 陈凯歌 并 不 是 《 无 极 》 的 唯 一 著 作 权人 , 一 部 电 影 的 整 体 版 权归电 影 制 片 厂 所 有 。 一 部 电 影 的 作 者 包括导 演 、 摄 影 、 编 剧 ...

56.RE: 中文分组粗分方法

发布时间:2010-05-26 19:05 t By baobao

...立断 14.01 8.10 i WORD ATTR我都能理解。 上贴说的逐字分词 计算权重的时候使用IDF,貌似就是类似基于字典的最大概率方式来定义权重,或者说是对于歧义的取舍。 TF IDF 具体是指什么? 使用的概率计算公式能阐述下么? ...

57.www.adminlink.net.cn上的xunsearch案例

更新时间:2011-12-08 12:12 t By adminlink

首页说下我为什么安装中文分词和全文搜索。 就是因为提取出更多的页面,让搜索引擎蜘蛛没完没了的爬,达到网页聚合的目的。这样做我估计对优化很有帮助。 选择scws的原因是比较了几个中文分词,感觉scws是一个不错的...

58.构建搜索语句

...部默认采用 `AND` 规则, 也就是说要求列出来的关键词(分词)全部匹配,如果您通过 [XSSearch::setFuzzy] 开启了模糊匹配,那么相当于采用 `OR` 规则,只要其中一个关键词匹配即可。 刚刚说的这种搜索的是索引数据库的“混...

59.RE: scws1.1.8为什么第一次都很慢。

发布时间:2011-10-24 11:10 t By hightman

我刚试了一下倒是很快啊。 你说的第一次慢是重启WEB第一次还是隔一段时间分词就会这样?

60.强烈建议支持词库里的词可以是纯英文单词

更新时间:2011-04-24 01:04 t By lauxinz

建议支持词库里的词可以是纯英文单词,虽然在分词时英文单词可以自动识别切分开,但在关键词提取和非法词过滤时却无法提取出或过滤掉纯英文单词。 比如:我要从一些商品名中提取一些品牌:adidas nike。。。对商品名分词...

  • 时间不限
  • 按相关性排序