搜索 - 迅搜(xunsearch) - 开源免费中文全文搜索引擎

1.RE: 搜索分词只希望第一层怎么办？

发布时间：2014-05-13 15:05 t By hightman

这不是切分。这是增加匹配，以同义词的形式支持切分后的短词匹配。

2.RE: 结合搜索引擎来制作自动标签系统

发布时间：2011-12-08 08:12 t By Dull

...索过程的一个反向正常搜索就是一句话 -> 分词 -> 搜索匹配 -> 输出具体实现上那匹配标签或者关键字这么做似乎也行一句话 -> 分词 -> 搜索匹配 -> 前10个结果取样(比如取共有的标签按照权重分配标签权重) -> 输出这些元...

3.RE: 搜索分词只希望第一层怎么办？

发布时间：2014-05-14 00:05 t By dashzhao

[quote='hightman' pid='7795' dateline='1399967280'] 这不是切分。这是增加匹配，以同义词的形式支持切分后的短词匹配。 [/quote] 嗯，确实呀，不过这个需求估计很多自定义的同学都希望自己可以调整设置吧。谢谢管理员:D。

4.图片搜索的一些疑问

更新时间：2014-02-16 17:02 t By Mr.

...检索hash_64字段值完全相等的数据，然后根据hash_196字段按匹配度排序我对xlen分词器不是很了解这个排序mysql可以实现但是mysql分割后的位置不是固定的 project.name = hash project.default_charset = UTF-8 server.index = /dev/shm/xs-indexd.sock se...

5.RE: 建议用户能设置数字不分词

更新时间：2013-06-18 14:06 t By hightman

...至于你从中提取 e1418 来检索，那是很难有合适的策略去匹配。

6.RE: 搜索分词只希望第一层怎么办？

发布时间：2014-05-13 02:05 t By dashzhao

http://bbs.xunsearch.com/showthread.php?tid=2141&pid=4025#pid4025 我找到了这个帖子，不过好像结果更离谱了。自定义的直接搜不到了理想的结果了，而数据库是存在完全匹配的。。。

7.RE: 公司项目求助

更新时间：2012-03-07 10:03 t By hightman

...om/scws/ 是C版的。此外，你所说的最大颗粒分词是指最长匹配吗？分词在 scws/xunsearch 结合时作了很多特殊处理，保障查全率和准确率。比如“管理制度”　解析为　“管理制度”　OR　“管理 AND 制度”

8.添加新的分词无效

发布时间：2013-12-04 15:12 t By mengaifan

...加了一行：享鑫 1 1 n，但是“享鑫金属”还是只有金属被匹配出来

9.PHP4版简易中文分词(PSCWS) 第2/3版

发布时间：2007-06-06 09:06 t By hightman

...完全一样，主要区别在于分词的算法，前者采用正向最大匹配2级交叉消岐，而后者采用的是双向匹配综合消岐。并没有绝对的谁优谁劣，似乎半斤八两。两者都是基于词典词频查询，推荐词典格式为 cdb，因为它在 PHP 中有捆...

10.能否提供字典dict.xdb的生成程序

更新时间：2009-06-28 10:06 t By heraldboy

最近单位有个地址匹配的工作要做，发现你的东西非常高兴，正和我用。但发现现有的字典不太适合我们做地址的分词，能不能给个办法将文本的转为dict.xdb格式，看到你在论坛中回复提到一个转换程序，但我不知道在哪里下...

开源免费、高性能、多功能、简单易用的全文检索技术方案 !

相关搜索