搜索

大约有 30 项符合查询结果, 库内数据总量为 3,513 项。 (搜索耗时:0.3890秒)

11.添加新的分词无效

发布时间:2013-12-04 15:12 t By mengaifan

...加了一行:享鑫 1 1 n,但是“享鑫金属”还是只有金属被匹配出来

12.获取搜索结果

...[搜索结果文档](class.document), 如果没有任何符合条件的匹配则会返回一个空数组。 在获取搜索结果前您必须用[上一章](search.query)学到的知识先构造好相应的搜索语句 `$query`。 > note: 只有不带参数的 [XSSearch::search] 搜索调用才...

13.PHP4版 简易中文分词(PSCWS) 第2/3版

发布时间:2007-06-06 09:06 t By hightman

...完全一样,主要区别在于分词的算法,前者采用正向最大匹配2级交叉消岐,而后者采用的是双向匹配综合消岐。并没有绝对的谁优谁劣,似乎半斤八两。 两者都是基于词典词频查询,推荐词典格式为 cdb,因为它在 PHP 中有捆...

14.能否提供字典dict.xdb的生成程序

更新时间:2009-06-28 10:06 t By heraldboy

最近单位有个地址匹配的工作要做,发现你的东西非常高兴,正和我用。 但发现现有的字典不太适合我们做地址的分词,能不能给个办法将文本的转为dict.xdb格式,看到你在论坛中回复提到一个转换程序,但我不知道在哪里下...

15.中文分组粗分方法

发布时间:2010-05-26 12:05 t By baobao

...关于中文分词的课件和论文。 词的粗分有几种: 最大匹配法 最大概率法 最短路径法 未登录词识别方法 等等 我下PSCWS4,学习了好久算法,由于个人水平还有限,很多地方都不理解,问下你使用的分词方法是基于词典的哪...

16.RE: 能否提供字典dict.xdb的生成程序

发布时间:2009-06-28 21:06 t By hightman

...P程序就更好了,希望能实现。 本人有个工作是进行地址匹配,就是很多人员信息的地址,但在各数据库中可能填写的不太一样,人一眼就能看出是同一地址,但对于计算机很难,站长有思路吗? 谢谢! [/quote] 抱歉,目前没...

17.关于多粒度的建议

发布时间:2013-12-24 13:12 t By anzm2005

...是中国 我们是 这些词 就是目前是按照词典最长词匹配,更短的词就忽略了。

18.RE: 我想用xunsearch代替mysql的like语句

发布时间:2012-03-05 10:03 t By hightman

。。。。 全文检索就已经是分词匹配了,还LIKE什么LIKE啊

19.RE: 结合搜索引擎来制作自动标签系统

发布时间:2011-12-07 13:12 t By hightman

多谢建议。这个部分要做得精准的话其实是比较尖端的,SCWS分词后有提供一些热门词排序,如果简单归结为标签也是不妥的,我觉得需要有标签库进行匹配和比对。

20.RE: 关于自建字典问题

发布时间:2013-09-02 04:09 t By gwgwgw

...XT);(注:a.txt)为文本字典,运行无报错,但是无法正确匹配(如:我的a字典就2个词,好纠结啊,纠结死啦,但是当我输入时还是分词为 纠结|死了),求救啊!! 还有帖子1中,字典的问题,生成的字典是因为无法载入而报错...

123
  • 时间不限
  • 按相关性排序