搜索

大约有 105 项符合查询结果, 库内数据总量为 3,513 项。 (搜索耗时:0.0055秒)

51.RE: 第四版遇到()和中英文混合分词的问题。

发布时间:2009-06-14 21:06 t By hightman

楼上你的情况是因为你对API使用不正确, scws_get_result 应该循环调用 while ($words = scws_get_result($sh)) { foreach ($words as $word) { print_r($word); } } 此外, 繁体词库很不完善, 缺词太多而且有一些词也不正确

52.英文数字组合字符串分词问题,已结贴。

更新时间:2014-05-14 10:05 t By hpxl

华硕主板H61-PLUS,想分词结果中包含H61。 通过 [url=http://www.xunsearch.com/scws/demo/v48.php]http://www.xunsearch.com/scws/demo/v48.php[/url] 得到的结果为“华硕/主板/H/61/-/PLUS”。尝试过自定义词库,$prefix/data/项目名称/dict_user.txt 加入H61,但是...

53.SCWS 能否添加 “中文+英文”和“中文+数字”自定义词

更新时间:2012-08-27 20:08 t By xiaofeng

hightman,你好! 因为项目需要从下述字符串中,分别提取:[color=#006400]斯巴鲁WRX[/color],[color=#006400]斯巴鲁200[/color] 这2个词 “斯巴鲁WRX和斯巴鲁200的区别,保养费用如何” 我试用了下面2种方法,均没有达到想要的结果,希望hi...

54.RE: SCWS 能否添加 “中文+英文”和“中文+数字”自定义词

发布时间:2012-08-30 20:08 t By xiaofeng

[quote='hightman' pid='1078' dateline='1346301119'] 支持是支持的,但数字字母最多只支持2位。 你说的情况其实切分成“斯巴鲁+WRX”并不会有多大问题吧。 像 Q币 QQ空间 这样的都是可以支持成词的。 [/quote] 感谢hightman 的回复。 ...

55.RE: 第四版遇到()和中英文混合分詞的問題。

更新时间:2009-06-16 00:06 t By JamesKG

[quote='hightman' pid='3145' dateline='1244985795'] 楼上你的情况是因为你对API使用不正确, scws_get_result 应该循环调用 while ($words = scws_get_result($sh)) { foreach ($words as $word) { print_r($word); } } 此外, 繁体词库很不完善, 缺词太...

56.分词 对于 词库 里有宝马x6 分词 为宝马和马x6 分词有问题 词库 里 只能添加 宝马 不能宝马x6 (中文 英文和数字在一起 存在分词问题)

发布时间:2013-07-04 16:07 t By louyefeiwu

分词 对于 词库 里有宝马x6 分词 为宝马和马x6 分词有问题 词库 里 只能添加 宝马 不能宝马x6 (中文 英文和数字在一起 存在分词问题) #解析后的 QUERY 语句:Xapian::Query((奥迪a6:(pos=1) SYNONYM (奥迪:(pos=89) AND 迪A6:(pos=90))))

58.关于scws和词库的一些建议

更新时间:2011-04-23 21:04 t By lauxinz

建议支持词库里的词可以是纯英文单词,虽然在分词时英文单词可以自动识别切分开,但在关键词提取和非法词过滤时却无法提取出或过滤掉纯英文单词。 比如:我要从一些商品名中提取一些品牌:adidas nike。。。对商品名分词...

59.发现有几种情况会导致分词不准确?

发布时间:2011-09-15 14:09 t By 逆雪寒

scws分词不正确的情况 1、中文夹杂连续两个以上英文或数字(例如:程jj序ii员e 正常,程jjj序ii员e 不正常) 2、英文数字组合中,同时含有连续一个以上英文或数字的组合(例如:w1156k 正常,w16ky不正常) 3、含有任意一个...

60.搜索框提示怎么做?

发布时间:2013-06-02 05:06 t By angelandy

...15 weight = 3 phrase = yes 现在中文字都可以了,,就是英文字不行,比如我的数据量 name 的是 abc,babcd,abcdce 。 我希望 当收 abc 是 只搜出 abc, abcdce 这样。 我试过 把英文的配置也改成跟中文一样,, 结果是 搜 a 正常, ...

  • 时间不限
  • 按相关性排序