搜索

大约有 83 项符合查询结果, 库内数据总量为 3,513 项。 (搜索耗时:0.1932秒)

51.RE: scws_has_word的逻辑问题

发布时间:2010-07-29 14:07 t By hightman

关于has_word, 不是很明白你的意思, has_word 用于检测当前文本中是否包含这些属性的词。 scws_get_words 是按词性返回分词结果,标点的词应该默认应该是 un 或 # 之类可以自行排除。

52.RE: 分词初试,结果不对

更新时间:2010-09-16 17:09 t By xiaowang19

...正确了[hr] 不过,又出现了奇怪的问题,我在原来的测试文本后面随便加了两个字母,分词又不对了。我继续增加字母,有时候对,有时候不对。(GBK版本)

53.请教hightman几个问题,请进

发布时间:2012-11-22 12:11 t By hzqbbc

...晚了:D 目前在做全文搜索引擎的选型,计划用于海量的文本内容检索(如邮件,备忘录,联系人,文档等碎片化数据),不知xunsearch是否能满足?下面是几个疑问 1)xunsearch 基于xapian,那xapian建索引慢的问题,有没改进? 2...

54.RE: 请问一下,xdb与txt词库那个读取效率更高

更新时间:2013-06-29 23:06 t By 阿弟2013

...部分的内容,当然,我也可以配置分析器email,url按普通的文本来处理 postgres=# SELECT to_tsvector('mylang_simple','pgsql 中国社区论坛 http://www.pgsqldb.org:8079 chenaishen@263.net'); to_tsvector ------------------------------------...

55.RE: scws_has_word的逻辑问题

更新时间:2010-07-29 15:07 t By backluck

...] 关于has_word, 不是很明白你的意思, has_word 用于检测当前文本中是否包含这些属性的词。 scws_get_words 是按词性返回分词结果,标点的词应该默认应该是 un 或 # 之类可以自行排除。 [/quote] 关于has_word,我的意思是说,当我不...

56.RE: 请教hightman几个问题,请进

发布时间:2012-11-27 13:11 t By hightman

...延迟通常是若干秒吧。 4)你可以借助其它工具转换为文本,这个在XS里没有包含。

57.[特别提供] 纯PHP编写的sqlite词典工具!!

更新时间:2010-07-08 22:07 t By limaoxiang

...了sqlite的工具了,毕竟sqlite是PHP5开始默认支持的轻量级文本数据库引擎,也是不错的东西(关键是php5环境一般都支持) 附件是用txt生成sqlite词库的程序,用命令行方式运行! php make_sqlite.php dict.sqlite dict.txt 参数第一个 dict.s...

58.添加自定义词库的问题

更新时间:2010-06-03 16:06 t By xiaolan

使用自定义的文本字库, $scws = scws_new(); $scws->add_dict("/path/to/dict",SCWS_XDICT_TXT); 自定义的词库可以使用了, 可是原有的词库就没了。。。 于是。。再这样,先添加原有的词库 $scws = scws_new(); $scws->set_dict("/path/to/dict.utf8.xdb"); $scws->...

59.XSTokenizerScws

... public array getResult(string $text) $text string 待分词的文本 {return} array 返回词汇数组, 每个词汇是包含 [off:词在文本中的位置,attr:词性,word:词] 源码: sdk/php/lib/XSTokenizer.class.php#L339 (显示) public function getResult($text){ $wo...

60.RE: 我想过滤由‘人’‘得’‘到’‘直’ 这几个字组成的关键字

发布时间:2010-05-31 09:05 t By 燧人氏

... 得到,做到,想到,跑到,到达…… 过滤的词新增加文本词典,我要一个个词组去过滤,明显很吃力。

  • 时间不限
  • 按相关性排序