首先感谢highman的系统,我的网站是www.71114.com(中国企业114黄页),主要使用这套系统检索供求信息。最近发现一个问题,无论是用主键删除还是索引词删除,都无法删掉。不知道是哪里存在问题,还请highman指点一下
...令行方式运行! php make_sqlite.php dict.sqlite dict.txt 参数第一个 dict.sqlite是词库的名称 参数第二个 dict.txt是输入词库的文本文件(本网站[url=http://www.hightman.cn/bbs/showthread.php?tid=636]本网站的PHP的XDB导入导出工具[/url]作者提供了一个...
文档中写到: [quote]每行一个词,由4个字段组成,字段之间用 \t 或空格分隔: 1) 注释以 # 或 分号开头。 2) 每行由4个字段组成,依次为“词语"(由中文字或[b]3个以下的字母合成[/b]), "TF", "IDF", "词性", 字段时间用空格...
addWeight('title', $skey) 作何解释?addWeight 是只针对一个词的。 此外 $skey 发果是关键字你就用 setQuery($skey . " type:1") 这样啊,详见: http://www.xunsearch.com/doc/php/guide/search.query
void scws_set_multi(scws_t s, int mode); 描述:设定分词执行时是否执行针对长词复合切分。(例如:中国人->中国+人+中国人)。参数 mode 表示复合分词法的级别,取值为 1 ~ 15。mode 设定值,1~15。[b]按位与[/b]的 1|2|4|8 依次表示 短词|二...
...s_res_t res, cur; char *text;// = "Hello, 我名字叫李那曲是一个中国人, 我有时买Q币来玩, 我还听说过C#语言"; text = "我是一名中国的程序员"; if(argc == 2) text = argv[1]; if (!(s = scws_new())) { ...
...-时候-非常-的-卡" 感谢!!![hr] 我找到了楼主原先的一个回复: 建议把这些要过滤的词新增加文本词典,属性设为 ! 即可。或者自己根据词性直接在取得返回值的时候排除它。。 尝试了下,是可以的!!!多谢
...统以及逆词频率(表示词重要性), 你可以参考现有的词造一个系数. 而词性标注请看这篇: http://www.hightman.cn/bbs/showthread.php?tid=42