...> 硶 [7] => 鎵 [8] => ц [9] => [10] => 璇 [11] => 嶆 [12] => 眹 [13] => 鍒 [14] => 囧 [15] => 壊 ) ”,这感觉好像是编码格式的问题,代码用的是gbk,我没改,看了下网页显示编码也是用的gbk。 然后我用记事本打开XDB 格式的词典文件dict.xdb...
...:词典中的词语“辣椒油”在词典中是这样的: 辣椒油 13.45 9.22 n 我用计算器得出是这样的: WORD=辣椒油 TF=12.07 IDF=12.38 新制作的词输出为词典的时候没有作用,用你说的新词的TF和IDF都用1的话,也没有作用,求老大指点...
...:词典中的词语“辣椒油”在词典中是这样的: 辣椒油 13.45 9.22 n 我用计算器得出是这样的: WORD=辣椒油 TF=12.07 IDF=12.38 新制作的词输出为词典的时候没有作用,用你说的新词的TF和IDF都用1的话,也没有作用,求老大指点...
...384 searchd.log [root@sm xunsearch]# cat tmp/searchd.log 2011-12-01 22:13:48 searchd[26192] caught system exceptional signal[11], terminate immediately 2011-12-01 22:13:48 searchd[26194] bind() or listen() failed, error: Address already in use(#98) 2011-12-01 22:13:48 searchd[26194] socket ser...
... ["type"]=> int(0) ["vno"]=> int(13) ["tokenizer":"XSFieldMeta":private]=> int(0) ["flag":"XSFieldMeta":private]=> int(0) } ["posttime"]=> object(XSFieldMeta)#32 (7) { ["name"]...
...m':7 'href':3 'http':4,12 'net':19 'org':15 'pgsql':1 'pgsqldb':6,14 'www':13 '中国':8 '社区':9 '论坛':10 (1 row) 下面是用鬼佬写的分词的结果,email,网址正确合并,而且标签被正确的去除,但中文却没有分词 postgres=# SELECT to_tsvector('simple','pgsql中国...
Warning: PHP Startup: Unable to load dynamic library 'd:/wamp/bin/php/php5.3.13/ext/php_scws.dll' - %1 不是有效的 Win32 应用程序。 apache的错误日志中这么报错!哪里有64位的扩展库下载?
...../../../usr/local/xunsearch/sdk/php/lib/XS.php(2481): Permission denied(C#13, localhost:8384) [/quote] 原因是防火墙的问题。 你可以先试 #setenforce 0 然后在打开你的搜索页,搜索看看,这时候能正常搜索了 那可以确定是防火墙的设置出了问题了 ...
...威力。 主要更新如下: 1. 升级整合最新的 xapian-1.2.13、scws-1.2.1 2. 新增支持项目自定义词库,[url=http://www.xunsearch.com/doc/php/guide/index.dict]参见文档[/url] 3. 改进网络 IO 读取,优化搜索内存运用等大幅提升性能和稳定性 4. 净...
...f = log($tf); $idf = log(5000000000/$count); //if ($tf > 13) $idf *= 1.4; return array($tf, $idf); } 有几个问题: 1、当一个词在baidu搜索中找到小于1000篇文章包含该词时,为什么要重新计算count,“21000 - $count * 18” 其中21000是...