...久会更新一次词库? 最后,我对github上提供的 get_tfidf.php 中get_count函数做了一下更新,其中corpusUrl依然使用的baidu,如下: // 获取语料库中包含该词的文档数 function get_count( $corpusUrl, $word) { $url = $corpusUrl . urlencode($word)...
...了啊,安装位置在/usr/local/scws libscws.so文件也存在 但是php扩展编译的时候貌似不认,报出上述错误 这是我安装后的目录,你看看: [XXX@XXX ~]$ ls /usr/local/scws/lib/ libscws.la libscws.so libscws.so.2.0 [quote='hightman' pid='3731' dateline=...
我用的是scws[PHP-5.4.x (40KB,VC9,NTS)] 分词模块。其中的代码我都没改。我对“调用 segment 方法执行词汇切割”进行分词,分词结果为“Array ( [0] => 璋 [1] => 冪 [2] => 敤 [3] => segment [4] => 鏂 [5] => 规 [6] => 硶 [7] => 鎵 [8] => ц [9] => [10]...
...儿,我没看明白。 2. 你的错误是因为你用错误词了,48.php 是针对UTF-8的,而你调用了gbk的词典,把你的词典语句改为 dict.utf8.xdb 即可 3. dict_extra.txt 也必须是UTF-8编码 4. 删除词条,因为陈凯歌其实可能是因为人名关系导致切成...
想列出所有数据,看了http://bbs.xunsearch.com/showthread.php?tid=349&pid=4427#pid4427这个帖子,把关键字设为空了 $xs = new XS($project); $search = $xs->search; $docs = $search->setQuery()->search(); 会提示setQuery 缺少参数,看了源码,原来写法是setQuery(...
...查找类型为电影、并且拼音中包含ff的。如用:util/Quest.php words "pinyin:ff AND type:电影",怎么查不到结果? 2、如何根据 ff 把搜索到的影片中的关键词(芬芳、非凡、风范)高亮? 3、搜索结果中如何把关键词按影片名中关键词出...
[php]root@localhost ~]# Indexer.php --source=mysql://xxx@localhost/phpcms --sql="SELECT a.id,a.title,a.url,a.catid,FROM_UNIXTIME (inputtime,'%Y%m%d' ) as inputtime,ad.content,c.catname,c.url as caturl FROM v9_dede_article AS a LEFT JOIN v9_dede_article_data as ad on a.id=ad.id LEFT JOIN v9_categ...
... 0 [attr] => @ ) 词库文件是UTF8编码的,已经分别试过使用PHP版词库工具以及scws-gen-dict来生成词库,但是结果都一样。 有什么可能的原因吗? 谢谢 [hr] 我使用的代码如下, dict.utf8.xdb是我自己的词库 //实例化分词插件核心...
...饰关键词链接到了 [url]http://www.adminlink.net.cn/websearch/search.php?q=%E6%9C%8D%E9%A5%B0[/url] 页面。 整个的搜索页在 [url]http://www.adminlink.net.cn/websearch/search.php[/url] 库内数据总量为 151,105 项。 (搜索耗时:0.0157秒)速度确实很不错。十几万...
...XSSearch » XSServer » XSComponent 版本 1.0.0 源代码 sdk/php/lib/XSSearch.class.php XS 搜索类, 执行搜索功能 有部分方法支持串接操作 $xs->search->setQuery($str)->setLimit(10, 10)->search(); $xs->close(); Public 属性 隐去继承来的属性 ...