如题 ,比如我在dict_user文件里添加abc10000,查看分词的时候,它还是会分成abc +10000,这样就达不到效果了、、、
...ftphp网站上要求,在自己的服务器上配置SCWS,但始终无法分词。 我需要的是utf8编码的。 测试文件在gbk下好使,应该如何改成utf8格式的? 请教管理员,我该如何操作。 :huh: [/quote] 你要注意的是 一些文件里面的 编码设置
今天旗下的http://www.anetb.com需要一个支持中文分词的搜索页,原drupal的太烂了, 我的做法是:结合xunsearch实现drupal commerce下的中文搜索 测试页:http://www.anetb.com/tsearch/demo/commerce/search.php , 可输入“奶粉”,我的站准备做这...
系统环境:linux as5.0+httpd-2.2.11+mysql-5.0.56+php5.3.0+phpcms2008sp2+scws1.0.0 编译安装php5.3.0后找不到php.ini文件。于是找到系统自带的php rpm包,重新装了一遍,(之前编译安装的PHP5.3.0没有删除)然后vi /etc/php.ini ,把extension_dir设为空。...
[quote='net_li' pid='4355' dateline='1374126126'] 没人给解答下吗? [/quote] 可以使用1.4.7测试版本,这样就可以设置分词的setMulti属性,设置成11就能把所有单字都分出来,但是这样数据文件会变大,个人权衡效率问题吧
...搜索) content为词条内容(是用body类型) 全用的默认的分词 以上是用在线生成ini生成的。地址http://www.xunsearch.com/tools/iniconfig 2,建立索引,填充数据 cd /usr/local/xunsearch/sdk/php util/Indexer.php --rebuild --source=mysql://数据库用户名...
SCWS 全称是 Simple Chinese Words Segmentation 即简易中文分词系统。 [url=http://www.xunsearch.com/scws][b][size=5][color=#FFA500]2010/01, scws-1.1.0 发布,支持加载文本词典,下载及介绍请进项目站点 http://www.xunsearch.com/scws[/color][/size][/b][/url] [url=http://w...
...也被编译进去了这是怎么回事,即使不需要set_dict也可以分词 另外这种情况下,set_dict感觉和add_dict一样,我的词典和编译进去的那个词典会一起使用 一些文章带有大量的链接http:// 结果 http com www 这些词 会被放到结果中,...
...Search(); $index = $db->getIndex(); // 如有必要,还可以获得 scws 分词对象 $scws = $db->getScws(); ``` #### 使用 xunsearch DebugPanel 为便于调试,还提供了一个 `hightman\xunsearch\DebugPanel` 对象,可以集成到 debug 模块中, 可在调试工具条和面板中显...
刚在本地布了一套环境测试,使用同一段文字,演示的分词结果和我本地的结果不同,检查设置项没发现问题所在,所以问一下请大家帮忙看看是什么问题。 [b]分词内容:[/b] [quote] 本报长沙讯 22日晚7点50分左右,湖南农...