我在自己的网站上使用scws做分词,当文章中有类似PC-BSD之类有连字符的英文词时,都分成类“PC - BSD”,但这是个软件名,本不应分开,英文中加-号的一般都视为一个词,按理说不应分开的,有什么方法解决吗?
...的 type:电影 上,是否给字段做了正确的索引? 2. 似乎没什么好办法,如果量小你可以把 ff设置为 芬芳、非凡、风范的同义词,但从你的量看这个方法应该不可行。你可以尝试另外做一个索引库,记录 ff 相关的原词来做高亮。...
...的 type:电影 上,是否给字段做了正确的索引? 2. 似乎没什么好办法,如果量小你可以把 ff设置为 芬芳、非凡、风范的同义词,但从你的量看这个方法应该不可行。你可以尝试另外做一个索引库,记录 ff 相关的原词来做高亮。 ...
...能不能通过修改rules改变呢?因为我不是太理解un指的是什么,好像助词'的'、标点符号等都被视为un。我在插入全文索引记录的时候,需要排除此类,但又会把像"LG集团"这样的例子给漏掉。 2, 百分数会将数字与百分号分离,...
1.请问SCWS-php扩展和php-scws有什么不同? 2.如何安装SCWS-php扩展和php-scws?
Hi,建求使用utf-8编码,或指定utf-8 header 具体不清楚什么情况,我在mac环境出现乱码 [attachment=2]
...下面的错误,刚刚接触,反复看过开发文档,还是不知道什么原因... 【测试页面源代码:】 【错误日志:】 [29-Sep-2012 12:02:48] 致命的运行时错误(E_ERROR) Uncaught [XSException] ../../xunsearch/sdk/php/lib/XS.php(2204): Permission denied(C#13) ...
用了最新版也不行. 如"冰毒"scws_has_word判断不出来 , 真奇怪 还有什么问题导致的呢?