[XSException] ../../..(2094): Data/Name too long(S#402) 我想问下关于讯搜的搜索语句过长的问题。 因为当搜索语句过长的时候会报错,用户体验很不好。 在哪里可以获取搜索语句的长度。或者当超过长度限制的时候在哪里可以判断。 有...
上线一周,发现两个问题,有些疑惑。 1,热门关键词是否记入的是分词后的结果?是否可以记录未分词前的搜索关键字呢? 2,顺序是如何排列的呢?从下面的结果看,并不是搜索次数高的一定排在前面。 序 搜索热门关...
MACOS比较 麻烦,因为正文UTF-8,目录是GBK,所以无法协同,我在MACOS用ICHM看好多文件时也出现过这个问题 。 下次把文件 统一用GBK编码可能 可以解决
...版。 今天喝酒回来,又想到一个问题,乘着酒兴提个关于字段数的限制方面的建议,不知合理不合理: 我现在的理解是字段数目有只能是255个的限制,对于大多数项目来说,这个数目是足够了。但是对tmall.com(taobao.com)这...
我使用scws的C版本提供的接口对省份、地市信息进行分词,发现分词的结果有时不是希望达到的结果。例如: 1 洛阳市廛河华林水席村 希望的结果为:洛阳市 廛 河 华林 水 席 村(词典中有洛阳市,市廛,河华,华林) 实...
是的,牵涉很多。 另外一个想法是在xunsearch中支持python或 lua等script,感觉适应特殊要求的改动会少点(超字段数方案由脚本方案处理,觉得处理好255这个特殊vno,就可以突破。)。还有就是对xapian的扩展有了可能。在贵公司提供商...
[quote='hightman' pid='3651' dateline='1280386137'] 关于has_word, 不是很明白你的意思, has_word 用于检测当前文本中是否包含这些属性的词。 scws_get_words 是按词性返回分词结果,标点的词应该默认应该是 un 或 # 之类可以自行排除。 [/quote] ...
[quote='seanliu' pid='1661' dateline='1355902543'] 正在为一个案例纠结: 有两张表: 搭配表: //collocation col_id //搭配ID col_title //搭配标题 col_text //搭配说明 商品表: //items item_id //商品ID item_title //商品标题 item_text //商品说明 i...
CWS_cli.php - 命令行分词, 读取标准输入 CWS_query.class.php - PHP 访问 cscwsd 的类库 CWS_file.php - 针对文件分词 CWS_test.web.php - 网页测试 [code] cscwsd-0.0.x (PHP版查询交互程序示例...