这是C/S程序,fread是从网络上读取数据。应该是你要看性能要看服务端的,你这个应该是文件系统没有缓存所以第一次比较慢。
...ue -> xtree */ voff = buf[16] + 17; 第590行,当_xdb_read_data文件读取失败时(如果offset超过文件大小就会失败),程序还会继续往下执行,这样下面的代码执行将会报错。
理论上讲,正确的xdb文件是不会有你说的这种异常的。但出于全面考虑,即使一切都正确也有可能受到信号中断等 其它异常的干扰。
硬件配置 Core2 四核 2.4G 6G内存 370w数据 php 5.4 + xunsearch 1.4.7 web和xun在同一台主机 第一次查询最少需要2.8秒 第二次则会下降到0.6秒 使用xhprof调试发现瓶颈位于 XSServer::read 中的 fread() 占用的时间是整个php开销的98.1% 这个是存储性...
网址和EMAIL tsearch都可以配置token的切分方法,可以整个切,也可以分开 html标签 tsearch也有一个tag token可以配置去不去徐
但网址和EMAIL如果这样切,也太粗糙了吧。要全部匹配才能检索到,输入 EMAIL 的前段或网址的一部分均检索不到了。 至于消除 HTML 标签,这不应该是分词的事哦
你好,我们最近在postgresql整合了scws,效果很棒,现在我们自己增加了一些词库,不知道xdb与txt相比,那个效率更高 另外,scws对于中英文分词效果不是很好,即文中的中文分得还可以,但对于页面中的英文部分,包括email,url,hos...