搜索

大约有 104 项符合查询结果, 库内数据总量为 3,513 项。 (搜索耗时:0.0062秒)

21.RE: 如何获取到分词对应的id

发布时间:2011-02-14 12:02 t By michael

...会变化的吧。 我的意思是,在做全文搜索时,根据用户输入,拆分到词组, 拿这些词组在全文里搜索,这个时候,如果有词组对应的唯一ID,那么就可以通过id关联来查询,而不用like了。 如,一篇文章标题为:我是中国人,假...

22.[bug] 修正 util.Quest 在指定为非 UTF-8 编码时引起中文乱码的问题

发布时间:2011-11-16 18:11 t By hightman

...谢 七夜 兄的测试和指出,现在已经作了修正。原因是对输入的编码做了二次校正。 改法参见 GIT 仓库,因为输入的数据已经统一转成 UTF-8 了,所以搜索服务端应统一使用 UTF-8 即可。 [url]https://github.com/hightman/xunsearch/commit/b0...

23.搜索建议和纠错

...不动 出现同音”通假字“,绝大多数现代人也使用拼音输入法,加上方言口音,乱用同音字现象非常普遍。 所以系统在综合分析索引库内的词汇、用户搜索日志基础上建立了一个庞大的纠错体系,支持英文拼写 纠错、中文同...

24.关于 misc/ 目录下的文件

发布时间:2007-06-06 10:06 t By hightman

CWS_cli.php - 命令行分词, 读取标准输入 CWS_query.class.php - PHP 访问 cscwsd 的类库 CWS_file.php - 针对文件分词 CWS_test.web.php - 网页测试 [code] cscwsd-0.0.x (PHP版查询交互程序示例...

25.C版简易中文分词-cscwsd-0.0.3 发布

发布时间:2007-06-06 10:06 t By hightman

...口(缺省是 4700)监听处理分词服务,无其它功能。针对输入的文字进行分词后然后原样输出,注意每次输入均以 "\n" 作为处理标记,即一行处理一次并返回。这样作的目的在于提高分词的效率和通用性,由专门的一支程序来处...

26.【已解决】【感谢hightman帅哥的耐心解答,我是个人站长,要是我做起来了一定赞助您撒,

更新时间:2010-07-15 01:07 t By sulwan

...ls/222.php 官方网址:http://www.ftphp.com/scws/demo/v48.php 同时输入下边的词,大家看看: 石家庄河北师大播音主持培训中心高考暑假班招生啦 选项选择这些: 二元 清除标点 只看统计打钩 并写 2 官方结果明显正确,为啥我...

27.XSUtil

...来的方法 名称描述定义于 convertIn() 把用户输入的字符串转换为 UTF-8 编码 XSUtil convertOut() 把 UTF-8 字符串转换为用户编码 XSUtil copyDir() 拷贝一个目录及其子目录文件 XSUtil fixWidth() 修正字符串至固定...

28.-这个符号是否有额外的含义?

发布时间:2012-06-17 17:06 t By jackie.li

我某个字段a的值为: 12-99-3 我直接搜索12-99-3无结果 但是输入12,这条记录就能包含进来。是否“-”这个符号是特殊字符?

29.分词错误结果报告

发布时间:2009-08-19 11:08 t By shk3

输入: 你说的确实在理。 细胞核内存在染色质。 输出: 你 说 的确 实 在理 。 细胞核 内存 在 染色 质 。

30.RE: 分词错误结果报告

发布时间:2009-08-19 15:08 t By phpfeng

输入: 洗衣及干衣设备 本应为: 洗衣 及 干衣 设备 结果: 洗衣 及 干 衣 设备

  • 时间不限
  • 按相关性排序