...用自定义分词的方法,好像没有效果。 我修改了dict_user.txt,其内容为: 塔里木 12.07 20.38 ns 然后重建索引,重启服务,但搜索结果依旧。 好像没有起作用。 可以到 http://www.heihedata.org/search/ 搜索试验[hr] 可以先搜索塔里木,然...
[quote='hightman' pid='7092' dateline='1319384262'] 如果你还需要原来的词典,请在 add_dict 前加 set_dict(ini_get('scws.default.fpath').'/dict.utf8.xdb'); [/quote] 是的。这没问题了。是那txt编码问题。不是utf8的话就不行的。 scws我是用utf8。
...un 甚至/d 不/d 抵/v 库存/n 调整/vn 费用/n ”。我在dict_extra.txt中添加了“财年 11.82 12.38 n”,但结果还是和第一次一样。请问我如何能将“财年”这个词添加进去?还有就是最好能将“上一/nz”这个词删掉。谢谢
最近在做个项目,用到了分词,找了一下,发现这个,很好. 遇到一个问题, 命令导出xdb到txt,只导出了这个 # WORD TF IDF ATTR 请问这是咋回事
...,支持顶下,怎么解决呢? Warning: file_get_contents(sample.utf8.txt) [function.file-get-contents]: failed to open stream: No such file or directory in E:\AppServ\www\ceshi\index.p ... [/quote] 这个只是文件不存在而已,晕...应该看懂提示才对呀 这个文件...
赞,不过非常奇怪的是你的TXT文件不是本地文件系统吗,改动后时间戳应该会同步更新的
xunsearch不连接数据库的。 你可以把数据从"txt文件,pdf文件,oracle,mysql“等各类文件中,添加到xunsearch库中。
你要用自定义词库 编写一个 dict_extra.txt 里面写上每个词,一个一行 然后调用 add_dict 加入词典
...顶下,怎么解决呢? [b]Warning[/b]: file_get_contents(sample.utf8.txt) [[url=http://www.ceshi.org/function.file-get-contents][color=#0000ff]function.file-get-contents[/color][/url]]: failed to open stream: No such file or directory in [b]E:\AppServ\www\ceshi\index.php[/b] on line [b]23[/b] ...
..., $v['idf'], $flag, $v['attr']); 为什么会出现这样的提示? 我txt是这样写的 论坛 13.30 9.61 n 词语越长这种提示越多!