最近在搞分词相关的毕业设计 是C++开发的 想用大神的SCWS 把LIBSCWS编译成DLL来供我自己的程序调用 但是在WINDOWS下编译老是过不了 给的VC++6的项目也编译不成功,希望大神能指教下怎么在windows下编译
通常全文检索是按词构建反向索引。 即以词条为线索,记录包含该词的文档ID~~ 检索的时候将用户的输入切词后在索引中查找出合适的文档ID再返回。
[quote='hightman' pid='7573' dateline='1325211638'] 不知你在说什么。英文不需要词典啊!! [/quote] 我知道英文不需要词典 关键就是这个不需要词典 他的英文分词就没办法控制了,比如我要做计算机专业的分词,其中很多就需要用到一...
...3603' dateline='1275724275'] 早期的程序有一小地方判断错误,在结束导出的时候会那样。新的代码都修正了,你从主页上下载最新的那个PHP工具试试 [/quote] 我下载了一个试下,同样出错,我截图[hr] 导出可以,导入就不成了。
... 比如你有一个字段叫 date 存的是 2011-11-07 那么你可以在索引的时候通过 $doc->addTerm('date', '2011'); $doc->addTerm('date', '201111'); 这样就可以通过 date:2011 或 date:201111 检索到这篇文章 [/quote] 谢谢老大的指点,其实我的意思是...
...后队列数还是没有改变,索引还是没有增加进去,仿佛就在缓存队列中,然后我就把xs重启,队列数据变成0条了,然后我就$index->add($doc),对列数据又增加成一条,反复的$index->add($doc)不同数据,对列数据也增加到相应多条,本...
... [name_tc] index = self cutlen = 15 weight = 3 phrase = yes 现在中文字都可以了,,就是英文字不行,比如我的数据量 name 的是 abc,babcd,abcdce 。 我希望 当收 abc 是 只搜出 abc, abcdce 这样。 我试过 把英文的配置也改成跟中文一样...
...我不是本项目的开发人员,仅仅是因为需要使用这个功能在我的网站上而基于hightman提供的代码的修改,现在返回给项目,希望更多的人能有用。 原因:我希望给网站提供分词功能,但是,我只能用php方式,也不能修改服务器...
... 比如你有一个字段叫 date 存的是 2011-11-07 那么你可以在索引的时候通过 $doc->addTerm('date', '2011'); $doc->addTerm('date', '201111'); 这样就可以通过 date:2011 或 date:201111 检索到这篇文章 [/quote] 谢谢老大的指点,其实我的意思是...
...扩展库 Windows/PHP 5.2.x 准确: 95%, 召回: 91%, 速度: 40KB/sec 在PHP里面运行后:显示 我|是|一|个|中|国|人|Array ( [0] => Array ( [word] => 我 [off] => 0 [len] => 3 [idf] => 0 [attr] => un ) [1] => Array ( [word] => 是 [off] => 3 [len] => 3 [idf] => 0 [attr] => un ) [2]...