可以的。但是实现代码要你自己去写。例如你可以用CURL去抓取网页并分析网页中的链接,再去抓取,存到你的搜索项目中即可搜索。代码可参照sphider,数据存储的字段也可以参照sphider。 xunsearch只是提供了一个快速搜索的解决...
...uote='hightman' pid='3781' dateline='1365406402'] 搜索框整合,甚至可以字段合并啊。想办法区分类型 [/quote] 看不太明白,我知道基本用于搜索的就是标题和内容,可否提示一下其他特殊的字段怎么办?可以说的再详细一点点吗?:blush: ...
HI 在一个项目中使用到了scws PHP的扩展,感觉scws在分词效率和准确率,以及在返回结果的可用性上,显著高于其它的扩展,想问一下,scws是否可以提供Python的扩展?
通常英文是不需要分词的,但很多时候词性是需要的,比如nike,dior这类品牌英文。 目前默认词性都是en,有什么办法可否自定义词典来改变他的词性。 还有个问题,就是纯数字的词性为什么是en呢,不是m? 望赐教。
像蜘蛛爬虫那样去检索指定的网站,把数据存入数据库,然后搜索 [hr] 像 sphider 开源的那个,只不过他没有中文分词