搜索

大约有 28 项符合查询结果, 库内数据总量为 3,513 项。 (搜索耗时:0.0993秒)

11.「清除标点符号断词」错误回报

发布时间:2010-05-16 21:05 t By pudding

...,发现连非标点符号的字都被省略掉了。 在线演示的网页中也有一样的情况: http://www.ftphp.com/scws/demo/v48.cht.php 输入「館藏選擇與淘汰的原則」 并勾选「清除标点符号」 断词结果是「館藏 與 的 原則」 显然地「與」之前...

12.求助:SCWS(简易中文分词) 基于HTTP/POST的分词 API 使用说明

发布时间:2013-06-30 18:06 t By laiqn

...但是不知道怎么调用,我用这个方式调用API,结果显示在网页上,我要如何调用才能将结果获取下来呢?比如我能将结果直接存在一个变量中,寻求指点,谢谢!

13.RE: [简体中文(UTF-8) (3.9MB, 28万词, 2010/12/30更新)] 压缩包解压出来是空的

发布时间:2011-11-15 13:11 t By hightman

大概是下载不全,你用WGET或专门的下载工具下载吧,网页可能超时了就不全。

14.scws分词乱码问题,求解

发布时间:2012-07-17 16:07 t By wainilxx7

...好像是编码格式的问题,代码用的是gbk,我没改,看了下网页显示编码也是用的gbk。 然后我用记事本打开XDB 格式的词典文件dict.xdb,效果如下: XDB"/B ? ?? 悯H@   % G ! ? ! p # Z  #  ! ? # ? ) ? ! ? !  ! ? % ? ! ? ! ;* # P- # ...

15.为什么只打印出里面的数字,中文直接不分词

发布时间:2013-04-12 23:04 t By xiaodai

...词,为什么只打印出里面的数字,中文直接不分词打印,网页编码是utf8 function get_tags_arr($title){ require 'pscws4/pscws4.class.php'; $pscws = new PSCWS4(); $pscws->set_dict('scws/dict.utf8.xdb'); $pscws->set_rule('scws/rules.utf8.ini'); $pscws->set_ignore(true); ...

16.求救PSCWS4问题

发布时间:2010-07-21 10:07 t By FG2008

...ord['attr'].''; } flush(); } $pscws->close(); ?>[/php] 网页上的显示结果却是: 航天=>nr ?员庽>nr ?员=>nr

17.关于 misc/ 目录下的文件

发布时间:2007-06-06 10:06 t By hightman

... - 针对文件分词 CWS_test.web.php - 网页测试 [code] cscwsd-0.0.x (PHP版查询交互程序示例版) 由于服务器互无法显性判断数据读取的始终, 故目前 socket 设为无阻塞模式 尝试读取一定次数后仍没数据就...

18.xunsearch-1.0.0 正式版

更新时间:2011-09-30 14:09 t By hightman

...an 和 scws 中文分词。单库最多支持 40 亿条数据,在 500 万网页大约 1.5TB 的数据中检索时间不超过 1 秒(非缓存)。 [b]简单易用:[/b]前端是使用脚本语言编写的开发工具 (SDK),目前仅支持 PHP 语言。API 简单清晰,开发难度极低,...

19.www.adminlink.net.cn上的xunsearch案例

更新时间:2011-12-08 12:12 t By adminlink

...提取出更多的页面,让搜索引擎蜘蛛没完没了的爬,达到网页聚合的目的。这样做我估计对优化很有帮助。 选择scws的原因是比较了几个中文分词后,感觉scws是一个不错的分词系统。 xunsearch速度也比较快。安装的过程中也遇到...

20.xunsearch-1.0.0 正式版 (基于xapian/scws/php的开源中文全文搜索引擎)

发布时间:2011-09-23 13:09 t By hightman

...an 和 scws 中文分词。单库最多支持 40 亿条数据,在 500 万网页大约 1.5TB 的数据中检索时间不超过 1 秒(非缓存)。 [b]简单易用:[/b]前端是使用脚本语言编写的开发工具 (SDK),目前仅支持 PHP 语言。API 简单清晰,开发难度极低,...

123
  • 时间不限
  • 按相关性排序