搜索

大约有 200 项符合查询结果, 库内数据总量为 3,513 项。 (搜索耗时:0.2947秒)

71.RE: 1.1.2的 自定义字典无法使用

更新时间:2010-05-24 22:05 t By 逆雪寒

...sr/local/scws/etc => /usr/local/scws/etc [/php] 这是我代码: //分词 $so = scws_new(); $so->set_charset('utf8'); $rd = $so->set_dict('/usr/local/scws/etc/dict.utf8.xdb'); $rr = $so->set_rule('/usr/local/scws/etc/rules.utf8.ini'); //打印返回值 var_dump($rd); var_dump($rr); ...

72.scws-1.0.0 正式发布 (含php扩展及2文本词典)

更新时间:2010-01-29 13:01 t By hightman

...选] SCWS 是 Simple Chinese Words Segmentation 的缩写(简易中文分词系统)。 它是一套基于词频词典的机械中文分词引擎,它能将一整段的汉字基本正确的 切分成词,因为词是汉语的基本语素单位,而书写的时候不像英语会在词之间 ...

73.拼音搜索时遇到的问题

更新时间:2012-12-26 12:12 t By HiLinz

...”、“强者风范”等影片。我采用的方法是把影片名通过分词后再取其各关键词的首字母,如影片“强者风范” 分词后获取首字母得到拼音字段为“qz,ff”,查询时,根据 pinyin:ff 可查找到 “强者风范” 。 我遇到的问题是: 1...

74.RE: 在做一个PHP的项目。 部分功能用到scws。 大家多多交流

发布时间:2010-05-12 16:05 t By xiaolan

...么问题或建议都可以记录在这。 对于检索部分,光有分词还是远远不够的,而且现在的全文检索已经不仅仅只是匹配、返回这么简单了,用户体验要求也高起来了。 布尔搜索、关键词联想、拼写纠错、拼音搜索、同义词、...

75.中文分组粗分方法

发布时间:2010-05-26 12:05 t By baobao

你好Hightman: 我是一名大学生,对中文分词很感兴趣。 在网上看了很多关于中文分词的课件和论文。 词的粗分有几种: 最大匹配法 最大概率法 最短路径法 未登录词识别方法 等等 我下PSCWS4,学习了好久算法,由于个人...

76.问个弱智的问题,不知道会不会收到回复?

发布时间:2011-09-19 13:09 t By strongfinger

用了网上的演示,这个分词系统挺好用的.但是本人是PHP新手,使用win7平台,hightman大侠提供的好像是一个中文分词引擎,不知道怎么直接在我的php空间上激活。请问我自己要怎么实现演示页面的显示效果呢?

77.RE: 中文分组粗分方法

发布时间:2010-05-26 19:05 t By baobao

...立断 14.01 8.10 i WORD ATTR我都能理解。 上贴说的逐字分词后 计算权重的时候使用IDF,貌似就是类似基于字典的最大概率方式来定义权重,或者说是对于歧义的取舍。 TF IDF 具体是指什么? 使用的概率计算公式能阐述下么? ...

78.关于自建字典问题

发布时间:2013-09-02 00:09 t By gwgwgw

先谢谢highman提供了这么方便的分词工具! 使用中发现,在字典的建立过程中,及php make_xdb_file.php 报了一大堆警告: Notice: Undefined index: tf in C:\xampp\php\xdb\make_xdb_file.php on line 93 Notice: Undefined index: idf in C:\xampp\php\xdb\make_xdb_file.p...

79.从windows迁移到linux发生的问题

发布时间:2013-12-07 14:12 t By favii

...时发现以下怪现象: 本人使用15000个左右的学校名称做分词测试,约1400条记录返回空白,其它则貌似正常,不知何故。 比如:北京大学、中国人民大学返回空白,而清华大学、北京航空航天大学则正常。 以下是php代码:

80.INI 配置文件工具

...。 访问网址: > note: 在线编辑器暂时不支持指定自定义分词器和分词器参数,这个部分需要用户自行手动修改。 $Id$

  • 时间不限
  • 按相关性排序