搜索

大约有 546 项符合查询结果, 库内数据总量为 3,513 项。 (搜索耗时:0.0070秒)

331.XSTokenizerScws::getResult

... 方法 public array getResult(string $text) $text string 待分词的文本 {return} array 返回词汇数组, 每个词汇是包含 [off:词在文本中的位置,attr:词性,word:词] 源码: sdk/php/lib/XSTokenizer.class.php#L339 (显示) public function getResult($text...

332.字典中的条目的意义与来源

发布时间:2009-08-25 22:08 t By peng860215

从CSDN上下载了 CSWS中文分词词典,里面的条目为: 频道 14.89 3.91 n 音乐 14.89 3.91 n 软件 14.89 3.91 n 资讯 14.89 3.91 n 。。。。。 新浪 14.89 6.26 nz 文学 14.89 3.91 n 二列为词频,三列为词重,可是词频与词重是怎么计算的,单位...

333.php(utf8编码)PSCWS v4.0 是目前最新的版本吗?

发布时间:2013-05-22 21:05 t By zouhc

... 求推荐和指点,谢谢了! [color=#006400]PHP版简易中文分词第四版(PSCWS v4.0) - 分词核心类库代码[/color]

334.php(utf8编码)PSCWS v4.0 是目前最新的版本吗?

发布时间:2013-05-22 21:05 t By zouhc

... 求推荐和指点,谢谢了! [color=#006400]PHP版简易中文分词第四版(PSCWS v4.0) - 分词核心类库代码[/color]

335.RE: daemon server(linux后台程序)和embed(库的形式嵌入程序中)

更新时间:2010-12-10 15:12 t By lauxinz

...只是会占用比较多的内存资源,如果需要经常频繁的进行分词操作就应该采用mem方式,比如搜索引擎的建索引时主要耗费的时间都花费在分词上,反正现在内存也便宜,而且词典不算太大。如果程序偶尔才需要分一下词,那就没...

336.图片搜索的一些疑问

更新时间:2014-02-16 17:02 t By Mr.

...相等的数据,然后根据hash_196字段按匹配度排序 我对xlen分词器不是很了解 这个排序mysql可以实现 但是mysql分割后的位置不是固定的 project.name = hash project.default_charset = UTF-8 server.index = /dev/shm/xs-indexd.sock server.search = /dev/shm/xs-se...

337.RE: 实时加载字典,服务器严重吃不消,有没有办法?

发布时间:2009-08-03 23:08 t By askie

...ine='1247673062'] [quote='askie' pid='3233' dateline='1247660523'] 如果分词次数太多,很容易引起服务器假死,linux服务器! 请问老大有没有加载到内容进行调用的方法? [/quote] 当然有啊,你看一下说明吧. 我不清楚你用的是什么方式,是PH...

338.RE: SCWS切分的字符串是否有长度限制?

更新时间:2010-08-19 10:08 t By wrongway

...个比方,我要切分一段有200个汉字的字符串,但是返回的分词数组只包含了前100个汉字的词。[hr] 我还是把代码贴出来吧。 从返回的分词数组可以看出来,语句的后半句“从下油到火候,从调料到配菜,她都另有一功,炒...

339.关于addWeight()使用的一些注意(分享&讨论)

更新时间:2011-12-13 13:12 t By KnightE

...用,估计是配置差别导致。经过反复对比,确定和字段的分词策略设置有关。 起初对于分类id这个字段,我认为设置成type=numeric index=full就行,从实验看,需要设置成index=self(默认采用scws分词),这样就达到了目的。 不过还...

340.RE: daemon server(linux后台程序)和embed(库的形式嵌入程序中)

发布时间:2010-12-10 15:12 t By hightman

...只是会占用比较多的内存资源,如果需要经常频繁的进行分词操作就应该采用mem方式,比如搜索引擎的建索引时主要耗费的时间都花费在分词上,反正现在内存也便宜,而且词典不算太大。如果程序偶尔才需要分一下词,那就没...

  • 时间不限
  • 按相关性排序