今天又在网站上重新下载了 简体utf8 xdb字典,和make_xdb 等软件,做次操作, xdb->txt 再txt->xdb 就不行了,直接报错! 麻烦版主测试一下,给一个修改字典的方法,谢谢!
这些 PHP 工具在发布时都有测试通过,但PHP版本众多,加上各自配置又不一样,所以难免还有问题。目前 PHP 的工具部分照顾不过来,请尝试自行修正一下。 计划在下一版本中直接在 gen-scws-dict 中提供C版的工具,不要再通过PHP了
但是生成的文件在dump导出的时候就会出现如下错误: C:\php>php dump_xdb_file.php dic2.xdb dic2.txt PHP Warning: XDB::Open(dic2.xdb), invalid xdb format. in C:\php\xdb.class.php o n line 180 Warning: XDB::Open(dic2.xdb), invalid xdb format. in C:\php\xdb.class.php on lin...
请版主帮忙看下,下面是什么错误,,这个dic1.txt 直接从可用的xdb文件用dump导出的,现在不做任何修改直接make_xdb 就会报如下错误: C:\php>php make_xdb_file.php hah11.xdb dic1.txt INFO: Loading text file data ... PHP Notice: Uninitialized string off...
这个工具是基于作者的工作的一点点扩展,我不是本项目的开发人员,仅仅是因为需要使用这个功能在我的网站上而基于hightman提供的代码的修改,现在返回给项目,希望更多的人能有用。 原因:我希望给网站提供分词功能,...
先谢谢highman提供了这么方便的分词工具! 使用中发现,在字典的建立过程中,及php make_xdb_file.php 报了一大堆警告: Notice: Undefined index: tf in C:\xampp\php\xdb\make_xdb_file.php on line 93 Notice: Undefined index: idf in C:\xampp\php\xdb\make_xdb_file.p...
需要增加一个新词“中国梦”。 使用的php XDB工具,增加词库后导入生成xdb文件。 重新生成coreseek的索引 索引的时候还是搜不出来这个词。 我确认使用的是utf-8 no-bom头的格式。 请问如何解决。谢谢
... @ ) 词库文件是UTF8编码的,已经分别试过使用PHP版词库工具以及scws-gen-dict来生成词库,但是结果都一样。 有什么可能的原因吗? 谢谢 [hr] 我使用的代码如下, dict.utf8.xdb是我自己的词库 //实例化分词插件核心类 $so = scw...
...长有思路吗? 谢谢! [/quote] 抱歉,目前没有这样的php工具. 建议设想能运行 gen_dict, 而 pscws4 不推荐使用, 速度太慢. 地址匹配事实上应该针对地名名词(含缩写,别名)建立词库, 然后将其分词, 提取关键字进行比较, 如果相同即...