分词工具类
分词工具类
多语言分词工具类,可以方便地配合数据表对分词结果进行存储。
核心函数
/* 函数 : nlp->run(); * 功能 : 将指定内容分词,并将分词结果保存至数据表 参数 : * @param string $content 分词内容 * @param string $tableName 保存分词结果的数据表名称 * @param string $mainId 关联数据表主键,如 : 对某篇文章分词则应为此文章主键值 * @param string $kwds 自定义关键字,多个使用逗号隔开 * @param string $isClear 保存时是否清空相关历史记录 * 返回值 : * @return array 数组形式的分词结果 */
关联数据表结构
分词类可以根据参数自动将分词数据保存至指定的数据表,表结构如下 :
CREATE TABLE `grace_数据表名` ( `tag_id` int(11) NOT NULL AUTO_INCREMENT, `tag_word` varchar(50) COLLATE utf8mb4_unicode_ci DEFAULT NULL, `tag_mid` int(11) DEFAULT NULL, `tag_score` int(8) DEFAULT NULL, PRIMARY KEY (`tag_id`), KEY `tag_word` (`tag_word`), KEY `tag_mid` (`tag_mid`), KEY `tag_score` (`tag_score`) ) ENGINE=InnoDB AUTO_INCREMENT=1 DEFAULT CHARSET=utf8mb4 COLLATE=utf8mb4_unicode_ci;
演示代码
<?php class indexController extends grace{ public function index(){ $nlp = new phpGrace\tools\nlp(); $content = 'phpGrace 遵循 Apache2 开源许可协议发布,您可以免费使用 phpgrace,更允许您把基于 phpGrace 框架开发的应用开源或商业产品发布/销售。'; $kwds = $nlp->run($content); p($kwds); } }