分词工具类

分词工具类

多语言分词工具类,可以方便地配合数据表对分词结果进行存储。

核心函数

/*
函数 : nlp->run();

* 功能 : 将指定内容分词,并将分词结果保存至数据表

参数 : 
* @param  string $content    分词内容
* @param  string $tableName  保存分词结果的数据表名称
* @param  string $mainId     关联数据表主键,如 : 对某篇文章分词则应为此文章主键值
* @param  string $kwds       自定义关键字,多个使用逗号隔开
* @param  string $isClear    保存时是否清空相关历史记录

* 返回值 : 
* @return array              数组形式的分词结果
*/

关联数据表结构

分词类可以根据参数自动将分词数据保存至指定的数据表,表结构如下 :

CREATE TABLE `grace_数据表名` (
  `tag_id` int(11) NOT NULL AUTO_INCREMENT,
  `tag_word` varchar(50) COLLATE utf8mb4_unicode_ci DEFAULT NULL,
  `tag_mid` int(11) DEFAULT NULL,
  `tag_score` int(8) DEFAULT NULL,
  PRIMARY KEY (`tag_id`),
  KEY `tag_word` (`tag_word`),
  KEY `tag_mid` (`tag_mid`),
  KEY `tag_score` (`tag_score`)
) ENGINE=InnoDB AUTO_INCREMENT=1 DEFAULT CHARSET=utf8mb4 COLLATE=utf8mb4_unicode_ci;

演示代码

<?php
class indexController extends grace{
    public function index(){
        $nlp     = new phpGrace\tools\nlp();
        $content = 'phpGrace 遵循 Apache2 开源许可协议发布,您可以免费使用 phpgrace,更允许您把基于 phpGrace 框架开发的应用开源或商业产品发布/销售。';
        $kwds    = $nlp->run($content);
        p($kwds);
    }
}