在路上

 找回密码
 立即注册
在路上 站点首页 学习 查看内容

短文本分类工具:TextGrocery

2016-12-20 13:13| 发布者: zhangjf| 查看: 535| 评论: 0

摘要: TextGrocery 是一个基于 LibShortText 的短文本分类工具,让文本分类变得简单。 示例代码:import jieba from tgrocery import Grocery # 必须提供中文分词器,才能为中文语料正确分类grocery = Grocery('test', t ...

TextGrocery 是一个基于 LibShortText 的短文本分类工具,让文本分类变得简单。

示例代码:

  1. import jieba
  2. from tgrocery import Grocery
  3. # 必须提供中文分词器,才能为中文语料正确分类
  4. grocery = Grocery('test', tokenizer=jieba.cut)
  5. grocery.train('train_ch.txt')
  6. print grocery.predict('考生必读:新托福写作考试评分标准')
  7. grocery.test('test_ch.txt')
  8. print grocery.get_load_status()
复制代码

项目主页:http://www.open-open.com/lib/view/home/1420467869922

最新评论

小黑屋|在路上 ( 蜀ICP备15035742号-1 

;

GMT+8, 2025-7-8 02:14

Copyright 2015-2025 djqfx

返回顶部