一种中文分词增量学习方法 - 佰腾专利检索

摘要:

一种中文分词增量学习方法,涉及中文分词领域。本发明为了解决现有的在源领域切分数据的基础上加入目标领域数据混合训练数据的方法存在的每次数据混合都需要重新训练模型和数据处理量非常大时导致的运算时间长、对硬件要求高的问题。本发明首先对中文语句集合中的语句xn进行人工标注标记,将已进行人工标记的语句(xn,yn)记为训练集;对中文语句集合中特征的权重向量W进行初始化,针对中文语句集合中的N个语句,计算每个语句权重向量Wn;然后进行T次迭代操作,然后计算权重向量平均值当中文语句集合中引入增量中文语句集合时,计算出增量中文语句集合的权重向量平均值求得中文分词增量权重参数完成中文分词增量的学习。本发明适用中文分词领域。 - 佰腾专利检索

使用键盘键 进行切换
凯德盟-专注涉外知识产权服务12年
个性化你的检索平台
有奖
问答
联系
我们
专利探索者
群号:580132322
立即加入

媛媛

1402342359

立即咨询

小倩

3326349102

立即咨询

  • 电话咨询:

    • 0519-88238872
    • 0519-88238871
  • 工作时间:

    • 周一~周五
    • 8:30~17:00
    • (其他时间联系客服QQ)
意见
反馈
用户
手册
返回
顶部