一种中文分词增量学习方法 - 佰腾专利检索

摘要:

一种中文分词增量学习方法,涉及中文分词领域。本发明为了解决现有的在源领域切分数据的基础上加入目标领域数据混合训练数据的方法存在的每次数据混合都需要重新训练模型和数据处理量非常大时导致的运算时间长、对硬件要求高的问题。本发明首先对中文语句集合中的语句xn进行人工标注标记,将已进行人工标记的语句(xn,yn)记为训练集;对中文语句集合中特征的权重向量W进行初始化,针对中文语句集合中的N个语句,计算每个语句权重向量Wn;然后进行T次迭代操作,然后计算权重向量平均值当中文语句集合中引入增量中文语句集合时,计算出增量中文语句集合的权重向量平均值求得中文分词增量权重参数完成中文分词增量的学习。本发明适用中文分词领域。 - 佰腾专利检索

使用键盘键 进行切换
个性化你的检索平台
免广告 去掉
广告
联系
我们
专利探索者
群号:580132322
立即加入
专利探索者
媛媛 1402342359
立即咨询
专利探索者
小倩 3326349102
立即咨询
意见
反馈
用户
手册
返回
顶部