• [论文翻译]使用半监控和子集选择的数据编程

    数据编程的范例在使用规则的形式和标记函数中使用弱监督来显示许多承诺,用于在几种文本分类方案中学习,其中标记数据不可用。另一种示出了许多承诺的方法是半监督学习,其中我们使用大型未标记的数据集增强少量标记的数据。在这项工作中,我们认为,通过不使用任何标记的数据,基于数据编程的方法可以产生次优性能,特别是在标签功能嘈杂的情况下。这项工作的第一个贡献是对联合学习框架的研究,将未经监督的义务与半监督学习结合在标签职能中。我们学习一个联合模型,有效地使用规则/标记功能以及在特征空间上的半监控损失函数。接下来,我们还研究一个子集选择方法来select可以用作标记集的示例集,使得标记的数据可以补充标签函数,从而实现两个世界的最佳效果。我们证明,通过有效地结合半监督,数据编程和子集选择范式,我们在七个公共数据集中显着优于当前最先进的。
创作中心
开启你的AI千集创作之旅
发布首篇内容,开通创作中心 快来成为AI千集创作者吧~
公告

AI千集是一个智能写作平台
在这里您可以获得本平台自训练的
LLM模型服务
和小伙伴一起玩转AI,做自己的AI机器人
来AI千集,写作快人一步
扫一扫,加入我们
公众号
有加群需求的小伙伴,请微信加qianji_ai

千集助理是连通AI学研和就业的桥梁
登陆小程序
获取文案智能写作能力
工作效率瞬间提升

千集助理