当前位置: 首页 » 资料 » 健康论文 » 结合文本聚类和文本检索的语料选取方法

结合文本聚类和文本检索的语料选取方法

放大字体  缩小字体 更新日期:2018-11-22  浏览次数:6
摘 要:为了克服用应用相关的文本数据进行语音识别、智能输入等各种自然语言处理中在有些情况下因很难收集到充足的相关数据和缺乏应用相关的训练数据带来的困难.提出了一种通过结合非监督文本聚类和文本检索技术实现相关语
  • 【题 名】结合文本聚类和文本检索的语料选取方法
  • 【作 者】何峰 丁晓青
  • 【机 构】清华大学电子工程系 北京100084
  • 【刊 名】《高技术通讯》2010年 第12期 1224-1228页 共5页
  • 【关键词】文本聚类 文本检索 Kullback.Leibler距离 统计语言模型
  • 【文 摘】为了克服用应用相关的文本数据进行语音识别、智能输入等各种自然语言处理中在有些情况下因很难收集到充足的相关数据和缺乏应用相关的训练数据带来的困难.提出了一种通过结合非监督文本聚类和文本检索技术实现相关语料选取的新方法。该方法仅使用少量与特定应用相关的文本,即可从未经整理的大规模语料库中发现更多与此应用相关的文本。利用该方法在手机短信文本和未经整理的大规模语料库上进行了实验,实验结果表明该方法能够有效提取应用相关的文本。
 
本文导航:
  • (1) 文本聚类,文本检索,Kullback.Leibler距离,统计语言模型
  • 下一篇:鳖甲
  • 上一篇:暂无
 
[ 资料搜索 ]  [ 加入收藏 ]  [ 告诉好友 ]  [ 打印本文 ]  [ 关闭窗口 ]

 

 
推荐图文
推荐资料
热门关注