书目检索

简单检索 多字段检索 组合检索 书目详细信息

用户登录

书目信息 机读格式(MARC)

《大规模现代汉语分词语料库构建及应用》

大规模现代汉语分词语料库构建及应用

ISBN/价格:978-7-305-27148-9:CNY95.00
作品语种:chi
出版国别:CN 320000
题名责任者项:大规模现代汉语分词语料库构建及应用/.黄水清, 王东波著
出版发行项:南京:,南京大学出版社:,2023.11
载体形态项:470页:;+图:;+25cm
提要文摘:本书在系统综述语料库构建情况的基础上,选取2015年1-6月、2016年1月、2017年1月、2018年1月、2022年1月共10个月的《人民日报》发表的全部文章为对象,制定分词规范,经过对原始数据的多次清洗、标注和校对,构建了新时代《人民日报》语料库。基于所构建的人民日报分词语料库,对新时代《人民日报》的字、词分布进行了多个维度的统计与分析,深入研究分词不一致问题。同时,开展了以下应用研究:结合深度学习模型,构建了具有实用价值的深度学习分词模型;结合系列机器学习模型,完成了对新时代《人民日报》语料的关键词抽取及分析;围绕所构建的新时代《人民日报》语料,利用深度学习模型,探讨摘要的自动生成问题;针对《人民日报》版面已有的类别知识,充分利用所构建的《人民日报》分词语料,构建了《人民日报》类别自动判定模型。
题名主题:人民日报 汉语 语料库 建设 研究
中图分类:G219.23
中图分类:H1
个人名称等同:黄水清 著
个人名称等同:王东波 著
记录来源:CN 百万庄 20240617
总体评分: (共0人)
我的评分:
共12人预约本书
收藏

馆藏 附件 评论 相关借阅 借阅趋势

评论共 条 ,请登录后发表评论

用户评论