数学院综合集成与知识科学研究组 Home    |    Contact   |    中文   |   ISS   |    CAS
词向量和深度学习在文本情感分析中的应用
作者:薛云 来源 : 中科院南楼N702 时间:2017-09-18 字体<    >

摘要:随着电子商务的快速发展,网络口碑传播的作用不断凸显,而Web2.0模式的兴起更使得网络评论的情感分析技术日益受到重视。但目前的主流分类方法大多属于浅层学习模型,不能提取文本中丰富的语义特征,针对复杂分类问题其泛化能力受到制约。近年来兴起的深度学习方法能够自动学习特征的层次结构,具备强大的特征表达能力和对复杂任务的建模能力,因此将其应用于情感分析问题可以提升模型性能,并免去繁琐的特征提取步骤,摆脱对情感词典等人工资源的过多依赖。而词向量作为深度学习背景下的新兴技术,可以将每个词语映射到特殊的语义向量,在相似功能的词语拥有近似向量表达形式的假设下,为每个词语分配一个定长实数向量。词向量能有效捕捉文本的语义和句法功能,并在一定程度上通过对词向量进行简单的代数运算可以发现对应词语的语言规律,从而克服了词袋模型一些固有的不足。本报告将对词向量和相关深度学习模型的发展过程进行简单回顾,并结合情感分析问题进行讨论,希望与拥有机器学习和数学背景的朋友就这一领域的问题和方法展开交流。

 

  

关键词:情感分析;深度学习;词向量

 

 

Bio: 薛云19977月,湘潭大学计算数学与应用软件专业毕业,获得学士学位;20007月,中科院数学与系统科学研究院运筹学与控制论专业毕业,获硕士学位;2000.08-2003.04,任职于中兴通讯股份有限公司,从事管理信息系统开发;2003.10-2007.06,香港浸会大学图像处理与模式识别专业毕业,获得博士学位;2007.07至今,任教于华南师范大学物理与电信工程学院,从事教学科研工作。2009.07至今,先后担任纵横天地电子商旅服务有限公司,广州从兴电子开发有限公司,广州市河东电子有限公司等企业技术顾问,开展数据挖掘和云计算方面校企合作。现任教于华南师范大学电子工程系,并任电子信息技术研究所副所长,主要从事模式识别和信号处理等方面的科研工作,尤其是数据挖掘,机器视觉方面的理论和应用研究,在商业智能技术的应用等领域有较深的积累,目前已经发表各类学术期刊和会议论文30余篇,内容涉及数据挖掘、云计算、图像处理等多方面。现为中国人工智能学会青年工作委员会委员。博士期间主要研究数据挖掘,模式识别算法,在国际主流刊物上发表过多篇学术论文。期间作为香港浸会大学理学院的研究助理积极参与国内外学术交流活动,并多次参与数据挖掘,图像处理领域国际会议的论文审稿和会务组织工作,并参与中国国家自然科学基金,香港研究资助局(RGC)基金项目等多个课题。

  其官方个人主页的链接http://physics.scnu.edu.cn/dsw/html/dianluxitong/xueyun.aspx

相关附件
相关文档

CAS,Research Group of Meta-Synthesis and Knowledge Science
京ICP备05002806号-6  文保网安备案号 1101080081 邮箱: mcs@iss.ac.cn
电话:+86 10 82541801