研究生学术讲座报告_研究生学术讲座
研究生学术讲座报告由刀豆文库小编整理,希望给你工作、学习、生活带来方便,猜你可能喜欢“研究生学术讲座”。
The Sentiment Analysis of Blog
报告人: Dr.Xiuzhen Zhang, PhD supervisor
RMIT University, Australia
时间: 周四 14:00-15:00
地点:
博客博文(Blog document)一般由个人用户撰写,多数博文表达着个人对经济、政治等社会事件的观点态度和情感倾向。因此博客为网络舆论提供了得天独厚的条件,蕴含丰富的舆情信息。对博客进行情感分析,有助于把握大众舆论的态度,对商业智能、信息预测、舆情分析均具有重要研究价值.虽然之前也有一些相关工作,但目前公认的情感分析比较系统的研究工作开始于(Pang et al., 2002)基于监督学习(supervised learning)方法对电影评论文本进行情感倾向性分类和(Turney,2002)基于无监督学习(unsupervised learning)对文本情感情感倾向性分类的研究。Pang et al., 2002)基于文本的N元语法(ngram)和词类(POS)等特征分别使用朴素贝叶斯(Naive Bayes),最大熵(Maximum Entropy)和支持向量机(Support Vector Machine,SVM)将文本情感倾向性分为正向和负向两类,将文本的情感进行二元划分的做法也一直沿用至今。同时他们在实验中使用电影评论数据集目前已成为广泛使用的情感分析的测试集。(Turney ,2002)基于点互信息(Pointwise Mutual Information,PMI)计算文本中抽取的关键词和种子词(excellent,poor)的相似度来对文本的情感倾向性进行判别(SO-PMI算法)。在此之后的大部分都是基于(Pang et al., 2002)的研究。而相对来说,(Turney et al.,2002)提出的无监督学习的方法虽然在实现上更加简单,但是由于单词之间的情感相似度难以准确的计算和种子词的难以确定,继续在无监督学习方向的研究并不是很多的,但是利用SO-PMI算法计算文本情感倾向性的思想却被很多研究者所继承了。