4月5日,我校计科学院陈兴元教师课题组论文“Bag-of-Embeddings for Text Classification”被人工智能领域顶级学术会议IJCAI(International Joint Conference on Artificial Intelligence)录用。
该论文首次提出“一个单词在不同的文档类别学到不同的词向量/嵌入”:通常情况下,一个词只用一个词向量。作者针对文本分类这一人工智能领域中的经典领域,利用一个词在不同类别的文档出现时,其上下文往往有明显的不同的统计特性,有效的改进了文本分类的性能。
文本分类在日常生活中有着极其广泛的应用,如搜索引擎、垃圾邮件过滤等。该文提出的模型在文本分类两个经典的数据集“Reuter-21578”和“twenty NewsGroups”上,系统性能均超过了目前世界上最好的方法。IJCAI的审稿人评价:“... we believe this paper, which built a text classifier based on bag-of-embeddings probabilities, has its unique strengths and could be a good addition to the IJCAI 2016 program...”
IJCAI是人工智能领域顶级国际会议,每年吸引各国数千名学者聚到一起探讨人工智能的发展前沿。今年是第25届会议,将于2016年7月在美国纽约召开。该会议被中国计算机学会(CCF)列为A类(最高级别),根据CCF分类标准定义:“A类会议指国际上极少数的顶级学术会议,鼓励我国学者去突破”。本次是计科学院历史上第二次有论文被中国计算机学会评定的A类会议录用。
该论文的第一作者是计科学院的金澎老师,通讯作者是陈兴元老师。其他两位合作者分别是新加坡技术设计大学(SUTD)的张岳老师和微软亚洲工程院的夏云庆老师。此项工作得到了国家自然科学基金委的资助。
金澎和陈兴元同时也是我校“互联网自然语言智能处理四川省高校重点实验室”的研究人员。这篇顶级国际会议论文的录用说明计科学院和重点实验室在人工智能领域的工作获得了国际同行的认可和赞赏。