作者:AinneJJ | 来源:互联网 | 2023-05-16 14:53
下午去实验室继续写实验报告,跟伟杰要了一个实验报告,然后大师兄叫我,我们在走廊唠了一会儿。大师兄想做OpenNE,他说这个会比较难,目前没有人做,因为还没有发现相关的文章,大家研究的都是指定了哪种
下午去实验室继续写实验报告,跟伟杰要了一个实验报告,然后大师兄叫我,我们在走廊唠了一会儿。
大 师兄想做Open NE,他说这个会比较难,目前没有人做,因为还没有发现相关的文章,大家研究的都是指定了哪种实体之后的识别,这种Open的还不是很成熟,目前的想法就 是挖掘实体结构,然后来确定实体边界。目前想让我在几个现成的实体上试试能不能挖掘出来有效的结构,或者其他有效的方法。
所以今天的任务有这些:
- 做实验
- 写报告
- YY一下OpenNE
晚 上跟家伟吃饭的时候也讨论了一下如果是他,他怎么办,因为他是分析图像的,所以就相当于给几个图片,中间标出主题的轮廓。比如给几个猫的图片和房子的图 片,标出来,然后让他识别车图片和人的图片等其他图片里的内容的轮廓。他说如果是他他会选择强化学习,然后具体怎么样他也没想法。其实和后来在跟师兄讨 论,感觉这个比喻并不恰当。在黑店吃完饭之后我们去实验室楼下一家新开的饮品店喝点咖啡,接到了大师兄的电话,商量了一下最近的情况,因为现在跟少磊坐一 起,所以周一、周二、周三、周日的下午和晚上过来合计合计,尽快拿出个方案。这周六和周日打算做一些自己的调查和分析。然后周一晚上过来跟师兄碰头。
晚 上写完报告之后,师兄给了我一些搜狗细胞词库里面的词,初步感觉上不同种类的命名实体有很大区别,有的可能用最后一个词就能识别的很好了,有的实体就能且 仅能靠词典。所以我现在觉得我们应该大概统计一下,针对单独的NE大家都有哪些办法,然后看是否能进行组合什么的,如果耦合性不是很强,那最好了,那不同 的方法就可以拆开然后重组。这样我们就对新的实体类进行测试,看哪种组合最合适,就用哪种。比 如对于甲类实体,命名实体研究者的方法可以分解为手段A、手段B、手段C,而对乙类实体,研究者的方法可以分解为手段D、手段E、手段F,然后我们把它们 都整合在一起,提纯,对于未知的实体,讲A、B、C、D、E、F这几种手段 进行组合,分别对这种实体进行测试,看哪种组合效果最好,就用哪种。
不过如果每种实体用的方法的耦合都很强的话就得换别的思路了,总的来说现在的工作就两方面:
- 看看对于不同的实体都有什么不同的方法。需要看一些论文,综述什么的,找一找感觉。
- 然后多看一些词库,看看能不能看出公共的部分,有没有安全通用的方法。