1. 数据提取
相比爬虫程序、网页数据采集器,还是手工复制、粘贴、函数提取数据这种本办法更适合现在的我。
昨晚为了尝试用工具抓取这些数据,都通宵到早上6点了。(对身体来说是一种罪过!)
2. 将提取好的数据进行结构化处理、净化、抽样测试后,导入到Spotfire,进行数据查询和分析。500多篇博文的发表情况(时间段分析)尽收眼底。
有空再发一篇阅读量的分析。