既然可以通过大数据和云计算来分析微博,那么其他网络空间呢?贴吧和博客也是如此。可以将一个人在贴吧上发表的所有言论,通过大数据加以汇总,然后通过云计算来加以分析,然后从中找出“敏感词”,并根据“敏感词”的多少,来对这个发帖人进行“定性分级”。而在博客上,只要在后台大数据库中调取某位博主的所有文章,然后通过云计算加以分析,还是可以从中找出“敏感词”来对这个博主进行一个身份的判定,以及“定性分级”。
而当大数据系统调取了某位博主的所有文章之后,还可以从中分析出:这个博主的学识如何、学历高低,以及有无真正内涵,知识是否渊博,这些都可以通过大数据和云计算得出结果。因为接受过高层次教育的人,往往会掌握一些特定的词汇——高等教育中的某些词汇,是义务教育接触不到的。所以,通过大数据和云计算来分析某位作者发表的所有文章,然后将文章中的关键词,与不同教育层次中出现的词汇表相对照,就可以推测出这个作者的学历高低和有无学识。