防止爬虫被墙的方法总结 Posted on 2014-10-01 | In Crawler 爬虫的目的就是大规模地、长时间地获取数据,大规模集中对服务器访问,时间一长就有可能被拒绝。大规模集中访问对服务器的影响较大,爬虫可以短时间增大服务器负载。 Read more »
User-Based CF和Item-Based CF协同过滤推荐 Posted on 2014-09-25 | In Algorithm User-Based CF和Item-Based CF是协同过滤中最为古老的两种算法,早在20多年前就有学者提出来,这两个算法是推荐系统的根本,因为无论是用矩阵,还是用概率模型,都非常依赖于前面两种假设。 Read more »