对数据分析和可视化这块一直兴趣满满,保持关注,搜集了一些不错的资料,整理分享给大家

语言层面,我主要在关注Python和JavaScript,所以资料可能多与这两门语言有关


#优秀文章(入门引导) * The Log:每个程序员都应该知道有关实时数据的统一抽象(1)概念 * 日志:每个软件工程师都应该知道的有关实时数据的统一概念 * 数据科学的完整学习路径(Python版) * Python数据分析入门 * Python和数据科学的起步指南

#公共数据源 awesome-public-datasets

其中我们可以看到香港公开的数据:data.gov.hk

#Python ###ipython notebook 我喜欢使用ipython notebook(现在改名为jupyter)来探索数据,这是个值得一学的神器,可以看看我此前写的文章:使用IPython Notebook来学习编程

使用ipython notebook来探索数据有许多好处,其中的一点是可以轻易分享经验和成果,现在有许多教程是基于它的:

###pandas * pandas-cookbook * http://nbviewer.jupyter.org/:从这里快速上手 * Zhihu_bigdata * 相关工具 * pandashells * Pandas for data analysis :ipynb * Pandas Cheat Sheet

#JavaScript

###d3 * 案例展示 * D3 入门系列 * 一些建议: * 学习d3js有没有一个系统的学习方法 * 如何评价 D3.js这个框架? * D3.js入门指南

#在线学习 * The Open Source Data Science Masters * dataquest

#博客 * data-science-blogs

#真实项目 * Data-Analysis-and-Machine-Learning-Projects

#知乎问答 * 如何快速成为数据分析师?

#资料集 * awesome-datascience

#一些好书 ###数据挖掘概念 数据挖掘导论 数据挖掘:概念与技术 ###统计学 * 深入浅出统计学 * 统计学习方法 ###Python * 利用Python进行数据分析 ###数据库 * SQL必知必会 * MySQL必知必会 ###机器学习 * 集体智慧编程 * 机器学习实战

###其他入门好书 * 计算机科学概论(第11版) * Head First HTML与CSS、XHTML