进行数据分析除了需要良好的数学统计基础、对数据的敏感性外,有一位熟练使用的软件是非常重要的,常用的数据分析软件有python、excel、spss、power bi、matlab、r语言、sql等。
进行除了需要良好的数学统计基础、对数据的敏感性外,有一位熟练使用的软件是非常重要的,那常用的有什么呢?例如:python、excel、spss、power bi、matlab、r 语言、sql 等等。
1.python
这是免费开源的软件,适合于数据分析,机器学习,深度学习。python 还能网站开发,爬虫等等,python 除了不能生孩子,其它都能干。我们暂且理解为:python 是万能的。 python 的开发 ide 有很多,像 sublime text,pycharm,vscode,ipython 等等,开发工具实在是太多了,都让人产生选择恐惧症了,其实都一样,本人推荐 pycharm,毕竟 jetbrains 全家桶里面的工具都灰常好用。
2.excel
这个很不起眼的又是最常用的数据分析工具,算是使用范围最广的数据分析工具了。这个工具通常会被那些会写几行 low bi 代码的“伪程序员所鄙视”。实际上,只要会用鼠标,哪怕你只是个初中生,也能进行简单的对列求和,平均数,这些生活中很常见的数据分析指标了。excel 可以常规的数据图标、可视化功能,处理 150 万条以内数据没问题。
3.spss
spss 的分析结果清晰、直观、易学易用,而且可以直接读取 excel 及 dbf 数据文件,现已推广到多种各种操作系统的计算机上,它和 sas、bmdp 并称为国际上最有影响的三大统计软件。在国际学术界有条不成文的规定,即在国际学术交流中,凡是用 spss 软件完成的计算和,可以不必说明算法,由此可见其影响之大和信誉之高。spss for windows 的分析结果清晰、直观、易学易用,而且可以直接读取 excel 及 dbf 数据文件,现已推广到多种各种操作系统的计算机上,它和 sas、bmdp 并称为国际上最有影响的三大统计软件。在国际学术界有条不成文的规定,即在国际学术交流中,凡是用 spss 软件完成的计算和统计分析,可以不必说明算法,由此可见其影响之大和信誉之高。 spss 做类似于因子分析,回归分析等等的统计分析不错,很方便,鼠标点击,就能得到详细报表。
4.power bi
bi(商业智能)和图表的区别在于 bi 擅长交互和报表,更擅长解释已经发生和正在发生的数据。将要发生的数据是数据挖掘的方向。 bi 的好处在于很大程度解放数据分析师的工作,推动全部门的数据意识,另外降低其他部门的数据需求(万恶的导数据)。 bi 市面上的产品很多,基本都是建立仪表盘 dashboard,通过维度的联动和钻取,获得可视化的分析。最后需要学习可视化和信息图的制作。
5.matlab
matlab 这个工具学习工科,数学专业的同学肯定再熟悉不过了。参加大学生数学建模竞赛的话,很多人就是使用的这个工具。 matlab(矩阵实验室)是 matrix laboratory 的缩写,是一款由美国 the mathworks 公司出品的商业数学软件。matlab 是一种用于算法开发、数据可视化、数据分析以及数值计算的高级技术计算语言和交互式环境。除了矩阵运算、绘制函数/数据图像等常用功能外,matlab 还可以用来创建用户界面及与调用其它语言(包括 c、c 、java、python 和 fortran)编写的程序。 尽管 matlab 主要用于数值运算,但利用为数众多的附加工具箱(toolbox)它也适合不同领域的应用,例如控制系统设计与分析、图像处理、信号处理与通讯、金融建模和分析等。另外还有一个配套软件包 simulink,提供一个可视化开发环境,常用于系统模拟、动态/嵌入式系统开发等方面。
6.r 语言
r 是用于统计分析、绘图的语言和操作环境。r 是属于 gnu 系统的一个自由、免费、源代码开放的软件,它是一个用于统计计算和统计制图的优秀工具。r 是用于统计分析、绘图的语言和操作环境。r 是属于 gnu 系统的一个自由、免费、源代码开放的软件,它是一个用于统计计算和统计制图的优秀工具。r 语言开发 ide 通常使用的是 rstudio,社区版免费,通常够用了。
7.sql
这里的 sql 不是单指 mysql 或者 oracle,亦或者 hive 等,而是指标准 sql 查询语言。数据库可以存储大量的数据,通过 sql 可以进行复杂的数据关联查询,比如几张表之间的关联信息。写好 sql,也能高效的挖掘出数据之间的关系,做出最有商业价值的数据分析报表。
数据分析是为了开发软件和数据的均衡。数据分析要大量地使用数据集、数据分析手段,建立的数据存储的特殊技术,如利用深度分析法,以数据库为基础,建立基于工具目录的硬件的数据分析系统,并对数据存储在软件或硬件中,以便在整个软件的开发、建造过程中有效地运用。数据分析建立的特殊技术包括对过程分析、利用模拟,利用变量结构分析等等。数据分析也可能是从某些逻辑分析开始的。