数据分析基础-python软件安装以及基础语法
一.计算机组成
计算机组成:硬件系统和软件系统。
- 硬件系统包括:中央处理器,存储器,输出设备,输入设备
- 软件系统包括系统软件和应用软件。
- 存储器包括内存储器(存储cpu处理数据),外存储器(硬盘和U盘)。
- Python介绍
- 编程语言
- Python语言优点: (1)简单易学;
(2)免费,开源;
(3) 应用范围较广,主要用于web开发,爬虫,数据分析,数据挖掘,机器学习;
3.解释器的作用
1.python解释器的作用:运行文件;
2.Python解释器种类:(1) Cpython,C语言开发解释器【官方】,应用广泛;
(2) Ipython,基于Cpython的一种交互解释器;
(3) 其他解释器:
PyPy,基于python语言开发的解释器;
- 数据分析一般流程:
明确目标---->确定方案---->数据整理---->实施建模---->结果验证---->总结展现;
- Python解释器下载:
1.(1)下载网址:http:www.python.org;
(2)查找目标文件:window x86-64 executable installer--单击下载安装;
2.PyCharm
(1)PyCharm是一种Python IDE(集成开发环境),带有一整套可以帮助用户在使用Python语言开发时提高其效率的工具;
(2).内部集成功能:Project管理,智能提示,语法高亮,调试代码,解释代码(解释器),框架和库;
(3).PyCharm下载地址:http:www.jetbrains.com/pycharm/download/#section=windows
3.查看python是否安装:(1)win+R;(2)输入cmd并按enter键;(3)输入python,出现版本信息说明安装成功;(4)提示符“>>>”表示python已经在交互式环境中,可以输入python代码按【enter】键后立刻就能得到结果;
4.将来文件如果要上传到服务器文件,那么文件名切记不能用中文;
5.安装完成结果显示 以及运行代码例子:
6.运行文件:文件打开状态---空白位置---右键---Run--即可调出pycharm控制台的输出程序结```果;
- pycharm基础设置
- .[file]---[Setting]/[Default Setting]
- 修改代码文字格式
[Editor]---[Font]
Font:修改字体; Size:修改字号; Ling Spacing:修改行间距;
- 项目管理
1.打开项目
[File]---[Open]---浏览选择目标的根目录---[OK]---选择打开方式
打开项目方式一共三种:This Window;New Window;Attach;
(1).This Window:覆盖当前项目,从而打开目标项目;
(2).New Window:在新窗口打开两次PyCharm,每次PyCharm负责一个项目;
2.关闭项目
[File]---[Close Project]
- 注释:为了增大程序的可读性;
单行注释:#注释内容;
多行注释:”””
第一行注释
第二行注释
第三行注释
“””
或者:’’’
注释1
注释2
注释3
‘’’
注:注释代码快捷键:Ctrl+/;解释器不执行注释内容;
- 当用户输入一部分单词后,选择Edit—>Expand Word命令,或者直接快捷键【ALt+/】组合键可以自动完成单词;
六:变量
- 定义变量要满足标识符的命名规则
规则(1)由数字,字母,下划线组成;
- 不能数字开头;
- 严格区分大小写;
- 不能使用内置关键字;如:if,else,class,False,None,True,assert,break,continue,def,del,elif,except,
finally,for,from,golbal,import,in,is,lambda,nonlocal,not,or,pass,raise,return,try,while,with,yield;
- 变量就是一个存储数据的时候当前数据所在的内存地址的名字而已;
- 命名习惯:
- 见名知义。
- 大驼峰:即每个单词首字母都大写,例如:MyName.
- 小驼峰:第二个(含)以后的单词首字母大写。
- 下划线:例如:my_name。
- 定义变量
语法:变量名=值;
定义变量:存储数据TOM:my_name=’TOM’
- 认识bug
所谓bug,就是程序中的错误,需要程序员排查问题,纠正错误;
- Debug工具:PyCharm IDE中集成的用来调试程序的工具,在这里程序员可以查看程序的执行细节和流程或者调节bug。
Debug工具使用步骤:(1)打断点(断点位置:目标要调试的代码块的第一行代码即可;打断点的方法:单击目标代码的行号右侧的空白位置)(2)Debug调试;
七:数据类型
- 数据类型:(1)数值类型:int(整型)通常是整数,不带小数;
float(浮点型);由整数部分和小数部分组成;
complex复数:由实数部分和虚数部分组成,a+bj或者complex(a,b);
- 布尔型bool:True(真);False(假);
- Str(字符串);list(列表);tuple(元组);set(集合);dict(字典);
积硅步以致千里,积怠惰以致深渊;
- Python语言概述
- python输入:x=input(‘please input:’)
- Python输出:print(value,......,sep=’ ’,end=’/n’,file=sys.stdout,flush=False)
注:sep参数:输出时将多个输出对象value进行分隔,默认为空;
end参数:输出结束时输出end参数,默认为换行;
File:默认值时标准输出流;flush:默认值是非;
- 转义字符:\b退格; \n换行; \r回车; \f换页; \e转义; \000 空;
- 字符串运算:+ 字符串连接;
* 重复输出字符串;
[] 通过索引获取字符串中的字符;
in 成员运算符,如果字符中包含给定的字符,则返回True;
- 字符串格式化:
- %c 格式化字符;
- %d 格式化字符串;
- %s 格式化字符串;
- %u 格式化无符号整型;
- %o 格式化八进制数;
- %x 格式化十六进制数;
- %f 格式化浮点数字,可指定小数点后面的精度;
- %e 用科学记数法格式化浮点数;
- %E 同%e;
- %g %f%e的简写;
- %G %f%E的简写;
- %p 用十六进制数格式化变量的地址;
6.Continue和break的区别:
Break:提前结束整个循环;
Continue:终止当前的循环,并且忽略continue之后的语句,然后回到循环的顶端,提前进入下一次循环;