# 统计快速入门

# python 基础

# python程序运行(window)

# python程序

文件后缀名是 .py 的文件才能运行。.py 文件中是python的程序命令。

例如 run1.py 文件中的程序是下面这个程序,运行该程序将输出 hello, world 字符。

print("hello, world")

# python 解析器

用 python 程序解析器(cpython) 才能运行 .py文件。

程序解析器本质就是一个软件,用来执行.py文件。

python解析器将 .py 中的程序解析成计算机语言,送入到 cpu 中进行执行,然后最终才输出hello, world 字符。

python解析器有不同的版本:python2.7,python3.5.1,python3.6。版本越高功能越多。

python虚拟环境 anaconda :包含不同的python解析器版本。例如:要求 run1.py 在 python2.7上运行;run2.py 在 python3.6上运行。(下载安装)https://www.anaconda.com/products/distribution

anaconda 安装教程:https://blog.csdn.net/qq_45344586/article/details/124028689

注意:在安装界面,勾选 将 anaconda 添加到环境变量中 这个选项。

ide:vscode,下载安装 https://code.visualstudio.com/

anaconda 提供的工作环境 ipython,立即执行程序语句。

anaconda提供的工作环境 jupyter(了解)

在 vscode 中使用 anaconda 的 ipython: 点击终端,在终端中输入 ipython,开始编程

继续依次输入下面的程序:

a = 1
b = 2
c = a + b

# 基础语法

(从基础语法开始看) https://www.runoob.com/python3/python3-tutorial.html

基本的数据结构

  • 变量/名称 = 值
  • int
  • float
  • string
  • bool
  • list
  • dict
  • tuple
  • 矩阵:numpy
  • function 作用域
  • class 作用域
  • module 作用域
  • package 作用域
  • if
  • for
  • while

dir()

包/库 package

内置包/基础包/标准库 https://docs.python.org/zh-cn/3/library/index.html

包安装器 pip

包查找 pypi/github

vscode调试 https://docs.python.org/zh-cn/3/

# 理解

数据存在的位置:内存、磁盘

线程、进程

同步、异步

阻塞、非阻塞

一切皆是对象、一切皆是数据

环境变量:在终端cmd中输入:

where python

执行路径

# 工作方向

  • web开发
  • 嵌入式开发
  • 桌面开发
  • 手机app开发
  • 大数据
  • 机器学习
  • 人工智能

# 基础统计、数据分析、数据挖掘、机器学习、大数据分析 (会用工具包、会操作就可以,懂点基础理论)

  • 基础统计:数据筛选和查询 pandas mysql/txt/excel https://pandas.pydata.org/

  • 参数估计:scipy http://scipy.github.io/devdocs/tutorial/stats.html

  • 假设检验:scipy

  • 画图:matpltlib/seaborn/

  • 相关性分析/检验:线性相关 scipy

  • 特征变量挑选/特征选择:逐步回归

  • 时间序列 Prophet https://www.zhihu.com/question/21229371

  • 异常值检测 PyOD https://pyod.readthedocs.io/en/latest/index.html

  • 聚类 scikit-learn https://scikit-learn.org/stable/

  • 分类 scikit-learn https://scikit-learn.org/stable/

  • 回归 scikit-learn https://scikit-learn.org/stable/

  • 推荐 Surprise https://www.biaodianfu.com/surprise.html https://github.com/vinta/awesome-python#recommender-systems

  • 广告点击率提升

  • 最终:https://github.com/vinta/awesome-python

# 图像处理/视频处理(了解具体的目标/任务,然后找工具箱就可以了)

  • 图片分类:人脸识别

  • 目标检测

  • 图片检索

  • 图片超分辨

  • pil

  • opencv

  • 最终:https://github.com/vinta/awesome-python

# 文本处理 (了解具体的目标/任务,然后找工具箱就可以了)

  • 分词 jieba

  • 分句

  • 文本分类:好评差评

  • 机器翻译:中英文翻译

  • 文本检索:

  • Pattern https://mp.weixin.qq.com/s?__biz=MjM5NzU0MzU0Nw==&mid=2651382929&idx=1&sn=2e6e8896eac6b278883e7c3de75e35d6&chksm=bd242f858a53a69362730529a1b1964077535c54490ad8d10dd2d5b00073d1a50867950acec6&scene=0&xtrack=1#rd

  • Gensim https://radimrehurek.com/gensim/index.html#install

  • spacy https://spacy.io/

  • fastHan

  • fastNLP

  • 最终:https://github.com/vinta/awesome-python

# 人工智能

最终:https://github.com/vinta/awesome-python