Plotl。常用Python库整理( 二 )。" />

常用Python库整理( 二 )


statsmodels更专注于统计推理,提供不确定性评价和p值参数 。相反,scikit-learn更专注于预测 。
2.6 Seaborn2.7 PyEcharts2.8 python/" rel="external nofollow noreferrer">Plotly

  • 需要梯子
2.9 PastyPatsy是一个python库,用于描述统计模型(尤其是线性模型),方法是通过一个叫做公式语法(formula syntax)的字符串来描述 。这种公式语法的灵感来源于R和S语言中的公式语法 。
Patsy的公式是有特殊格式的字符串,像下面这样: y ~ x0 + x1 这种a + b的语法并不代表将a和b相加,而是代表为模型创建的设计矩阵的术语(terms in the design matrix) 。patsy.dmatrices函数,取一个公式字符串和一个数据集(可以使DataFrame或dict),然后为线性模型产生设计矩阵 。
https://developer.aliyun.com/article/798127
3. Web开发3.1 Flask3.2 Flask-restful基于Flask快速创建restful API接口 。
3. Django4. 网络,HTTP,爬虫4.1 urllib, urllib2, urllib3Python 内置 。用来发送HTTP请求,包含了可以添加headers,认证等高级信息 。
urllib2给python2用的,python3中urllib2和并到了urllib 。
https://zhuanlan.zhihu.com/p/92847111
4.2 requestsPython内置 。发送HTTP请求,比urllib更简洁 。
python3/python-requests.html" rel="external nofollow noreferrer">https://www.runoob.com/python3/python-requests.html
4.3 lxml用来处理xml和HTML文件 。语法上利用xpath 。
4.4 BeautifulSoup处理HTML文件 。
4.5 Selenium自动化测试,可以用来完全模拟浏览器,不停发送爬虫请求 。
4.6 scrapy爬虫框架 。
4.7 Socket套接字通讯底层库,用于在服务器和客户端间建立TCP或UDP连接,通过连接发送请求与响应 。
5. 图形界面5.1 pythonpyqt.com/" rel="external nofollow noreferrer">PyQt6. 自然语言处理6.1 NTLK英文文本处理 。
6.2 jieba中文分词 。
6.3 HanLP完整中文自然语言处理工具链,分词,词性标注,命名实体识别,依存句法分析等 。
7. 图像处理7.1 OpenCVhttps://opencv.org/
7.2 python-pillow.org/" rel="external nofollow noreferrer">Pillow用来快速处理图像image 。
8. 机器学习8.1 Scikit-learnscikit-learn项目诞生于2010年,目前已成为Python编程者首选的机器学习工具包 。仅仅七年,scikit-learn就拥有了全世界1 500位代码贡献者 。其中包含以下子模块:
  • 分类:SVM、最近邻、随机森林、逻辑回归等
  • 回归:Lasso、岭回归等
  • 聚类:k-means、谱聚类等
  • 降维:PCA、特征选择、矩阵分解等
  • 模型选择:网格搜索、交叉验证、指标矩阵
  • 预处理:特征提取、正态化
scikit-learn与pandas、statsmodels、IPython一起使Python成了高效的数据科学编程语言 。
8.2 TensorFlow8.3 Keras8.4 PyTorch9. 数据库9.1 SQLAlchemypython database ORM framework
9.2 psycopg2Python-PostgreSQL 连接框架 。
10. 知识图谱11. 交互编程11.1 python.org/" rel="external nofollow noreferrer">IPython尽管它本身并不提供任何计算或数据分析工具,它的设计侧重于在交互计算和软件开发两方面将生产力最大化 。它使用了一种执行-探索工作流来替代其他语言中典型的编辑-编译-运行工作流 。它还提供针对操作系统命令行和文件系统的易用接口 。由于数据分析编码工作包含大量的探索、试验、试错和遍历,IPython可以使你更快速地完成工作 。
11.2 Jupyter11.3 Jupyterlab12. 音频处理12.1 PyAudioAnalysis非常好用且强大的音频分析开源工具,能实现音频的特征提取、分类和回归模型的训练和执行,以及其他一些实用的功能 。
https://www.cnblogs.com/littlemujiang/p/pyAudioAnalysis-wen-dang.html
12.2 Pydubpydub 提供了简洁的高层接口,极大的扩展了python处理音频文件的能力,pydub可能不是最强大的Python音频处理库,但绝对是Python最简洁易用的音频库只要,非要说有什么弊端,大概只有高度依赖ffmpeg,Linux安装起来不太方便吧 。其功能足以满足大多数情况下的音频处理需求 。

经验总结扩展阅读