Press "Enter" to skip to content

“数据科学家改善Python代码质量指南”

用于编写生产级Python代码的工具和包

照片由Christopher Gower提供,来自Unsplash

背景

现如今,数据科学家在部署机器学习模型的生产环境中扮演着越来越重要的角色。这意味着我们需要能够像软件工程师一样编写符合生产标准的Python代码。在本文中,我想介绍一些关键工具和包,以帮助您为下一个模型创建具备生产价值的代码。

代码检查工具

概述

代码检查工具是一种能够捕捉到小错误、格式错误和奇怪的设计模式的工具,这些问题可能导致运行时问题和意外输出。

在Python中,我们有PEP8,它为我们提供了全局的代码风格指南。Python中存在许多遵循PEP8的代码检查工具,但我的首选是flake8

Flake8

实际上,Flake8是PyflakespycodestyleMcCabe代码检查包的组合。它检查错误、代码异味并强制执行PEP8标准。

要安装flake8,执行pip install flake8,然后可以通过flake8 <file_name.py>来使用它。就是这么简单!

例如,假设我们在文件flake8_example.py中有一个名为add_numbers的函数:

def add_numbers(a,b):    result = a+  b    return resultprint(add_numbers(5, 10))

要在此文件上运行flake8,我们执行flake8 flake8_example.py,输出如下:

Flake8检测到了几个样式错误,我们应该根据PEP8进行更正。

有关flake8的更多信息以及如何根据您的需求自定义它,请参阅此处。

代码格式化工具

概述

代码检查工具通常只告诉您代码中存在的问题,但并不主动修复它们。代码格式化工具可以修复您的代码,帮助加快工作流程,确保代码符合代码风格指南,并使其更易读。

isort

Leave a Reply

Your email address will not be published. Required fields are marked *