2023年上半年：数据科学和人工智能的发展四海第1张

2023年上半年发生了很多事情。在数据科学和人工智能方面取得了重大进展。以至于我们很难跟上所有这些进展。我们可以明确地说，2023年上半年展示了我们没有预料到的快速进展。

所以，与其过多地谈论我们如何被这些创新所吸引，不如我们来谈谈它们。

自然语言处理

我将从最明显的地方开始。自然语言处理（NLP）。这是在黑暗中酝酿的一段时间，而在2023年已经大放光明。

这些进展在OpenAI的ChatGPT中得到了验证，这一引起了轰动。自从他们在年初正式发布以来，ChatGPT已经从GPT-4发展到现在我们期待GPT-5。他们发布了插件来改善人们的日常生活，以及为数据科学家和机器学习工程师提供的工作流。

而且我们都知道，在ChatGPT发布之后，谷歌发布了Bard AI，这在人们、企业等方面都取得了成功。Bard AI一直与ChatGPT竞争最佳聊天机器人位置，提供类似的服务，例如改进机器学习工程师的任务。

在这些聊天机器人发布之际，我们看到了大型语言模型（LLM）如雨后春笋般涌现。Large Model Systems Organization（LMSYS Org）是由加州大学伯克利分校的学生和教职员工创立的开放研究组织，他们创建了ChatBot Arena – 一个LLM基准测试，以使用共同开发的方法，利用开放数据集、模型、系统和评估工具，使模型对每个人更加可访问。

AutoML

现在人们已经习惯了为他们回答问题并使他们的工作和个人生活更加轻松的聊天机器人 – 那么数据分析师和机器学习专家呢？

他们一直在使用AutoML – 这是一种强大的工具，用于自动化数据预处理、超参数调整，并执行复杂的任务，如特征工程。随着数据科学和人工智能的进步，我们自然而然地看到了对数据和人工智能专家的高需求。然而，随着进展以惊人的速度进行，我们看到了这些人工智能专业人员的短缺。因此，能够找到探索、分析和预测数据的自动化过程将改善许多公司的成功。

它不仅能够为数据专家节省时间，而且组织机构将有更多时间扩大和在其他任务上更具创新性。

生成式人工智能

如果你参与过聊天机器人的爆发，你会看到’生成式人工智能’这个词被频繁提及。生成式人工智能能够根据用户提示生成文本、图像或其他形式的媒体。就像上述的进展一样，生成式人工智能正在帮助不同行业完成任务，使他们的生活更加轻松。

它能够产生新的内容，替代重复性任务，处理定制数据，几乎可以生成任何你想要的东西。如果生成式人工智能对你来说是新的，你会想了解一下稳定扩散（Stable Diffusion） – 这是生成式人工智能的基础。如果你是数据科学家或数据分析师，你可能听说过PandasAI – 这是一个生成式人工智能的Python库，它将生成式人工智能能力整合到Pandas中，以便进行更简单的数据分析。

但是随着这些生成式人工智能工具和软件的发布，生成式人工智能时代，数据科学家还需要吗？

深度学习

深度学习仍在蓬勃发展。随着数据科学和人工智能的最新进展，更多的时间和精力被投入到该行业的研究中。作为机器学习的一个子集，涉及到算法和人工神经网络，深度学习被广泛应用于图像分类、目标检测和人脸识别等任务。

随着我们正经历第四次工业革命，深度学习算法使我们能够像人类一样从数据中学习。我们在路上看到越来越多的自动驾驶汽车，欺诈检测工具，虚拟助手，医疗保健预测建模等等。

2023已通过自动化流程、机器人技术、区块链和其他各种技术展示了深度学习的作用。

边缘计算

在所有这些事情发生的同时，你一定会认为这些计算机很累了，对吗？为了满足人工智能和数据科学的进步，公司需要能够帮助支持它们的计算机和系统。边缘计算将计算和数据存储靠近数据源。在使用这些先进模型时，边缘计算提供实时数据处理，并允许所有设备之间的顺畅通信。

例如，当LLM每两秒发布一次时，很明显组织将需要像边缘计算这样的有效系统才能取得成功。Google今年发布了TPU v4-可以处理机器学习和人工智能的高计算需求的计算资源。

由于这些进展，我们看到越来越多的组织从云端转向边缘以适应其当前和未来的需求。

道德人工智能和数据科学

许多事情正在发生，而且是在很短的时间内发生的。对于政府等组织来说，跟上步伐变得非常困难。世界各国的政府都在提出一个问题：“这些人工智能应用如何影响经济和社会，有什么影响？”

人们关注这些人工智能和数据科学应用的偏见和歧视、隐私、透明度和安全性。那么人工智能和数据科学的道德方面是什么，未来我们应该期待什么？

我们已经有了欧洲人工智能法案，推动将AI系统分为4个风险领域的框架。OpenAI首席执行官Sam Altman在16日的美国参议院委员会上就这项新技术的担忧和可能的陷阱发表了证词。尽管在短时间内有很多进展，但很多人都表示担忧。在接下来的6个月里，我们可以预计会有更多的法律通过，制定出更多的法规和框架。

总结

如果你在过去的6个月里没有关注人工智能和数据科学，希望本文能给你提供一个快速了解。在接下来的6个月里，这些进展能否被接受并确保这些技术的负责任和道德使用将会很有趣。

Nisha Arya是一位数据科学家、自由技术作家和VoAGI社区经理。她特别喜欢提供数据科学职业建议或教程以及数据科学的理论知识。她还希望探索人工智能在延长人类寿命方面的不同方式。作为一名热心的学习者，她努力拓宽自己的技术知识和写作能力，同时帮助指导他人。