Press "Enter" to skip to content

22 search results for "SKLearn estimator"

“用GPT-4打造个性化的人工智能交易顾问”

介绍 近年来,将人工智能(AI)整合到股票交易中已经改变了投资者的决策方式。随着大型语言模型(LLMs)如GPT-3和GPT-4的出现,发生了一场范式转变,使个人投资者和交易者更容易获得复杂的市场分析和见解。这种革命性的技术利用大量的数据和复杂的算法,提供了以前仅由机构投资者独占的市场理解深度。本文重点介绍使用LLMs开发个性化AI交易顾问,旨在根据风险偏好、投资时间、预算和期望回报来匹配个人投资者的投资配置,为零售投资者提供个性化、战略性的投资建议。 由GPT-3和GPT-4等大型语言模型(LLMs)驱动的股票交易顾问已经彻底改变了金融咨询服务。它们可以利用人工智能来分析历史股票数据和当前的财经新闻,为投资者提供与其独特投资组合和财务目标相符合的个性化投资建议。我们将尝试构建一个顾问来预测市场行为和趋势,根据个人风险承受能力、投资期限、可用资本和期望回报提供量身定制的建议。 学习目标 通过本文,读者将能够: 了解AI和像GPT-3这样的LLMs如何改变股市分析和交易。 认识到基于个人风险偏好和投资目标的AI驱动工具提供个性化投资建议的能力。 了解AI如何利用历史和实时数据制定投资策略和预测。 了解股票交易中的AI如何使复杂的投资策略对更广泛的受众(包括零售投资者)可行。 发现如何利用AI驱动的工具进行个人投资和股票交易决策。 了解利用LLMs构建股票交易顾问的概念。 本文作为数据科学博文马拉松的一部分进行发布。 关于数据集 该项目的数据集从纽约证券交易所获取,并在Kaggle上提供,包括覆盖七年的四个CSV文件。其中包括关键的财务指标“fundamentals.csv”,提供历史股价和股票分割调整的“prices.csv”和“prices-split-adjusted.csv”,以及提供附加公司信息(如部门分类和总部)的“securities.csv”。这些文件的综合提供了对公司业绩和股票市场动态的全面了解。 数据准备 使用类似GPT-4这样的大型语言模型(LLMs)来实现股票交易顾问,需要进行关键的数据准备。这个过程包括重要的任务:数据清洗、归一化和分类,使用提供的数据集:fundamentals.csv、prices.csv、prices-split-adjusted.csv和securities.csv。 步骤1:数据清洗 在“基本数据集”中,我们使用中值插补来处理“For Year”、“Earnings Per Share”和“Estimated Shares Outstanding”的缺失值(173个、219个和219个缺失值)。 我们将“Period Ending”列转换为日期时间格式,使其适合进行数字字段分析。…

Leave a Comment

使用预选算法在Amazon SageMaker自动模型调整中实现定制的AutoML作业

AutoML可以让您在机器学习(ML)项目的生命周期初期就能从数据中快速得出一般性见解提前了解哪些预处理技术和算法类型能够提供最佳结果,能够减少开发、训练和部署正确模型所需的时间它在每个模型的开发过程中起着至关重要的作用[…]

Leave a Comment

MLOps 使用实施欺诈交易检测

介绍 在当今数字化的世界中,人们越来越倾向于通过在线交易和数字支付来进行交易,而不是使用现金,这是因为它的便利性。随着过渡的增加,欺诈行为也在增加。欺诈交易可以是任何类型,因为它涉及使用虚假身份或虚假信息要求钱款。这给个人和金融机构带来了重大问题。在这个项目中,我们将使用信用卡数据集来设计使用Airflow工具监控实时交易并预测其是否真实或欺诈的MLOPs模型。 学习目标 检测欺诈交易的重要性。 清理数据,转换数据集和预处理数据。 对数据集进行可视化分析以获得洞察力。 在数据科学中使用欺诈交易检测模型的实际应用。 使用Python编程语言进行欺诈交易数据分析 使用MS Azure和Airflow构建端到端的欺诈检测 本文作为数据科学博文马拉松的一部分发布。 什么是欺诈交易估计模型? 欺诈交易数据集包含来自不同来源的数据,其中包含交易时间、姓名、金额、性别、类别等列。欺诈交易估计模型是一个用于预测虚假交易的机器学习模型。该模型是在大量有效交易和欺诈交易的基础上进行训练的,以预测新的虚假交易。 什么是欺诈交易分析? 欺诈交易分析是分析过去数据集的过程。数据集分析旨在发现数据中的异常情况并找出数据集中的模式。欺诈交易分析在保护客户和减少财务损失方面起着关键作用。有不同类型的欺诈交易分析,例如基于规则的分析和异常检测。 基于规则的分析:基于规则的分析涉及创建规则来标记无效交易。例如,可以根据地理区域制定规则。 异常检测:异常检测涉及发现异常或异常的交易。例如,从新的IP地址进行的交易。 检测欺诈交易的重要性 对于企业和金融机构来说,检测欺诈交易对于保护客户免受欺诈和保护他们的资金至关重要。以下是检测欺诈交易的一些关键原因。 减少财务损失:欺诈交易给企业带来巨额财务损失,从而减少它们的利润。因此,企业检测欺诈交易变得至关重要。 维护声誉:维护声誉对于企业来说是至关重要的,因为它会导致潜在客户和顾客的流失。 保护客户和企业:欺诈交易可能对客户造成财务损失和情感影响。通过检测欺诈交易,企业可以保护客户和他们的业务。 数据收集和预处理 数据收集和预处理是开发欺诈检测模型的重要部分。一旦收集到数据,需要对数据集执行多个步骤。 数据清理:数据清理包括删除不需要的数据,例如重复数据,并填充缺失的数据值。…

Leave a Comment

“Python Ray是分布式计算的快车道吗?”

Python Ray是一种革命性的分布式计算框架。由UC Berkeley的RISELab开发,它简化了并行和分布式Python应用程序的编写。Ray简化了机器学习工程师,数据科学家和开发人员的复杂任务。它的多功能性涵盖了数据处理、模型训练、超参数调整、部署和强化学习。 本文深入介绍了Ray的层次结构、核心概念、安装和实际应用,并重点介绍了它在OpenAI的ChatGPT中的关键作用。 理解Ray框架 Python Ray是一个用于并行化Python应用程序的分布式计算框架。 两个主要层次:Ray由两个主要层次组成:Ray AI Runtime(AIR)和Ray Core。 Ray AI Runtime(AIR):专为机器学习工程师和数据科学家定制,AIR包括用于特定任务的Ray Data、Ray Train、Ray Tune、Ray Serve和Ray RLlib。 Ray Core:提供通用的分布式计算功能,包括任务、Actor和对象等关键概念。 Ray Cluster:便于配置和扩展Ray应用程序,包括主节点、工作节点和自动缩放器。 多功能解决方案:Ray可用于机器学习、数据处理等,简化了复杂的并行化任务。 Ray框架层次结构…

Leave a Comment

使用MLflow进行机器学习实验追踪

介绍 机器学习(ML)领域正在迅速扩展,并在许多不同的行业中应用。随着机器学习实验使用MLflow进行跟踪和管理所需的试验变得越来越复杂,跟踪它们变得更加困难。这可能会给数据科学家带来许多问题,例如: 实验丢失或重复:跟踪所有进行的实验可能具有挑战性,这会增加实验丢失或重复的风险。 结果的可重现性:可能很难复制实验的发现,这使得故障排除和提高模型变得困难。 透明度不足:可能难以相信模型的预测,因为难以理解模型是如何创建的。 CHUTTERSNAP在Unsplash上的照片 鉴于上述挑战,拥有一个可以跟踪所有ML实验并记录度量指标以实现更好的可重现性并促进协作的工具非常重要。本博客将探索和学习MLflow,一个开源的ML实验跟踪和模型管理工具,并提供代码示例。 学习目标 在本文中,我们旨在对使用MLflow进行机器学习实验跟踪和模型注册有一个清晰的理解。 此外,我们将学习如何以可重复和可重用的方式交付ML项目。 最后,我们将了解LLM是什么,以及为什么需要跟踪LLM对于应用程序开发。 什么是MLflow? MLflow标志(来源:官方网站) 称为MLflow的机器学习实验跟踪和模型管理软件使处理机器学习项目变得更加容易。它提供了各种工具和功能来简化ML工作流程。用户可以比较和复制结果,记录参数和度量指标,并跟踪MLflow实验。此外,它还简化了模型打包和部署。 使用MLflow,您可以在训练运行过程中记录参数和度量指标。 # 导入mlflow库 import mlflow # 开始mlflow跟踪 mlflow.start_run() mlflow.log_param(“learning_rate”, 0.01) mlflow.log_metric(“accuracy”,…

Leave a Comment

如何构建机器学习模型训练流程

举手吧,如果你曾经花了几个小时来解决混乱的脚本,或者感觉在修复那个难以捉摸的错误时像是在追踪幽灵,而你的模型又需要花费很长时间来训练我们都有过这样的经历,对吧?但是现在,想象一个不同的场景:整洁的代码流畅的工作流程高效的模型训练这听起来太好了,好得让人难以置信…

Leave a Comment

使用机器学习和Flask部署的农作物产量预测

介绍 农作物产量预测是农业行业中必不可少的预测性分析技术。它是一种农业实践,可以帮助农民和农业企业预测特定季节的农作物产量,以便更好地种植和收获。预测性分析是农业行业中可用于农作物产量预测、风险缓解、降低肥料成本等方面的有力工具。使用机器学习和 Flask 部署的农作物产量预测将对天气条件、土壤质量、果实结数、果实质量等进行分析。 Unsplash 学习目标 我们将简要介绍使用授粉模拟建模来预测农作物产量的端到端项目。 我们将遵循数据科学项目生命周期的每个步骤,包括数据探索、预处理、建模、评估和部署。 最后,我们将使用 Flask API 在名为 render 的云服务平台上部署模型。 因此,让我们开始这个激动人心的实际问题声明。 本文是数据科学博客马拉松的一部分。 项目描述 用于此项目的数据集是使用空间显式模拟计算模型生成的,分析和研究影响野生蓝莓预测的各种因素,包括: 植物空间排列 异交和自交 蜜蜂物种组成 天气条件(单独和组合)对野生蓝莓的授粉效率和产量的影响。 该模拟模型已通过在过去30年中在美国缅因州和加拿大海岸收集的田野观察和实验数据进行验证,并现在是一个有用的工具,用于假设测试和野生蓝莓产量预测的估计。这个模拟数据为研究人员提供了从实地收集的实际数据,用于各种农作物产量预测实验,同时为开发人员和数据科学家提供了构建用于农作物产量预测的真实世界机器学习模型的数据。 模拟野生蓝莓田 什么是授粉模拟模型?…

Leave a Comment

Can't find what you're looking for? Try refining your search: