Press "Enter" to skip to content

147 search results for "参考资料"

AWS对一家大型游戏公司的大型语言模型(LLM)进行微调,以对有害言论进行分类

视频游戏行业全球用户预计超过30亿人1它由大量玩家组成,每天都在虚拟环境中相互交流不幸的是,就像现实世界一样,并非所有玩家都能适当和尊重地交流为了创建和维护一个具有社会责任感的游戏环境,AWS […]

Leave a Comment

SageMakerDistribution 现在可以在Amazon SageMaker Studio上使用

SageMaker Distribution是一个预先构建的Docker镜像,包含许多用于机器学习(ML)、数据科学和数据可视化的流行软件包这包括PyTorch、TensorFlow和Keras等深度学习框架;NumPy、scikit-learn和pandas等流行Python软件包;以及JupyterLab等集成开发环境除此之外,SageMaker Distribution还支持conda、micromamba和pip作为Python的工具

Leave a Comment

通过预测糖尿病视网膜病变的阶段来预防视力丧失

介绍 糖尿病视网膜病变是一种导致视网膜血管变化的眼部疾病。如果不及时治疗,会导致视力丧失。因此,检测糖尿病视网膜病变的阶段对于预防眼盲至关重要。本案例研究旨在从糖尿病视网膜病变症状中检测眼盲,以防止患者眼盲。这些数据是通过各种训练有素的临床专家使用眼底相机(拍摄眼部后部的相机)在农村地区收集的。这些照片是在各种成像条件下拍摄的。2019年,Kaggle举办了一个竞赛(APTOS 2019盲人检测),用于检测糖尿病视网膜病变的阶段;我们的数据来自同一个Kaggle竞赛。早期发现糖尿病视网膜病变可以加快治疗并显著降低视力丧失的风险。 训练有素的临床专家的人工干预需要时间和精力,尤其是在不发达国家。因此,本案例研究的主要目标是使用高效的技术来检测疾病的严重程度,以预防眼盲。我们采用深度学习技术来获得对疾病严重程度进行分类的有效结果。 学习目标 了解糖尿病视网膜病变:了解眼部疾病及其对视力的影响,强调早期检测的重要性。 深度学习基础知识:探索深度学习的基础知识及其在诊断糖尿病视网膜病变中的相关性。 数据预处理和增强:了解如何有效地准备和增强用于训练深度学习模型的数据集。 模型选择和评估:学习选择和评估用于严重程度分类的深度学习模型。 实际部署:了解使用Flask进行实际预测的最佳模型的部署。 本文是数据科学博客马拉松的一部分。 业务问题 在这里,人的病情严重程度被分为五个类别,即多类别分类,因为一个人只能被识别为其中一种严重程度。 业务约束 在医疗领域,准确性和可解释性非常重要。因为错误的预测会导致忽视病情,可能夺走一个人的生命,我们没有任何严格的延迟关注,但我们必须对结果准确。 数据集描述 数据集包括3,662张已标记的临床患者视网膜图像,训练有素的临床专家根据糖尿病视网膜病变的严重程度对每个图像进行分类,如下所示。 0 — 无糖尿病视网膜病变, 1 — 轻度, 2 —…

Leave a Comment

你的模型好吗?深入了解Amazon SageMaker Canvas高级指标

如果你是一名业务分析师,了解客户行为可能是你最关心的事情之一了解客户购买决策背后的原因和机制可以促进收入增长然而,客户流失(通常称为客户流失)始终存在风险了解客户离开的原因可以获得洞察力,可以帮助企业采取措施来减少客户流失

Leave a Comment

人工智能、物联网、深度学习、机器学习、数据科学和其他软件应用的顶级数据库

没有数据库,大多数软件应用都是不可能的。数据库是每种类型和规模的应用的基石:从用于通过企业级项目的数据存储的基于网络的应用,到需要在网络中传输大块数据时需要高容量或高速度的项目;嵌入式系统中,您可以找到与实时系统不同的低级接口与紧密的计时要求。当然,我们不能忽视依赖数据并且绝对需要数据库来存储和以后处理数据的人工智能、深度学习、机器学习、数据科学、HPC、区块链和物联网。 现在,让我们了解一些常见数据库的基本类型。 Oracle:Oracle几乎四十年来一直为其客户提供强大的企业级数据库。尽管受到开源SQL数据库和NoSQL数据库的激烈竞争,但它仍然是最常用的数据库系统,根据DB-Engines的数据。它具有内置的C、C++和Java汇编语言。该数据库的最新版本21c包含了许多新功能。它紧凑、快速,并具有许多额外功能,例如JSON from SQL。 MySQL:Web开发解决方案是这个数据库最常见的用途。MySQL是一种结构化查询语言,它是用C和C++构建的。MySQL的企业级功能和免费、灵活(GPL)的社区许可证,以及更新的商业许可证,使其在行业和社区中迅速走红。该数据库的主要目标是稳定性、健壮性和成熟性。SQL数据库有多个版本,每个版本都有其独特的功能集。 PostgreSQL:PostgreSQL是最先进的开源关系数据库。它是一种基于C的数据库管理系统,用于处理大量数据的公司使用。这个数据库管理软件用于各种游戏应用程序、数据库自动化工具和域名注册。 Microsoft SQL Server:MS SQL是一种支持结构化数据(SQL)、半结构化数据(JSON)和空间数据的多模型数据库。它支持Windows和Linux操作系统。在过去的三十年里,它一直是Windows系统上最受欢迎的商业中档数据库。Microsoft SQL Server在这些年里经历了相当大的改进和改造,虽然不像其他数据库那样具有创新性或先进性,但在开发平台与其他微软产品紧密耦合时可以非常有益。 MongoDB:使用面向对象的编程语言在关系数据库中加载和检索数据需要额外的应用级映射。2009年,MongoDB作为第一个处理文档数据的文档数据库发布。它被用于半结构化数据,其中一致性优先于可用性。 IBM DB2:DB2是一种支持结构化(SQL)、半结构化(JSON)和图形数据的多模型数据库。它也是一个收敛数据库,由于IBM BLU Acceleration的原因具有出色的OLAP功能。DB2 LUW也可用于Windows、Linux和Unix。 Redis:Redis是一个著名的开源数据库。Redis可以用作在内存中运行的分布式键值数据库。它还可以用作消息代理和分布式缓存。它可以处理大量的数据。它支持许多数据结构。 Cassandra:Cassandra是一种广泛使用的数据库,具有开放核心、分布式、庞大的列存储和Apache License 2.0。这是一种可扩展的数据库管理软件,经常用于处理大量数据的企业。它的分散数据库(无领导者)具有自动复制的功能,使其能够在没有故障的情况下容错。Cassandra查询语言(CQL)是一种用户友好的类SQL查询语言。 Elasticsearch:Elasticsearch是一个于2010年发布的开源、分布式、多租户的全文搜索引擎,具有REST API。它还支持结构化和无模式数据(JSON),非常适合分析日志和监控数据。它可以处理大量的数据。…

Leave a Comment

2023年的顶级计算机视觉工具/平台

计算机视觉使计算机和系统能够从数字照片、视频和其他视觉输入中提取有用的信息,并根据这些信息执行操作或提供建议。计算机视觉使机器具有感知、观察和理解的能力,就像人工智能使它们具有思考的能力一样。 人类视觉比计算机视觉具有优势,因为它存在的时间更长。通过终身的上下文,人的视觉有学习如何区分事物、确定它们与观察者的距离、确定它们是否在移动以及确定图像是否正确的优势。 通过相机、数据和算法代替视网膜、视神经和视觉皮层,计算机视觉教会计算机在更短的时间内执行类似的任务。一个经过训练的系统可以快速超越人类,因为它可以在每分钟检查成千上万个产品或过程,同时发现肉眼无法察觉的缺陷或问题。 能源、公用事业、制造业和汽车行业都使用计算机视觉,市场仍在不断扩大。 计算机视觉系统可以用于以下几种典型的工作: 对象分类。在对图像或视频中的对象进行预定标题分类之前,系统会分析视觉数据。例如,算法可以在图像中的所有项中识别出一只狗。 物品识别。系统分析视觉数据并识别出图片或视频中的特定对象。例如,算法可以从图像中的一组狗中挑选出一只特定的狗。 对象跟踪。系统分析视频,识别满足搜索条件的对象(或对象)并跟踪该对象的进展。 顶级计算机视觉工具 Kili Technology的视频标注工具 Kili Technology的视频标注工具旨在简化和加速从视频文件中创建高质量数据集的过程。该工具支持各种标注工具,包括边界框、多边形和分割,以实现精确的标注。通过先进的跟踪功能,您可以轻松地浏览帧并在直观的浏览视图中查看所有标签。 该工具支持各种视频格式,并与流行的云存储提供商无缝集成,确保与现有的机器学习流水线平稳集成。Kili Technology的视频标注工具是优化标注流程和构建强大数据集的终极工具包。 OpenCV OpenCV 是一个用于机器学习和计算机视觉的软件库。OpenCV 旨在为计算机视觉应用提供标准基础设施,并为用户提供超过2,500种传统和前沿算法。 这些算法可以用于人脸识别、去除红眼、识别对象、提取对象的3D模型、跟踪移动对象以及将多个帧拼接成高分辨率图像等任务。 Viso Suite Viso Suite 是一个完整的计算机视觉开发、部署和监控平台,使企业能够创建实用的计算机视觉应用。作为无代码平台的基础,Viso…

Leave a Comment

训练你的第一个决策变形器

在以前的帖子中,我们宣布在transformers库中推出了Decision Transformers。这种新技术使用Transformer作为决策模型越来越受欢迎。 所以今天,您将学习如何从头开始训练第一个离线Decision Transformer模型,使半猎豹奔跑。我们将直接在Google Colab上进行训练,您可以在这里找到:👉 https://github.com/huggingface/blog/blob/main/notebooks/101_train-decision-transformers.ipynb *在Gym HalfCheetah环境中使用离线RL学习的“专家”Decision Transformers模型。 听起来很令人兴奋吗?让我们开始吧! 什么是Decision Transformers? 训练Decision Transformers 加载数据集并构建自定义数据整理器 使用🤗 transformers Trainer训练Decision Transformer模型 结论 接下来是什么? 参考文献 什么是Decision Transformers? Decision…

Leave a Comment

如何在机器学习中构建ETL数据流水线

从数据处理到快速洞察,强大的数据管道对于任何机器学习系统来说都是必不可少的通常情况下,数据团队由数据和机器学习工程师组成,需要构建这样的基础设施,而这个过程可能会很痛苦然而,高效使用ETL管道可以帮助他们的工作更加轻松本文探讨了其重要性…

Leave a Comment

Can't find what you're looking for? Try refining your search: