71 search results for "无监督学习"

探索大型语言模型-第三部分

Published September 12, 2023 by 四海吧

这篇文章主要是为了自学而写的因此它内容广泛而深入根据你的兴趣，可以随意跳过某些部分，或者寻找你感兴趣的领域以下是一些…

Leave a Comment

想成为一名数据科学家？第一部分：你需要的10项硬技能

Published September 12, 2023 by 四海吧

成为数据科学家所需的10个快速步骤硬技能指南

Leave a Comment

“从AI到生成式AI的旅程及其工作原理”

Published September 9, 2023 by 四海吧

本文讨论了人工智能/机器学习的基础知识、应用、生成式人工智能的演变、提示工程以及LangChain

Leave a Comment

人工智能（AI）是技术领域中表现出色且充满机遇的领域之一。无论您目前的技能水平如何，要在AI领域找到工作并不容易，尤其是当招聘人员一直在寻找熟练的候选人时。提升技能并转行有很大且容易的可能性。因此，成为一名顶级AI技术人员需要激情和努力。本文介绍了能够构建您的AI技能，使您成为一流AI公司潜在候选人的顶级分支。什么是AI技能？ AI技能包括一系列设计、开发和实施人工智能解决方案所需的能力和专业知识。这些技能包括熟练掌握Python等编程语言、机器学习算法、神经网络、自然语言处理、数据预处理、数据可视化、强化学习、数据分析、问题解决和伦理考虑。AI技能使专业人士能够创建能够学习、适应和执行类似人类智能的任务的智能系统，推动各行各业的技术进步。前十个AI技能以下是前十个AI技能及其子技能的列表：了解AI领域熟练掌握编程语言精通机器学习数据预处理和分析深度学习和神经网络自然语言处理（NLP）技能计算机视觉熟练 AI伦理和偏见意识云和AI部署持续学习和适应了解AI领域人工智能是一个多学科平台，拥有各种分支，每个分支都具有不同的功能，可以将人类的知识和行为模拟到机器中。AI应用广泛应用于汽车、航空航天工程、生物技术、生物信息学、医疗保健等行业。从基础到高级，开始掌握概念，以便将您的AI技能定制到AI的专门领域。一些主要的AI分支包括：机器学习：作为人工智能的基础，它使用算法从数据中学习并随着时间的推移增强功能。自然语言处理（NLP）：人工智能的一个分支，使机器能够模仿和解释人类语言。机器人技术：将人工智能与工程学相结合，生成可以自主运行的模型或机器。计算机视觉：人工智能可以帮助识别和理解视觉信息。熟练掌握编程语言在AI领域，有几种编程语言专门用于生成算法和设计模型。编程语言的能力使机器能够可视化、吸收和反映，从而使智能系统栩栩如生。在AI中使用各种编程语言来完成不同的任务，例如：…

Leave a Comment

创建一个简单的Docker数据科学镜像

Published September 7, 2023 by 四海吧

这本简明入门指南通过使用Docker来配置Python数据科学环境，步骤包括创建Dockerfile，构建镜像，运行容器，分享和部署镜像，以及推送到Docker Hub

Leave a Comment

如何通过数据科学家专业证书考试

Published September 3, 2023 by 四海吧

了解认证流程并获得通过证书考试的专家技巧

Leave a Comment

通过ODSC West数据入门系列开始学习人工智能

Published September 2, 2023 by 四海吧

作为ODSC West Mini-Bootcamp Pass的一部分，Data Primer系列是您启动AI之旅的黄金通行证这些现场虚拟预训练营会议将从8月持续到10月，将帮助您充分利用10月30日至……期间的ODSC West会议体验

Leave a Comment

用这本免费电子书学习MLOps基础知识

Published August 31, 2023 by 四海吧

立即下载这本免费的电子书，了解MLOps的基础知识

Leave a Comment

通过过程挖掘和数字化转型在工业4.0中释放运营卓越

Published August 26, 2023 by 四海吧

无论行业如何，数字技术在组织中越来越受欢迎，以实现业务成果、收入增长和可持续发展的改善通过…

Leave a Comment

AI流程

Published August 25, 2023 by 四海吧

“人工智能仍然被认为是一个相对较新的领域，因此没有像软件工程知识体系（SWEBOK）那样的指南或标准事实上，人工智能/机器学习的研究生教材并没有提供清晰而一致的人工智能描述…”

Leave a Comment

大学橄榄球联盟重组——回归

Published August 6, 2023 by 四海吧

欢迎来到我的系列文章的第二部分，关于会议改组！去年夏天，当会议改组风潮达到高潮时，Tony Altimore在Twitter上发布了一项研究，这激发了我自己做一项类似的研究…

Leave a Comment

V-Net，U-Net在图像分割中的大兄弟

Published August 5, 2023 by 四海吧

对V-Net进行回顾和介绍，它是U-Net在图像分割和医学影像方面的大哥非常适合数据科学家和医疗专业人士

Leave a Comment

突破数据障碍：零样本学习、一次学习和少样本学习如何改变机器学习

Published August 4, 2023 by 四海吧

探索零样本学习、一次样本学习和少样本学习的概念，这些方法使得机器学习模型能够在有限数量的样本中对对象或模式进行分类和识别

Leave a Comment

“以下是您可以从ODSC西部训练营计划中期待的内容”

Published August 3, 2023 by 四海吧

当你开始你的数据科学职业时，很难知道选择哪条路当来自不确定的地方时，很难为传统的集训营的成本（时间和金钱）提供充分的理由在ODSC West的迷你集训营上，从10月30日到11月2日，你将有…

Leave a Comment

在AWS上利用PySpark处理大数据的机器学习

Published August 3, 2023 by 四海吧

编辑注：Suman Debnath是今年8月22日至23日ODSC APAC的演讲嘉宾一定要去听听他的演讲：“在AWS上使用Spark构建分类和回归模型”！在不断变化的数据科学领域中，明智地选择和应用合适的工具可以极大地塑造结果…

Leave a Comment

来自新加坡国立大学的研究人员提出了Mind-Video：一种利用脑部fMRI数据重现视频图像的新型AI工具

Published August 3, 2023 by 四海吧

理解人类认知使得从脑部过程中重建人类视觉变得有趣，尤其是在使用功能性磁共振成像（fMRI）等非侵入性技术时。在从非侵入性脑部记录中恢复静止图像方面已经取得了很大进展，但对于连续的视觉体验（如电影）则没有太多进展。虽然非侵入性技术只能收集有限的数据，因为它们的稳健性较差，容易受到噪声等外界影响。此外，收集神经影像数据是一项耗时且昂贵的过程。尽管面临这些挑战，但已经取得了一些进展，尤其是通过稀疏fMRI-注释对学习有用的fMRI特征。与静态图像不同，人类的视觉体验是一种不间断、不断变化的景象、动作和物体。因为fMRI测量血氧水平依赖（BOLD）信号，并每隔几秒钟拍摄一次脑部活动的图片，所以恢复动态视觉体验可能很困难。每个fMRI读数可以被视为扫描期间脑部活动的“平均值”。相反，标准视频的帧速率为每秒30帧（FPS）。在获取一个fMRI帧的时间内，可以显示60帧的视频帧作为视觉刺激，这可能使受试者接触到各种各样的物体、动作和场景。因此，通过fMRI解码以比fMRI的时间分辨率更高的FPS检索电影是具有挑战性的。新加坡国立大学和中国香港中文大学的研究人员引入了MinD-Video，这是一个模块化的脑部解码流水线，包括独立训练的fMRI编码器和增强的稳定扩散模型，然后进行微调。所提出的模型在不同阶段从脑部获取数据，扩展其对语义领域的知识。首先，团队使用大规模无监督学习和脑部建模来训练通用的视觉fMRI特征。接下来，他们使用注释数据集的多模态性提取语义相关特征，并在对比学习空间的fMRI编码器中进行对比学习训练。然后，使用专门针对fMRI输入的增强稳定扩散模型与学习的特征进行共同训练，以进一步完善它们。研究人员为生成场景动态视频的稳定扩散模型添加了近帧焦点。他们还开发了一个对抗性引导系统，以针对特定目的调整fMRI扫描。检索到了高质量的视频，并且它们的语义，如动作和场景动态，完全准确。团队使用视频和帧级别的语义和像素指标评估了结果。在语义指标方面的准确率达到了85%，在SSIM方面为0.19，这一方法比先前最先进的方法提高了49%。研究结果还表明，根据注意力研究的结果，该模型似乎具有生物学上的合理性和可解释性，它映射到视觉皮层和更高级的认知网络。由于个体差异，该技术在不同受试者之间的普适性尚在研究中。此方法在重建中仅使用了不到10%的皮层体素，而完全利用大脑数据的潜力尚未发挥。研究人员认为，随着构建更复杂的模型，该领域可能在神经科学和脑机接口等领域得到应用。

Leave a Comment

SEER 自监督计算机视觉模型的突破?

Published July 31, 2023 by 四海吧

在过去的十年中，人工智能（AI）和机器学习（ML）取得了巨大的进展如今，它们比以往任何时候都更加准确、高效和有能力现代的人工智能和机器学习模型可以无缝地准确识别图像或视频文件中的对象此外，它们还能够生成与人类智能相媲美的文本和语音[…]

Leave a Comment

MLOps覆盖整个机器学习生命周期：论文摘要

Published July 29, 2023 by 四海吧

这篇AI论文对MLOps领域进行了广泛的研究。 MLOps是一门新兴的学科，专注于自动化整个机器学习生命周期。调查涵盖了广泛的主题，包括MLOps流水线、挑战和最佳实践。它深入探讨了机器学习过程的各个阶段，从模型需求分析、数据收集、数据准备、特征工程、模型训练、评估、系统部署和模型监控等开始。此外，它还讨论了整个生命周期中的业务价值、质量、人类价值和伦理等重要考虑因素。该论文旨在全面调查MLOps，并强调其在自动化机器学习生命周期中的重要性。调查涵盖了多个主题，包括MLOps流水线、挑战、最佳实践以及机器学习过程的各个阶段。本文在下图中提供了一个概览： https://arxiv.org/abs/2304.07296：机器学习流程模型需求分析为了启动一个机器学习项目，利益相关者必须分析和确定模型需求。本节概述了四个考虑因素：业务价值、模型质量、人类价值（隐私、公平性、安全性和问责制）以及伦理。鼓励利益相关者定义目标，评估用于识别价值和问题的工具，优先考虑需求，涉及相关利益相关者，并确定必要的功能。数据收集和准备数据准备阶段在确保机器学习任务的高质量数据方面起着至关重要的作用。本节介绍了数据收集、数据发现、数据增强、数据生成和ETL（提取、转换、加载）过程。强调了数据质量检查、数据清洗、数据合并、数据匹配以及进行探索性数据分析（EDA）以获得数据集洞察的重要性。特征工程特征工程对于提高预测建模性能至关重要。本节重点介绍了特征选择和提取、特征构建、特征缩放、数据标记和特征填充等技术。提到了与每种技术相关的具体算法和方法，包括主成分分析（PCA）、独立成分分析（ICA）以及标准化和归一化。模型训练模型训练阶段涵盖了不同类型的机器学习模型，包括有监督学习、无监督学习、半监督学习和强化学习。本节讨论了模型选择，包括为特定问题选择适当模型的过程。还探讨了模型选择的方法，如交叉验证、自助法和随机拆分。还讨论了超参数调优，即优化模型参数的过程。模型评估模型评估侧重于使用各种指标评估模型的性能。本节介绍了常见的评估指标，如准确率、精确率、召回率、F值和ROC曲线下的面积（AUC）。强调同时考虑模型性能和业务价值的重要性。系统部署系统部署涉及选择适当的ML模型操作平台，集成系统，进行系统集成测试，并将系统发布给最终用户。解释了部署策略，包括金丝雀部署和蓝绿部署。还讨论了部署ML系统所面临的挑战，以及实现顺畅部署过程的提示。模型监控本文强调在ML系统中进行模型监控的重要性。强调开发人员在ML模型监控和维护方面缺乏知识和经验。本节探讨了模型监控的各个方面，包括漂移检测、模型监控质量、合规性、系统日志记录和模型解释（XAI）。提供了监控数据分布变化、确保模型性能、符合行业特定标准和法规、用于ML流水线的系统日志记录以及实现模型透明度的洞察。结论本文通过讨论MLOps的未来以及需要解决的可扩展性和可靠性挑战来总结。它强调了对机器学习模型进行持续监控和维护的重要性，以实现长期成功。总之，这份综合调研涵盖了MLOps领域内整个机器学习生命周期。它为MLOps管道、挑战、最佳实践、模型需求分析、数据准备、特征工程、模型训练、评估、系统部署和模型监控提供了宝贵的见解。通过详细研究这些主题，本调研旨在帮助研究人员和从业者全面了解MLOps及其实际意义。

Leave a Comment

探索自然语言处理 – 启动NLP（第三步）

Published July 29, 2023 by 四海吧

这是我在这个星期学习的一些概念，特别是关于词嵌入我确实进行了一些实践，很快将作为系列的一部分与大家分享！我要感谢Sachin先生……

Leave a Comment

如何向9岁的孩子解释机器学习？

Published July 28, 2023 by 四海吧

“探索机器学习和数据科学的世界，为孩子们简化跟随我们易于理解的指南深入研究有监督学习和无监督学习”

Leave a Comment

《统计学习导论，Python版：免费书籍》

Published July 28, 2023 by 四海吧

备受期待的《统计学习导论》Python版终于上线了而且你可以免费阅读！以下是关于这本书的一切你需要知道的信息

Leave a Comment

聚类释放：理解K-Means聚类

Published July 26, 2023 by 四海吧

学习如何使用K-Means聚类算法来发现隐藏的模式并提取有意义的洞察

Leave a Comment

只需教科书：一种革命性的人工智能训练方法

Published July 25, 2023 by 四海吧

这是《只需教科书》论文的概述，重点介绍了Phi-1模型在使用高质量的合成教科书数据进行AI训练方面的成功

Leave a Comment

用简单的日常语言解释的10个最常见的机器学习术语

Published July 22, 2023 by 四海吧

你还记得第一次尝试按照菜谱做菜吗？也许是巧克力曲奇或者辣酱当你浏览着菜谱的指导时，你会遇到像“折叠”这样的术语…

Leave a Comment

机器学习中的聚类评估

Published July 22, 2023 by 四海吧

“聚类一直是我关注的话题之一特别是当我初次接触机器学习的整个领域时，无监督聚类总是有一种…”

Leave a Comment

宣布首批即将到来的ODSC APAC 2023培训课程

Published July 22, 2023 by 四海吧

数据科学和人工智能的进展正在以闪电般的速度发展为了帮助您保持领先地位，ODSC APAC将于8月22日至23日举办，将提供由专家领导的培训课程，涵盖数据科学基础知识和前沿工具和框架以下是其中的一些内容全栈机器学习…

Leave a Comment

学习机器学习需要多长时间？

Published July 22, 2023 by 四海吧

简介机器学习是一个快速发展的领域，吸引了无数有抱负的个人的兴趣。然而，学习机器学习需要多长时间的问题是常见且重要的。在本文中，我们将深入探讨影响学习时间的因素，提供推荐的学习路径，估计各个学习阶段所需的时间，探索优化学习过程的策略，并展示有价值的学习资源和平台。无论你是初学者还是想提升技能，本指南将帮助你清晰而自信地进行机器学习之旅。什么是机器学习？机器学习是一门人工智能学科，使计算机能够在没有显式编程的情况下从经验中学习和改进。它涉及分析数据的算法，识别模式，并进行预测或决策。通过迭代学习，机器可以适应和优化其性能，从而能够高效地处理复杂任务。查看我们的机器学习初级认证课程，快速提升你的技能！影响学习时间的因素掌握机器学习所需的时间取决于几个因素。以下是影响学习时间长短的几个重要因素：先前知识：在数学、统计学和编程方面具有扎实背景的人可能更容易理解机器学习的基础知识。在这些领域有先前经验可以加快学习过程。学习投入：投入到学习机器学习的时间和精力直接影响学习速度。坚持不懈的学习实践、对学科的真实兴趣以及定期练习对于加快学习过程至关重要。机器学习的复杂性：机器学习是一个广泛的领域，涵盖了各种子领域、技术和策略。所选择的主题或知识领域的复杂性可能影响学习所需的时间。有些概念可能比其他概念更难理解。学习风格：每个人都有独特的学习风格。有些人更喜欢动手项目和实际应用，而其他人更倾向于理论理解。学习机器学习所需的时间可能因个人偏好和学习方法而异。不同学习阶段的时间估计一个明确的学习路径对于踏上机器学习成功之路至关重要。对于那些有兴趣探索机器学习世界的人，以下是一个推荐的学习路径：数学和统计基础预计时间：1-2个月描述：现在理解微积分、概率论和线性代数等基本数学概念至关重要。要理解机器学习算法，必须首先理解这些关键概念。在线资源： 19门数据科学和机器学习的数学和统计学MOOC课程完整数据科学初学者统计学指南数据科学的免费必读统计学和数学书籍编程技能预计时间：2-3个月描述：学习Python等编程语言以及相关库（如NumPy和Pandas）对于实现机器学习算法至关重要。学习时间可能会因先前的编程经验和投入到实践的时间而有所不同。在线资源： Python在线认证课程和项目培训…

Leave a Comment

揭开Meta的Llama 2的力量：生成AI的一大进步？

Published July 21, 2023 by 四海吧

本文探讨了Meta最新发布的Llama 2的技术细节和影响，它是一个庞大的语言模型，承诺革新生成式人工智能领域我们深入探讨了它的能力、性能和潜在应用，同时还讨论了它的开源性质以及公司对安全性和透明度的承诺

Leave a Comment

探索思维引导树：AI如何通过搜索学习推理

Published July 19, 2023 by 四海吧

“新方法将问题解决视为对大型语言模型的推理步骤进行搜索，使得能够进行超越从左到右解码的战略性探索和规划这提高了在数学难题和创意写作等挑战上的表现，并增强了语言模型的可解释性和适用性”

Leave a Comment

Google数据科学岗位的50个面试问题

Published July 18, 2023 by 四海吧

介绍许多渴望成为谷歌数据科学家的人都梦想能够在谷歌找到一个职业。但是要通过严格的数据科学面试流程需要具备什么条件呢？为了帮助你在面试中取得成功，我们编制了一份包含机器学习、统计学、产品感知和行为方面的谷歌前50个面试问题的全面列表。熟悉这些问题并练习你的回答可以增加你给面试官留下深刻印象并在谷歌获得一个职位的机会。谷歌数据科学岗位的面试流程通过谷歌数据科学家面试是一段令人激动的旅程，他们会评估你的技能和能力。该过程包括不同的环节，测试你在数据科学、问题解决、编码、统计学和沟通方面的知识。以下是你可以期待的概述：阶段描述申请提交通过谷歌的招聘网站提交你的申请和简历，启动招聘流程。技术电话筛选如果进入候选名单，你将接受技术电话筛选，以评估你的编码技能、统计知识和数据分析经验。现场面试成功的候选人将进行现场面试，通常由多轮与数据科学家和技术专家交流的环节组成。这些面试将更深入地涉及数据分析、算法、统计学和机器学习等主题。编码和分析挑战你将面临编码挑战，以评估你的编程技能，以及分析问题，评估你从数据中提取洞察力的能力。系统设计和行为面试一些面试可能会侧重于系统设计，你将需要设计可扩展的数据处理或分析系统。此外，行为面试将评估你的团队合作、沟通和解决问题的方法。招聘委员会审查面试反馈将由招聘委员会审查，他们将共同决定你的候选资格。在我们关于如何成为谷歌数据科学家的文章中，详细了解申请和面试流程。我们已经整理了谷歌数据科学角色的前50个面试问题和答案。谷歌数据科学前50个面试问题通过掌握这份涵盖机器学习、统计学、编码等方面的谷歌前50个面试问题的全面列表，为谷歌数据科学面试做好准备。通过掌握这些问题并展示你的专业知识，确保在谷歌获得一个职位。谷歌关于机器学习和人工智能的面试问题 1. 监督学习和无监督学习有什么区别？…

Leave a Comment

Can't find what you're looking for? Try refining your search: