Press "Enter" to skip to content

Tag: China

中国针对生成AI数据安全提出新的监管提案

数据安全至关重要,特别是在人工智能(AI)等有影响力的领域认识到这一点,中国提出了新的草案法规,强调了在AI模型训练过程中数据安全的重要性 黑名单机制和安全评估 这份于10月11日公开的草案并非来自单一实体,而是表明了数据安全在AI模型训练过程中的关键性

Leave a Comment

介绍DiffusionDet:一种利用扩散进行目标检测的人工智能(AI)模型

目标检测是一种强大的技术,用于识别图像和视频中的物体。借助深度学习和计算机视觉的进展,它近年来取得了长足的发展。它有潜力在从交通和安全到医疗和零售的各个行业中引发革命。随着技术的不断改进,我们可以期待在目标检测领域看到更多令人兴奋的发展。 目标检测中的一个关键挑战是准确地定位图像中的物体。这涉及到确定物体是否存在以及确定其精确的位置和大小。 大多数目标检测器使用回归和分类技术的组合来识别图像中的物体。通常通过查看图像的特定区域,如滑动窗口或区域建议,并使用这些作为“引导”来帮助识别物体。其他方法,如锚框或参考点,也可以帮助目标检测。 尽管这些目标检测技术相对简单且有效,但它们依赖于一组固定的预定搜索条件。大多数情况下需要定义一组候选物体。然而,定义所有这些预定条件可能很繁琐。是否有一种更简化这个过程而无需这些预定搜索准则的方法? 腾讯的研究人员提出了DiffusionDet,这是一种在目标检测中使用的扩散模型。 在过去几个月中,扩散模型一直是人工智能界的关注中心,主要得益于稳定扩散模型的公开发布。简单来说,扩散模型将输入作为噪声,并逐渐去噪,遵循一定的规则,直到得到期望的输出。在稳定扩散的背景下,输入是通过文本提示获得的噪声图像,并且在逐渐去噪,直到获得与给定文本提示类似的图像。 那么,扩散方法如何用于目标检测?我们不是在生成新的东西,而是想知道给定图像中的物体。他们是如何做到的? DiffusionDet的概览。来源:https://arxiv.org/pdf/2211.09788.pdf 在DiffusionDet中,设计了一种新颖的框架,用于直接从一组随机框中检测物体。这些框在训练期间不包含需要优化的可学习参数,预期通过噪声到框的方法逐渐精确地覆盖目标物体。 将这些框想象成输入噪声,这里的约束是它们应该包含一个物体。因此,最终我们希望得到一组包含不同物体的框。去噪步骤是逐渐改变框的大小和位置。这种方法不需要启发式的对象先验和可学习的查询,简化了物体候选的识别,并推动了检测流水线的发展。 DiffusionDet的框架。来源:https://arxiv.org/pdf/2211.09788.pdf DiffusionDet将目标检测视为涉及图像中边界框位置和大小的生成任务。在训练过程中,通过方差调度控制的噪声被添加到地面实况框中,创建了带有噪声的框,然后使用这些框从骨干编码器的输出特征图中裁剪特征。然后,将这些特征发送到检测解码器,该解码器被训练以无噪声地预测地面实况框。这使得DiffusionDet能够从随机框中预测地面实况框。在推理时,DiffusionDet通过反向学习扩散过程并调整噪声先验分布到学习到的边界框分布来生成边界框。

Leave a Comment

字节跳动人工智能研究提出了一种新颖的自监督学习框架,用于创建具有连续和离散参数混合的高质量风格化3D头像

数字世界的一个关键入口,更普遍地存在于社交、购物、游戏和其他活动中,是一个外观吸引人且有动画效果的3D头像。一个合适的头像应该吸引人,并且可以根据用户的外貌进行定制。许多著名的头像系统,如Zepeto1和ReadyPlayer2,采用卡通和风格化的外观,因为它们有趣且用户友好。然而,手动选择和修改头像通常需要从许多图形元素中进行繁琐的修改,这对于初学者用户来说既耗时又具有挑战性。在这项研究中,他们研究了从正面拍摄的一张自拍照片自动生成风格化3D头像的自动化方法。 具体而言,给定一张自拍照片,他们的算法预测一个头像向量作为图形引擎生成3D头像并从预定义的3D资源中渲染头像图像的完整配置。头像向量包含特定于预定义资源的参数,可以是连续的(例如头部长度)或离散的(例如发型类型)。一种简单的解决方案是标注一组自拍照片,并训练一个模型通过监督学习来预测头像向量。然而,需要大规模的标注来处理大量的资源(通常是数百个)。建议使用自监督方法训练一个可微分的模拟器,通过不同的识别和语义分割损失来复制图形引擎的渲染,从而自动地将生成的头像图片与自拍照片进行匹配,从而减少标注成本。 更准确地说,给定一张自拍照片,他们的系统将预测一个头像向量作为图形引擎生成3D头像并从指定的3D资源中渲染头像图像的完整设置。构成头像向量的特征是特定于预设资源的,可以是连续的(如头部长度)或离散的(如发型类型)。一种简单的方法是标注一系列自拍照片,并使用监督学习构建模型来预测头像向量。然而,需要大规模的标注来处理各种各样的资源(通常是数百个)。 头像向量转换、自监督头像参数化和肖像风格化是他们创新架构的三个步骤。根据图1所示,在整个流程中,识别信息(发型、肤色、眼镜等)在三个阶段逐渐关闭域差距的同时保留。肖像风格化阶段首先关注2D真实到风格化视觉外观的域交叉。这一步保持了图像空间,同时将输入的自拍照片转换为风格化头像。对于翻译的当前风格化技术的粗略使用将保留诸如表情之类的元素,这将在流水线的后续阶段中引起明显的复杂性。 图1 因此,他们开发了一种修改版的AgileGAN,以确保表情的一致性,同时保持用户的识别。然后,自监督头像参数化步骤关注的是从基于像素的图片到基于向量的头像的过渡。他们发现强制执行参数离散性会阻止优化达到收敛行为。他们采用一种宽松的形式,称为放松的头像向量,以克服这个问题,将离散参数编码为连续的独热向量。他们教授一个模拟器像不可微分的引擎一样行为,以实现训练中的可微性。在头像向量转换步骤中,所有离散参数都被转换为独热向量。从放松的头像向量空间到严格的头像向量空间进行域交叉。然后,图形引擎可以构建最终的头像并使用严格的头像向量进行渲染。他们使用一种独特的搜索技术,产生的结果优于直接量化。他们利用人类喜好研究评估他们的发现,并将结果与基线方法(如F2P和手工制作)进行比较,以查看他们的方法如何有效地保护个人独特性。他们的结果得分明显高于基线技术,并与手工制作的结果非常相似。 他们还提供了一个消融研究来支持他们的流水线设计决策。他们的技术贡献包括以下要点: • 一种新颖的自监督学习框架,结合连续和离散参数生成高质量的风格化3D头像 • 一种通过肖像风格化来弥合风格域差异的新方法,用于创建风格化的3D头像 • 一种级联的松弛和搜索流水线,用于解决离散头像参数优化中的收敛问题。 您可以在他们的网站上找到该论文的视频演示。

Leave a Comment

潜在的美国对人工智能芯片出口限制动摇科技市场

据报道,拜登政府正考虑对向中国出口与人工智能相关的半导体实施新的限制措施,这引起了英伟达和AMD等领先芯片制造商的担忧这一举措反映了白宫对在主导人工智能竞争中落后以及北京利用该技术进行军事应用的潜力的深切关注

Leave a Comment

中国市场的强大Nvidia人工智能芯片的隐藏市场

深圳华强北电子区内,一个高端Nvidia人工智能芯片地下市场已经出现。这个隐藏的世界在出口限制和这些尖端处理器的强烈需求下悄悄运作。在本文中,我们深入了解了中国Nvidia芯片秘密交易的有趣细节,揭示了在政治氛围紧张的背景下买卖双方所面临的挑战。 也可阅读:NVIDIA成为首家市值超过1万亿美元的人工智能芯片公司 SEG广场的秘密:揭示中国地下芯片市场 位于标志性的SEG广场摩天大楼内,前十层楼是一个电子商店的宝库。商家悄悄地提供Nvidia A100人工智能芯片,这是一种极为抢手的产品。虽然不是公开宣传,但是有兴趣的买家可以通过私下询问找到这个难以捉摸的市场。 高昂的价格:获取Nvidia人工智能芯片的高风险 购买这些高端的Nvidia人工智能芯片需要付出巨额代价。据路透社匿名商家的谈话透露,这些芯片的价格为每个芯片2万美元,高于标准成本。这些芯片的稀缺性,加上出口限制,已经创造了一种充满了高价的利基市场。 Nvidia芯片交易的地下世界:导航出口限制 在中国买卖高端美国芯片并不违法。然而,美国政府实施的出口限制已经迫使这些交易走上了地下。商家为了避免引起美国和中国当局的注意,悄悄地操作来满足对Nvidia A100芯片的需求,从而形成了一个不受监管的市场。 政治紧张和出口管制:对Nvidia芯片的影响 在九月份,美国总统拜登政府禁止向中国大陆和香港出口Nvidia最先进的芯片,包括A100和最近开发的H100。这些限制旨在遏制中国在人工智能和超级计算方面的发展,而这些限制是在政治和贸易紧张局势不断升级的背景下出台的。随之而来的是一系列与半导体相关的出口管制。 也可阅读:NVIDIA建造人工智能超级计算机DGX GH200 对人工智能芯片的激增需求:推动地下市场 随着人工智能的全球崛起,OpenAI的ChatGPT的成功推动了对高端芯片的需求。Nvidia的微处理器以其在机器学习任务中出色的性能而变得备受追捧。因此,由于对这些强大的人工智能芯片不可满足的需求,中国的地下市场正在蓬勃发展。 也可阅读:中国亿万美元的赌博:百度的14.5亿美元人工智能基金标志着一个新时代的人工智能自主 追逐稀缺资源:商家如何获得Nvidia A100芯片 寻求Nvidia A100芯片的商家采用非传统手段来获得这些芯片。他们经常购买过剩库存,这些库存是在Nvidia向美国的大型公司供应大量芯片后进入市场的。此外,他们通过在印度、台湾和新加坡注册的本地公司进口芯片。然而,由于数量有限,商家只能获得少量芯片,这使得大规模项目变得具有挑战性。 数量有限,影响巨大:使用Nvidia芯片改进人工智能模型 虽然商家获得的数量可能不足以从头开始构建先进的人工智能模型,但即使只有少数Nvidia A100芯片也可以革命性地改善复杂的机器学习任务并改进现有的人工智能模型。研究公司TrendForce估计,像OpenAI的GPT这样的模型需要超过3万张A100卡,但是这些有限的获取仍然具有显著的影响。 未来的执法和市场演变:不确定的前景…

Leave a Comment