Press "Enter" to skip to content

Tag: Synthetic Data

2023年机器学习模型的顶级合成数据工具/初创公司

有意创建的信息,而不是实际事件的结果,被称为合成数据。合成数据是通过算法生成的,并用于训练机器学习模型、验证数学模型,并作为测试生产或操作数据测试数据集的替代。 使用合成数据的优点包括在使用私有或受控数据时减轻限制,根据无法满足准确数据的特定情况调整数据要求,并为DevOps团队生成用于软件测试和质量保证的数据集。 尝试复制原始数据集复杂性时的限制可能会导致差异。完全替代准确数据是不可能的,因为仍然需要准确的数据来生成实际的合成信息示例。 合成数据有多重要? 开发人员需要大量细致注释的数据集来训练神经网络。当神经网络具有更多多样化的训练数据时,通常更准确。 问题在于编制和确定可能包含几千到数千万个项目的数据集需要大量的工作,并且经常是不可承受的。 现在出现了虚假数据。AI.Reverie的联合创始人保罗·瓦尔博斯基认为,从标注服务中获取的一张图片可能需要6美元,但可以以6美分的价格合成生成。 节省金钱只是个开始。瓦尔博斯基继续表示,通过确保您拥有数据的多样性以准确反映现实世界,合成数据对于处理隐私问题和减少偏见至关重要。 合成数据集有时优于现实世界的数据,因为它们可以自动进行标记,并且可以有意地包含罕见但关键的边角情况。 合成数据初创公司和企业名单 Datagen 成立于2018年的以色列公司Datagen获得了2200万美元的资金,其中包括去年2月的1850万美元A轮融资,这是该公司的正式亮相。由于它主要专注于逼真的视觉模拟和自然世界的重建,尤其擅长人体运动,Datagen将其特殊风格的合成数据称为“模拟数据”。Datagen使用生成对抗网络(GANs),这是一种越来越常见的人工智能方法,与许多处理合成数据的其他企业一样。它类似于计算机棋局中的两个系统之间的游戏,但一个系统生成虚假数据,而另一个系统评估结果的真实性。该公司将GANs与称为强化学习人形动作技术和超级渲染算法的东西相结合,在物理模拟器中进行研究开发。 Datagen的目标行业包括零售、机器人技术、增强和虚拟现实、物联网和自动驾驶汽车。以一个Amazon Go店铺为例,它的计算机视觉系统监视购物者,以确保没有人带走任何物品。 Parallel Domain 模拟自动驾驶车辆的环境可能是当今最常见的应用案例之一。这是Parallel Domain的主要业务领域,这是一家成立于2017年的硅谷初创公司,我们之前已经对其进行了介绍。自那时以来,该公司已经筹集了大约1390万美元的资金,其中包括去年年底的1100万美元A轮融资。丰田可能是其最重要的支持者和客户。该公司致力于教育自动驾驶汽车如何避免伤害人员,为其合成数据平台专注于一些最具挑战性的用例。最近,该公司与丰田研究院合作开发了一种使用合成数据教授自主系统对象永恒性的方法。尽管由于Parallel Domain的影响,现在AI可以在物体暂时消失时仍然追踪物体,但当前的感知系统仍然像孩子玩捉迷藏一样。此外,该公司还向公众提供了用于完全注释的合成相机和LiDAR数据集的数据可视化工具。该公司为自动无人机交付和自动驾驶提供人工训练数据。 Mindtech 成立于2017年的英国公司Mindtech筹集了约650万美元的资金。就在上个月,该公司完成了325万美元的种子轮融资。其中一位著名的投资者是In-Q-Tel,这是一家美国政府组织,为具有帮助像CIA这样的组织的潜力的创新提供资金。因此,这就是它。Mindtech开发的模块化工具Chameleon允许用户使用逼真的3D模型即时创建无限数量的场景和情境。根据该公司的说法,Chameleon专门设计为帮助其客户开发“理解和预测人类互动”的AI系统。除了向间谍机构提供服务外,Mindtech还向零售、智能家居、医疗保健、交通运输和机器人技术行业提供产品和服务。 合成人工智能 2019年初创公司合成人工智能在四月份与iRobot(IRBT)进行了450万美元的种子轮融资,可能是为了推进其智能家居机器人吸尘器的发展。与Datagen一样,合成人工智能使用生成对抗网络(GAN)与计算机生成图像(CGI)技术,这种技术几乎应用于每一部现代电影中,用于构建合成人类。该公司的首款产品FaceAPI允许公司为智能助手、远程会议、驾驶员监控和智能手机面部验证创建更强大的人工智能面部模型。为了增强人工智能模型在代表各种面部类型方面的能力,合成人工智能在六月份发布了4万个原始高分辨率的3D面部模型。 Oneview OneView是一家以色列初创公司,成立于2019年,融资350万美元。该公司的主要目标是为从卫星和航空照片中生成地理情报的人工智能算法提供人工数据。这些视图经常涵盖地球上的大片区域,包括城市、机场、港口和其他建筑物。OneView使用开源数据映射服务OpenStreetMap的实际数据来创建合成数据集的基础模型。该公司只需将2D图像转换为多次渲染的3D图像,以模拟各种情况,包括对象、天气、光照等等。您可以在此处了解更多关于该过程的信息。…

Leave a Comment