Press "Enter" to skip to content

Etan Ginsberg, Martian联合创始人 – 采访系列

Etan Ginsberg是Martian的联合创始人,这是一个动态路由每个提示到最佳LLM的平台。通过路由,Martian实现了比任何单个供应商(包括GPT-4)更高的性能和更低的成本。该系统基于公司独特的模型映射技术构建,将复杂的黑匣子中的LLM解析成更可解释的架构,使其成为机械解释性的首个商业应用。

从中学起,Etan一直为客户编码、设计网站和建立电子商务。作为一个博学者,Etan是世界记忆锦标赛的参赛选手,并在中国深圳世界速读锦标赛中获得第二名。

他是一位vid黑客马拉松选手。曾获得的奖项包括Tech Crunch SZ的第三名奖,普林斯顿黑客马拉松的前7位入围者,以及耶鲁黑客马拉松的3个产业奖项。

您是两次先前创业者,这些公司是什么,并从这些经验中学到了什么?

我第一家公司是美国忍者战士运动推广和发展的第一个平台。在2012年,我认为美国忍者战士是一项地下运动(类似于90年代的MMA),我制作了第一个平台,人们可以在上面购买蓝图、订购障碍物,并找到训练健身房。我为公司提供咨询服务,帮助他们开设自己的健身房,包括协助美国特种部队进行训练并将一家设施从餐巾纸草图扩大到在前3个月内获得30万美元的收入。虽然我还在上高中,但我第一次体验到了管理20多名工人的团队,并学习了有效的管理和人际关系。

我创办的第二家公司是一家另类资产管理公司,于2017年在加密货币ICO热潮之前成立。这是我首次接触自然语言处理(NLP),我们使用社交媒体数据的情感分析作为投资策略。

我学到了很多运营创业公司所需的硬实力和软实力——从如何管理团队到NLP的技术方面。与此同时,我也对自己和自己想从事的工作有了更多的认识。我相信,最成功的公司是由具有更广阔愿景或目标的创始人创办的。我在2017年离开加密货币领域,专注于NLP,因为增强和理解人类智能是我真正追求的事情。我为能够发现这一点感到高兴。

在攻读宾夕法尼亚大学期间,您进行了一些人工智能研究,具体研究内容是什么?

我们最初的研究重点是构建基于LLM的应用。特别是,我们致力于构建第一个由LLM驱动的认知教师系统,主要用于教育领域的应用。初步实验结果非常好——我们看到学生成绩有了0.3个标准差的提高——我们的系统已经在宾夕法尼亚大学和不丹大学等多个学府使用。

您能讨论一下这项研究是如何引领您共同创办Martian的吗?

因为我们是最早构建LLM应用的人之一,所以我们也是最早遇到构建LLM应用时面临的问题的人之一。这将我们的研究引导到了基础架构层面。例如,我们在相当早的时候就使用GPT-3等较大模型的输出进行调整,以及在专门的数据源上对模型进行调整,以解决编程和数学问题解决等任务。这最终引发了我们对于理解模型行为和模型路由的问题。

关于Martian的名字及其与智能的关系的起源也很有趣,您能分享一下选择这个名字的故事吗?

我们的公司以一个名为“The Martians”的匈美利坚科学家团体命名。这个团体在20世纪居住,由一些有史以来最聪明的人组成:

  • 其中最有名的是约翰·冯·诺伊曼,他发明了博弈论、现代计算机体系结构、自动机理论,并对其他数十个领域做出了基本贡献。
  • 保罗·埃尔多什是有史以来发表论文最多的数学家,发表了1500多篇论文。
  • 西奥多·冯·卡门(Theodore Von Karman)建立了空气动力学的基本理论,帮助建立了美国的太空计划。地球和外层空间之间的定义边界被称为“卡门线”,以纪念他的工作。
  • Leo Szilard发明了原子弹、放射治疗和粒子加速器。

这些科学家和其他14个类似的人(包括氢弹发明者、将群论引入现代物理学、以及对组合学、数论、数值分析和概率论等领域做出基础贡献的人)有一个显著的共同点 – 他们都出生于布达佩斯的同一个地区。这让人们产生了疑问:这么多智慧的源泉是什么?

作为回应,Szilard开玩笑说:“火星人已经来了,他们自称匈牙利人!”事实上…没有人知道。

今天,人类在面对一组潜在的超级智能脑之间也面临着类似的问题:人工智能。人们知道模型可能非常聪明,但不知道它们是如何工作的。

我们的使命是回答这个问题-理解和利用现代超级智能。

您以惊人的记忆壮举而闻名,您是如何沉浸在这些记忆挑战中的,这些知识如何帮助您创造出火星概念?

在大多数运动项目中,职业运动员的表现比普通人高出2-3倍(比如一个普通人能踢多远的界门球或者扔多快的快速球与职业运动员相比)。记忆运动之所以迷人,是因为顶级运动员可以记住比普通人多100倍甚至1000倍的信息,而且所需训练时间比多数运动要少。而且,这些人通常都是平均自然记忆力的人,将他们的表现归功于任何人都可以学习的特定技巧。我想最大限度地利用人类的知识,所以我将世界记忆锦标赛视为了解如何提高人类智能的低估的窗口。

我希望在整个教育系统中应用记忆技巧,所以我开始探索自然语言处理和大型语言模型如何在减少设置成本方面有助于常规教育系统使用的最有效方法。Yash和我创建了第一个由LLM提供支持的认知导师,从而使我们发现了现在我们帮助解决的LLM部署问题。

火星实际上是在抽象化选择使用哪个大型语言模型(LLM),为什么这对开发者来说当前是一个痛点?

创建语言模型越来越容易-计算成本降低,算法越来越高效,更多的开源工具可用于创建这些模型。因此,越来越多的公司和开发者正在创建基于定制数据训练的定制模型。由于这些模型具有不同的成本和功能,使用多个模型可以获得更好的性能,但测试它们并找到合适的模型使用是困难的。我们为开发者解决了这个问题。

您能讨论一下OptiMartian将针对每个具体任务最适合使用的LLM的方法吗?

良好的路由基本上是一个关于理解模型的问题。为了有效地在模型之间进行路由,您希望能够理解它们失败或成功的原因。通过使用模型映射来理解这些特性,我们可以确定任何给定模型在请求上的表现如何,而不必运行该模型。因此,我们可以将该请求发送给能够产生最佳结果的模型。

您能讨论一下通过优化使用的LLM所带来的成本节约的类型吗?

我们允许用户指定成本和性能之间的权衡。如果您只关心性能,我们可以在openai/evals上胜过GPT-4。如果您寻找特定成本以使您的单位经济成本工作,我们允许您为您的请求指定最大成本,然后找到最佳模型来完成该请求。如果您想要更动态的东西,我们允许您指定愿意为更好的答案支付多少费用-这样,如果两个模型的性能相似,但成本差异很大,我们可以让您使用价格较低的模型。我们的一些客户在成本上看到了高达12倍的降低。

您对火星的未来愿景是什么?

每当我们提高对模型的基本理解,都会为人工智能带来范式转变。微调是由于对输出的理解而驱动的范式。提示则是由对输入的理解驱动的范式。我们对模型的这种理解的单一差异是传统机器学习(“让我们训练一个回归器”)与现代生成式人工智能(“让我们提示一个初级通用人工智能”)之间的很大不同之处。

我们的目标是持续提供对可解释性的突破,直到人工智能完全被理解,并且我们拥有与逻辑或微积分理论一样强大的智能理论。

对我们来说,这意味着创造。意味着创建令人惊叹的人工智能工具,并将其交到人们手中。这意味着发布破除常规的、前所未有的东西,最重要的是有趣和有用。

如弗朗西斯·培根爵士所言:“知识就是力量”。因此,确保我们理解人工智能的最佳方式是发布强大的工具。在我们看来,模型路由器就是这样一种工具。我们为能够构建它、发展它并让人们使用它感到兴奋。

这是我们将在未来几个月发布的众多工具中的第一个。通过探索一个美妙的人工智能理论,实现全新类型的人工智能基础设施,帮助建设人与机器的明亮未来 – 我们迫不及待地想要与您分享这些工具。

感谢您的精彩采访。希望想要了解更多的读者可以访问火星网

Leave a Reply

Your email address will not be published. Required fields are marked *