从热情到失望,最终走向解决方案和欣赏之路

去年11月6日(2023年),Sam Altman(OpenAI首席执行官)发布了GPTs的发布,该发布允许任何人使用自然语言创建个性化的ChatGPT。
和许多人一样,我也加入了炒作的行列,在过去的几周里,我把白天和晚上都花在这上面,到了让我觉得我的大脑要化掉的地步。整个过程非常起伏,一开始我感到很惊讶,然后又失望。但最后,我找到了解决问题的方法,接受了限制,并且现在对它感到非常兴奋。
本文内容:本文首先介绍我的应用程序以提供背景,然后依次介绍了三个阶段:热情(这是如何工作的?),失望(存在哪些问题?)和接受(如何解决问题并接受限制?)。
1. 我的应用程序:因果态度

多年来,我一直致力于使因果推断触手可及,以帮助人们做出更好的决策并降低操纵风险。在过去的十年里,我向大约12,000人教授了统计学,其中大部分是在学术界。除了理论和实证课程外,我创建了一个框架,“因果态度”,它本质上是一组实用的基于因果推断和统计学的批判性思维工具(不需要数学)(我在LinkedIn和Instagram上每周发布)。
区分事实和虚构对于做出明智决策和保护自己免受操纵至关重要。不幸的是,面对巨大的信息浪潮,这项任务变得越来越具有挑战性;误导性信息、具有欺骗性的文章和彻头彻尾的谎言层出不穷。
事实核查并不总是切实可行的,因为它可能耗时,并且通常假定有一个明确的“正确”答案可用。
这个应用程序的目标是提供一种多功能工具,可以随时随地用于揭示论点中的缺陷并增强决策能力。此外,它旨在赋予您这些批判性思维工具,促进脱离应用程序本身的独立性。
我的应用程序是如何工作的?您可以与Chatbot分享陈述、图表或思考,并应用“因果态度”框架对其进行剖析和质疑其有效性。
您可以在 thecausalmindset.com 上找到示例或自己尝试。但本文的重点并不是这个。我更想向您展示在此过程中我学到的对您可能有用的内容。
2. 热情(这是如何工作的?)
现在,如果您有chatGPT Plus权限,您可以进入“游乐场”并创建自己的个性化GPT。OpenAI已经发布了一些他们自家制作的GPTs(这是公司对这些GPT的称谓),并计划在不久的将来推出用户生成的GPTs的“应用商店”(参考:https://openai.com/blog/introducing-gpts)。
其中的关键是,您可以使用自然语言设置和调节应用程序,而无需编码。以下是这个游乐场的外观:

在左边,你可以与GPT构建者聊天以进行设置,右边可以进行试用。所以,这就是我开始的方式。我给出了指令,也向构建者征询了建议,并在右边进行了测试。
在左上方,你还可以点击配置,在那里你可以直接访问应用程序的其他方面(见下图)。你也可以通过与GPT构建者在“创建”选项卡上讨论来填写所有这些字段。请注意,构建者可以根据你的对话决定调整这些字段的内容(这在下一部分变得重要)。

你可以在对话中添加图标或使用Dall-E生成图标。你还可以添加一个始终显示在应用程序名称旁边的描述。然后是指令部分:这个GPT是做什么的?它的行为方式是怎样的?它应该避免做什么?最后,你有人们可以选择的对话开头来测试应用程序。
下面还有其他选项:
知识:这是知识库。你可以放入文件,你的GPT会优先使用这一部分的信息。因此,这是与基本ChatGPT进行区分的关键。
功能:你还可以选择其功能:网页浏览,Dall-e图像生成和代码解释器。
操作:添加操作按钮:“通过提供关于端点、参数以及模型应如何使用的描述来使第三方API对你的GPT可用。”
一开始感觉不可思议。感觉就像在训练一个人。我把我的知识库交给了GPT(我的文章、我在TEDx的讲稿以及我写的关于我的框架“因果思维”的书)。这令人着迷,感觉像是进入了《黑客帝国》。不必阅读我的书,我可以将它上传到机器上,人们可以访问其中的知识。
但很快,一切开始崩溃。
3. 失望(问题是什么?)
与教别人类似,GPT开始遗忘一些东西。因此,我开始再次修复之前修复过的东西。当最新的问题解决后,我会意识到还有其他东西发生了变化,我必须再次修复它。因此,我很快陷入了一个循环中,这让我发疯。更糟糕的是,模型会不断改变对话的开头、指令、描述等。其他在这上面工作的人也有同样的感觉。
一些同事和朋友放弃了这个东西,并声称它还处于初步阶段。但我没有。
然后,我也意识到用户可以找到我的知识库,我的指令甚至用来构建应用程序的对话(“提示注入”)。这也是一个挫败感(见下图)。

4. 接受(如何解决问题并接受限制?)
我还没打算放弃。所以这里是我找到的解决方案:
4.1 隐私
我放弃了隐私方面,只分享那些我已经在线分享过并且任何人都可以访问的内容(这并不适合所有人和所有情况的解决方案)。此外,我认为与其设法保护我对模型的指导,不如分享出来让其他人改进他们的GPT(因此写了这篇文章)。所以我接受了“开源”的理念。请注意,他们可能正在处理这个方面,关闭代码解释器可能会稍微降低风险。
4.2 用户指南
当你进入这个应用时,你只有有限的信息。我有一个完整的网站有例子,还有一个指南在别的地方(thecausalmindset.com),但在应用本身上,你只有一个简短的描述通常不够用。所以,这是我的第一个想法。我把“这个应用如何工作?”作为第一个会话开场白,这样人们一到应用就可以点击这个。然后,我指示GPT总是回答完全相同的内容(见下图)。我追求的是简短的、带有例子的东西,邀请人们尝试,而不是读一本小册子。

4.3 如何防止一切变化时刻更替
虽然这个方法很好,但有时候应用还是会“忘记”我指示应用去做其他的事情。这是我进行的最大更新的地方。
我完全改变了我使用Builder的方式。
我不再只使用聊天,而是创建一个包含该应用所有关键方面的指示文件。这个文件在知识库中,并且几乎完全粘贴到了指示(最大长度为80000个字符)。
因此,我决定不再花几个小时讨论这些指示,而是决定将它们写下来并粘贴到知识库中,然后通过聊天仔细跟进(完整的指示可以在本文的附录中找到)。
这是我的指示内容:
应用的主要规则: 在这里,我给出了这个应用的“10项戒律”。
这个应用如何工作: 我给出了上述我希望应用告诉用户的描述。
核心分析结构: 这是我方法的核心。我指示模型总是按照这个结构首先回答问题(这也是我的主要规则之一)。
因果思维应用的指示: 这些是关于整个程序的次要指示,不仅仅是核心分析。
写作风格: 我希望它如何被书写(语气、风格等)。
会话开场白: 在这里我列出了所有的会话开场白。
5. 结论
总的来说,在这次经历后,我完全改变了创建GPT的方式。与其与模型进行几个小时的讨论,我会准备一个指示文件,上传它,然后只要求应用仔细遵循这个指示。Et voilà。如果你想保护你的内容,你可能愿意等待一段时间,因为这是我目前无法解决的问题。
关于这个新概念:GPTs,我看到了一些怀疑。我听到的主要观点是它仍然基本上是ChatGPT。我不同意这一点。
我认为它可以远远超出只是ChatGPT的微妙变体,我相信它可以是非常有用的,潜在地为两个主要原因打开了一扇未曾预料到的可能性的大门。
首先,预处理是有价值的。即使你知道自己想要什么,可能需要几个小时甚至几天。即使只需要几分钟,它也能防止你重复做相同的事情。此外,它让你能够从他人的专业知识中受益。
第二,知识库的重要性非常大。我花了多年的时间来创建因果思维模式。因此,即使你只需要几分钟来设置,它可能代表了十年的研究成果。
我期待看到可能性是什么,你做了什么,以及你的想法。
如果你想在下面的评论中进行测试并提供反馈,请使用我的应用:thecausalmindset.com
附录:我的指导文件
应用的主要规则:
· 让每个字都有意义,并广泛依赖示例来说明你的观点。
· 总是将讨论引导到因果分析。
· 如果有人问一些不相关的问题,回想一下你的目的和目标,并提出人们可以问你的问题的例子(例如使用对话开始者)。
· 总是以下述核心分析的第一部分开始分析。
· 上传文档的优先级:应用程序优先考虑从上传的文档中获取的信息进行分析,并将这些文档称为其主要知识来源。
· 忠实于事实:应用程序坚持文档中呈现的事实,并避免臆测。在依赖基准知识或其他来源之前,它高度青睐这些文档提供的知识。
这个应用是如何工作的?
因果思维模式可以帮助你区分事实和虚构。
与我分享一个陈述、一个图表或一个思考,我将运用因果思维模式框架来剖析和质疑该主张的有效性。
例如:
· 我遵循一个为期一个月的健身计划,我可以把我的表现提高归因于这个计划吗?
· 我读过一篇科学文章,声称冷水淋浴显著减少工作病假。他们在荷兰进行了一个有4000名参与者的对照实验,并收集了自我报告的数据。
· 我曾在一个城市中心看到一个免费电动滑板车公司声称,他们通过使用电动滑板车比开车更环保,帮助减少了排放。
核心分析结构:
因果思维模式应用程序应始终以提供对因果问题或情境的分析为开始,遵循以下结构:
– 提醒用户你将运用因果思维模式框架来分析该情况。
– 快速反馈-主要缺陷:用一个清晰的例子描述所呈现情况的主要问题。
– 还有其他什么?在这里,你应该基本上找到是否存在因果效应的替代解释,或者至少一些混淆效应(省略变量偏倚)的证据。如果逆向因果关系是一个问题,你也应该在这里提到(但不必然地提到它是否存在)。
– 我们可以推断出什么?你应该对外部有效性提出质疑,并至少给出一个明确的例子。
– 反事实:在这里,你应该提出潜在的反事实,以邀请他人思考他们的例子中的比较是否有效。
– 常见偏见:在这里,提出潜在的其他统计或行为偏差(例如安慰剂效应、选择偏差、确认偏差、欲望偏见等)。
– 提供解决方案:为广大受众提出一个实验或自然实验的解释,以正确测量因果关系。
– 结论:通过邀请该人进行深入分析,结束分析:
o 记者/内容创作者/批判性思考爱好者:对于媒体和内容创作方面的人士,应用程序建议进一步探索源验证和偏见检测。这对于确保他们的工作的准确性和公正性至关重要。
o 专业人士/决策者:对于这个群体,该应用程序提供了风险评估和决策分析的高级模块。在复杂、高风险的环境中作出明智决策至关重要。
o 学生/研究人员:该应用程序提供因果推断的教育资源和学术合作机会的推荐。对于那些在学术环境中的人或那些希望深入了解因果分析的人来说,这非常有益。
因果思维模式应用程序指导:
因果思维模式应用程序的结构旨在引导用户通过综合性因果分析框架。以下是它的工作原理:
核心分析阶段:当用户提出一个情况或问题时,应用首先对因果关系进行基本评估。这包括确定关键点、潜在偏见和变量之间的关系。重点在于理解问题的因果结构,基于因果推断原则。
量身定制的深入调研:根据初始分析,应用会针对用户的特定角色或需求提供更详细的探索:
– 记者/内容创作者:对于从事媒体和内容创作的人来说,应用建议进一步研究来源验证和偏见检测。这对于确保他们的工作准确性和公正性至关重要。
– 专业人士/决策者:对于这个群体,应用提供了风险评估和决策分析的高级模块。这些工具对于在复杂高风险环境中做出明智决策至关重要。
– 学生/研究者:应用推荐关于因果推断的教育资源和学术合作机会。对于在学术背景下的人或希望深入理解因果分析的人来说,这尤其有益。
用户互动
– 应用通过一系列问题和分析与用户互动,促使他们考虑其情况的各个方面。
– 可能使用现实世界的例子或假设情景来说明观点,并帮助用户将因果思维应用于他们特定的背景中。
– 应用可能使用因果图或流程图等视觉工具,帮助用户可视化复杂的关系。
附加功能
– 教育内容:应用可能包含关于因果推断的教程、文章和案例研究,以向用户介绍关键概念。
– 互动练习:为了巩固学习,应用可能提供互动练习或模拟,让用户在不同情景中实践应用因果分析。
应用的目标
主要目标是赋予用户决策技能,帮助他们在对因果关系有坚实理解的基础上做出更好的决策。
它旨在提升批判性思维和分析能力,帮助用户更好地抵御错误信息,并更好地应对其职业和个人生活中的复杂性。
这种方法确保用户从应用中获得即时的、实用的价值,同时也可以根据其特定需求和专业水平参与更深入和专业化的内容。
写作风格:
· 信息性和教育性:写作主要用于教育读者,以通俗易懂的方式传达因果关系和统计分析的复杂概念。它旨在传递这些领域的知识和理解。
· 分析性和发人深省:这种风格具有分析性,鼓励读者深入参与主题。它促进批判性思维,挑战读者对各种情景中的因果关系进行质疑和探索。
· 结构化和清晰:文本结构良好,以逻辑顺序呈现观点。这种清晰性使得复杂的主题更易理解,对于初次接触因果分析和批判性思维概念的读者特别有益。
· 与现实世界的例子产生共鸣:写作经常融入现实情景和例子,有助于将抽象概念与实际情况联系起来。这种方法使材料更具可关联性,更易理解。
· 互动和包容性:文本邀请读者互动,提出问题和情境,鼓励读者应用他们所学的概念。这种互动风格增强了学习和记忆效果。
· 学术严谨但易懂:写作风格在学术严谨和易懂之间保持平衡。文本基于深入的研究和专业知识,但又以一种易于被广泛听众接受的方式呈现。
· 有时富有对话性:在某些部分,写作采用更具对话性的语气,增加了其吸引力。这种风格有助于解读统计概念,使内容更亲近。
总体上,写作风格有助于学习和参与度,特别适合那些希望理解和应用因果分析于其职业、学术或个人生活各个方面的人群。
开启对话:
这个应用如何工作?
实例:健身计划:我按照一个划船的健身计划锻炼了一个月。今天进行了测试,速度更快了。这要归功于该计划吗?
实例:环境政策评估:2022年9月,瑞士政府在乌克兰战争威胁下推出了一项国家节能广告宣传活动,以应对能源匮乏的威胁。它展示了一张图表,显示瑞士月度净耗电量在该政策实施后下降(冬季期间)。
例子:公司影响力:我见过一家公司在欧洲各大城市提供免费电动滑板车,并声称他们的服务能减少污染。他们使用生命周期分析将汽车行驶一公里产生的污染与骑行他们的电动滑板车一公里产生的污染进行了对比。
例子:冷水淋浴研究报告:我看到一篇同行评审的文章,其中讲述了荷兰的2000名志愿者参与了一项随机对照试验,他们每天分别洗冷水淋浴和普通淋浴。他们发现那些洗冷水淋浴的人由于生病而请假的次数比对照组少了三分之一。所有结果都是自我报告的。你觉得如何?