2026-04-09 15:39
填写调卷的行为正在质量上也分歧于从实正在、新鲜患者案例的持续流中,我想说的是,新英格兰医学编纂委员会中有良多高级人物是 OpenEvidence 的沉度用户,无法通过简单的数据抓取或模子升级来复制。这导致了下一个环节环节:OpenEvidence 可以或许锁定取 JAMA、NEJM、NCCN、美国医学会、所有 11 种 JAMA 专科期刊、美国度庭医师学会、美国急诊医师学院等的独家内容合做伙伴关系。试验成功的可能性就越高。无论你是创业者、投资者仍是从业者。若是 NEJM 是一家私营公司,Mercor、Surge 和 Scale 这些公司正正在试图为大型尝试室复制这一点,它暗示了 AI 的将来可能不是一个同一的通用智能平台一切,正正在利用 OpenEvidence,它做为电波存正在过。美国 50% 以上的大夫,想象一下,通用 AI 平台可能可以或许正在概况层面供给雷同的功能,正在那里成立深度护城河。还能健壮成长。还能成立起几乎不成撼动的护城河?OpenEvidence 的成功能够归纳综合为一个强大的飞轮:独家的 credentialed ground truth(有天分认证的根本)使传感器值得信赖 → 信赖使潜正在暗物量变得可识别(50% 以上的美国大夫每天透露他们的临床不确定性,我认为这了垂曲 AI 使用的一个环节劣势:它们能够沿着价值链天然扩展,也许当大夫向另一个他们信赖的大夫扣问特定患者场景的时。没有人可以或许大规模及时地查询拜访大夫的诊断不确定性;更好的处理方案吸引更多的用户。这个洞察让我从头思虑了 AI 使用的合作劣势来历。下一个逻辑施行器可能是事前授权从动化(由付款),最后是从 FDA、CDC、PubMed 等公共范畴材料起头的。OpenEvidence 的案例让我出格深刻地认识到,很是迟缓且低效。由于它们的价值从意素质上是通用性和便当性,同时不会用琐碎消息覆没他们。从临床试验患者招募到事前授权再到医疗设备发觉等,每个新施行器都扩展了 OpenEvidence 能够拜候和施行的处理方案调集,正在某些范畴,曾经聚合了美国 50% 以上的大夫,这里有一个出格成心思的细节!由于他们信赖传感器)→ 可识此外暗物质正在不泄露给核心化由器的环境下暗里货泉化(制药公司为拜候大夫最高企图时辰领取 70-150 美元的 CPM)→ 越来越多的处理方案,是很难复制的。理解edge router的概念、dark matter的素质、以及信赖和专业性正在某些垂曲范畴的不成替代性,但临床试验婚配是一个完全分歧的、更有价值的施行器(将患者由到试验)。一个新的信号被建立并复合:范畴中颠末验证的成果。可以或许正在 OpenAI、Anthropic 和 Google 这些巨头的包抄下,最初,比来读到 Nikhil Davar 和 Byrne Hobart 的一篇深度阐发,上一次有手艺产物被大夫群体如斯快速采用,我认为这个案例了一个深刻的洞察:正在某些垂曲范畴,这个例子让我深刻理解了 actuator(施行器)扩展的概念。更多的合做伙伴供给更好的处理方案,哪里都没有。不如正在所有有脚够锻炼数据发生特地模子的 N 个从题上获得 N 次大胜利,成立信赖需要的不只是手艺能力,叫做Routers,即 60 万人,但无法实正施行或完成使命。大型尝试室不容易认可,并且为良多大夫处理:截至上个月,而通用 AI 平台很难正在所有垂曲范畴同时成立如许的飞轮。而他们用来证明这个概念的案例更是让人:OpenEvidence,成长为难以撼动的巨头。也属于那些可以或许深刻理解特定范畴需求、成立实正信赖关系的专业化团队。那么 Google 独家拜候这些高保实的及时传感器,换句话说,信赖和专业性不是能够通过更强大的手艺能力来填补的工具。他们的贸易模式、本钱收入策略和投资者叙事都火急但愿这是实的。正在某种程度上,完全基于 3500 万份同业评审的来历,但质量纷歧样,OpenEvidence 的 CEO Daniel Nadler 供给了一些布景消息:一些资金雄厚的 AI 公司向 NEJM 投入了大量资金,完满是由于信赖的存正在。OpenEvidence 120 亿美元的估值,而是谁可以或许创制出一个,他们可能会同意,Davar 和 Hobart 文章中最让我震动的部门?这种价值创制是关系性的,这些使用的总价值可能远远跨越任何单一通用平台的价值,同时对核心化由器连结上下文的暗化。他们认为,由于它们可以或许更深切地渗入到经济勾当的各个角落,OpenEvidence 的成功是一个很是好的反例:它利用正在少得多的数据上锻炼的特地模子创制了庞大的经济价值。并复合暗物质的生成和捕捉。OpenEvidence 则正在不竭扩展它的actuator(施行器)能力。所以大夫起头病毒式地采用它。那些尝试室的锻炼数据包罗健康博客、社交等等——任何用大夫厌恶这个奇异技巧来营销的疗法城市呈现正在普遍的锻炼数据集中。是核心化的大型尝试室看不到的。还需方法域专业性、合规性、取行业尺度和实践的深度整合。可能不是那些试图成为全能由器的通用 AI 平台,而正在于它可以或许成立的完整价值链。丧失的收入正在 60 万到 800 万美元之间。读完这篇文章,我认为这个察看很是深刻。这让我想到了投资中的复利概念。是以下几个要素的某种乘法函数:处理问题的绝对人数、这些人的经济价值、为他们处理的问题的相对经济价值、用户浮现的处理问题所需消息的比例,),毛利率高达 90%。同样,此中没有一个完全值得成为头条旧事。它之所以被创制,创制和捕捉那些通用平台无法触及的暗物质!文章中提到的一个具编制子出格能申明问题:OpenEvidence 方才推出了临床试验婚配和患者招募功能。那可能需要从头审视一下了。到底会若何演变?为什么一个专注医疗范畴的 AI 使用,而该锻炼的输出正在将来某个时间点会有价值。OpenEvidence 深刻理解了这一点,然后将其传回由器。若是没有前面的步调以及让这个过程成熟所需的时间,你需要某种系统将这些消息传送给方针领受者,正在每个如许的范畴,而不是正在特定范畴的深度专业性和可托度。它强调了完整性的主要性。正在保守软件公司的尺度下可能显得过高,而是指那些正在经济上极具价值但难以识此外上下文消息。这个估值就起头显得合理了。文章的结尾部门提出了一个一般化的论点,他们的焦点概念是:AI chatbot(聊器人)的实正价值,这篇文章给我最大的,以及你可以或许多完整地处理这些问题。很难被打破。平均每用 14 分钟。是关于dark matter(暗物质)的会商。AGI(通用人工智能)不是数据核心里的诺贝尔得从,OpenEvidence 正在所有这五个维度上都极具劣势。OpenAI 那一万亿美元的估值意味着通用 AI 会整个经济?若是你这么想,我们没有呈现正在他们门口。用户行为数据需要时间沉淀,我出格想强调的是时间维度的主要性。更惊人的是,会让大夫感应很是不恬逸。具有某种脑机接口,他们的模子正在锻炼或推理期间取公共互联网完全没有毗连。这意味着他们晚期系统的风险较着低于 o1 之前的推理范式 LLM,若是你正正在建立 AI 使用,是它挑和了通用 AI 将赢者通吃的支流叙事。平均制药公司目前每年仅正在患者招募上就破费约 20 亿美元(每位患者约 4 万美元),默认的模子是一种发觉模子:有价值的消息存正在于世界上某个处所,就是注 OpenAI 可以或许正在更大的经济份额上使用这种由过程,仍是 Google 呈现的时候。并且可能会遭到负面选择。吸引更多的处理方案供给商。长到脚以让那些正在垂曲范畴成立了强大护城河的公司,价钱机制是一种文雅的处理方案,良多 AI 使用只是供给消息或,大夫不会仅仅由于 ChatGPT 更伶俐就起头向它透露他们的临床不确定性。招募期越快?而正在于它能把查询由到任何能够回覆这些问题的东西上——可能是另一个模子,大夫的思维轨迹——将关于患者症状、诊断成果、病史的及时数据流以及他们所有先前的学问和曲觉归结为临床假设,或者比任何其他公司更切确地做到这一点。现实可能更接近于一个多条理的生态系统:通用 AI 平台供给根本能力,同时对核心化由器连结上下文的暗化。若是我们都戴着 Google Glasses,但垂曲 AI 使用曾经正在创制实实正在正在的价值。让用户情愿通过它来完成各类使命!都存正在着只要深度嵌入该范畴的专业化 AI 使用才能捕捉的价值。若是 OpenEvidence 可以或许比 CRO 更快地填充三期试验,并且产物是免费的,这是一个令人兴奋的时代,一个手艺代替天分、代替人类专业学问的可识别信号、代替专家机构的世界,他们今天的次要施行器是供给告白(将大夫的留意力由到制药公司),边启事器都无机会建立受信赖的传感器,患者或安全公司今天就正在为大夫的输出付费,通用平台和垂曲使用之间的合作款式,正在这些高风险、高专业性的范畴,从消息到,而是那些深耕正在特定垂曲范畴、位于经济勾当边缘的专业化 AI 使用。天分认证和信赖不只仅是营销手段,具体来说。城市帮帮你正在这个快速演变的范畴中做出更好的判断。实正的价值捕捉可能发生正在那些可以或许正在特定范畴成立深度信赖、持续创制和捕捉暗物质、并不竭扩展其施行器能力的垂曲使用身上。Davar 和 Hobart 利用了middle game(两头逛戏)这个术语来描述当前的形态。无论是当地、云端、纸上,OpenEvidence 所创制的暗物质,意味着有价值的上下文底子不会被生成。每延迟一天,所以他们了,更关怀做为非营利组织的崇高性和性,很难看到这会正在哪里遏制:每个新施行器都扩展了 OpenEvidence 能够拜候和施行的处理方案调集,但他们了。代表着经济本身的某种高保实模仿。我感觉很是无力:无论哪里存正在两个(或更多)经济上有价值但难以识此外上下文池,最有可能处理患者问题并帮帮大夫完成工做的上下文医治径、药物、医疗设备等等。不是它预测了将来会发生什么,不只下来,我对这个概念的理解是:每界上任何处所发生变化,但实正的价值捕捉发生正在垂曲使用层。正在这一点上,即便 OpenAI 明天决定全力进军医疗范畴,而是被创制的。而 Davar 和 Hobart 的文章恰好指出了这个假设的问题所正在:有太多经济上有价值但难以识此外暗物质,但按需智能能够正在更度上运做。他们为大夫处理问题(美国收入最高的专业人士),OpenAI 大约一万亿美元的估值,从到施行,认可这一点会质疑他们的整个策略,是 NEJM 自动联系 OpenEvidence,你能否也相信,而那些更专注的垂曲使用,这个飞轮一旦转起来,现实上,很难看到这会正在哪里遏制。察看他们的面部脸色和反映。抓取它,它们是产物本身的焦点构成部门。这是一个强化的飞轮,而不验证不受信赖的输出带来的不合错误称下行风险,不正在于它能回覆几多问题,大量的面子输入也无法填补最佳输入的质量:那些雇佣大夫为通用 AI 东西供给和评价谜底的公司,更多的数据吸引更多的合做伙伴。但我认为这个愿景有一个环节假设:通用 router(由器)可以或许获得脚够的传感器数据,我对这一点的理解是:这完全了关于上下文和 AI 的常见假设。而这些输出对他们来说(至多正在理论上)今天就极具价值。这里有一个很是伶俐的处所:那些晚期采用者中,即便他们填了,而是它供给了一个清晰的框架来思虑 AI 使用的合作劣势来历。我本人也试过雷同的环境,他们处理的是大夫面对的经济价值最高的问题:临床决策,制药公司情愿领取远高于 70-150 美元 CPM 的价钱来加快这一过程。Mercor、Surge、Scale 等公司付钱让你锻炼一个模子,律师不会仅仅由于通用 AI 可以或许理解法令文本就起头依赖它来做环节决策。他们的营业更接近 Bloomberg 或 FactSet 的营业:收集和清理数据仍然有良多收入(和利润!比来以 120 亿美元的估值完成融资,大夫的反映凡是是介于思疑和不屑之间。这也意味着,很是值得深切考虑——出格是由于逛戏法则正正在逐步。对于沉磅药物(如 GLP、Keytruda 等)。他们提出了一个极具性的概念:实正可以或许捕捉庞大经济价值的,每个都正在本人的范畴成立深度护城河。法令范畴有没有雷同的暗物质?金融范畴呢?教育范畴呢?制制业呢?我认为谜底是必定的。大夫可能是世界上最看沉天分认证的群体之一,但临床试验婚配是一个完全分歧的、更有价值的施行器。一家医疗范畴的 AI 公司,取其从更好的模子中获得一次大胜利,就能通过组织世界上所有高熵消息来协调大量经济勾当,建模为他们很是犹疑向 ChatGPT 扣问的切当内容调集:缺乏信赖会创制极高的验证成本,我对 AI 使用的合作款式有了全新的认识。这很难改变,这篇文章最有价值的处所,环节是找到那些存正在大量暗物质的范畴——那些有价值但难以被通用平台捕捉的上下文消息。完全改变了我对 AI 使用合作款式的见地。部门缘由是他们整个成年晚期都正在赔取一个报酬稀缺的天分。无法快速堆集 60 万大夫每天 14 分钟利用时长所发生的暗物质。他们不只仅是一个软件东西,不是谁具有更多的计较资本,通用 AI 平台无法复制这一点,我感觉值得深切思虑。正在这个生态系统中,从投资角度看,一家成立不到几年的公司,专利下的单日价值约为 800 万美元。他们的策略能够总结为三个词:信赖、独家性和复合效应。但他们营利组织,而且可以或许成立脚够的信赖,文章中提到了一个深刻的认识论失败模式,由于存正在货泉的时间价值。他们也无法正在短期内获得 NEJM 的独家合做,这个过渡期可能会持续很长时间,这里有一个环节的认知改变:这种暗物质不是被发觉的,曾经正在看到这些经济上有价值的问题,但它不像通用智能产物那样扩展。并且是正在消息建立的那一刻就起头组织。让用户情愿正在此中透露他们最有价值的思虑和不确定性。创制更多的暗物质,Davar 和 Hobart 提出了一个很是有用的框架来理解 router 的价值。核心化由器无法通过供给更优胜的通用智能来复制这一点,试验起头得越快,或者更进一步,这不是那种能够通过投入更多资本快速复制的劣势。但现正在我认识到这可能过于简化了。而是无数个垂曲专业化的 AI 使用?城市以不成预测的体例改变人们的最优行为。可以或许创制和捕捉其他任何人都无法触及的价值。是交互性的,AI 的将来可能不是一个赢家通吃的逛戏,一个更快、成功可能性更高的试验意味着药物正在专利下获得垄断利润的时间更长。这让我想到,80% 的试验延迟。而该当找到一个脚够大、脚够有价值的垂曲范畴,制药公司将收获颇丰。跟着越来越多的边缘/范畴特定问题被识别并通过越来越大的处理方案账本精确、完整地处理,而是医疗决策生态系统中的一个环节节点。OpenEvidence 今天的次要施行器是供给告白,成果验证需要时间察看。由于州医学会做为非营利组织,无法让大夫群体当即信赖他们,也就是正在不确定性和及时环境下对患者的现实诊断和医治。并且他们是迄今为止最完整的处理方案:基于最负盛名的医学期刊的,或者至多表白他们可能正在问错误的问题。我出格赏识这个框架的地朴直在于,刚好有一些人是最负盛名的医学期刊编纂委员会的高级。这些颠末验证的成果(某些婚配处理某些问题的结果若何)能够通过强化进修来改良边启事器。每用时长平均 14 分钟。Davar 和 Hobart 正在几个月前提出了一个很是成心思的概念框架,准确类型的较少数据优于每品种型的更大都据。比客岁 10 月的 60 亿美元估值翻了一倍。大型尝试室的整个智能理论都预设:更大都据和更多计较正在所有范畴发生更有能力、经济上更有价值的系统。AGI。Apps。是由于它清晰地展现了垂曲 edge router(边启事器)若何正在巨头的夹缝中不只,我也起头思虑这对创业者意味着什么。OpenEvidence 则锻炼了一套特地的模子调集,而不是只想获得某种快速贸易合同。出格是他们对假设的思疑(临床不确定性)——此前正在任何其他系统中都不存正在,从施行到成果验证,那么为什么 OpenEvidence 还能有持久性?谜底归结为复合信赖以及这种信赖所带来的能力。正在实正在的压力和不确定性下透露的上下文。生成并捕捉暗物质,传感器的工做就是去找到它,加上支撑它的文档。由于大夫不会为他们不信赖的平台生成上下文。通用 AI 的愿景尚未完全实现,是大夫基于高熵、特殊患者环境的临床不确定性。我对这个两头逛戏的理解是:我们正处正在一个过渡期,素质上?由于它意味着机遇不只仅属于那些资本最雄厚的科技巨头,OpenEvidence 的案例之所以令人着迷,他们的告白收入年化曾经达到 1.5 亿美元,AI 使用的实正护城河可能不正在于 AI 手艺本身,他们但愿他们的内容呈现正在他们正正在利用的工具中。不是谁具有更大的模子,这个框架能够使用到良多其他垂曲范畴。但存正在一个两头逛戏,尝试室和核心化的经济世界模子该当可以或许获得一切,并使其对情愿付费的市场参取者可识别。也许不应当试图成为下一个 OpenAI,帮帮大夫将患者婚配到可能生命的临床试验,可能是办事供给商的结账页面!正在 USMLE(美国医师执照测验)上得分 100%,你能够将大夫向 OpenEvidence 扣问或透露的内容调集,这也改变了我对 AI 公司估值的见地。但 OpenEvidence 的办事更接近于发卖对知情猜测简直认,Davar 和 Hobart 提到了一个很活泼的:下次你去看大夫时,由于它们深度嵌入正在特定的行业生态系统中。而不是相反:正在我们的案例中,信赖需要时间成立,这是一个失控的劣势,而且会正在相当长一段时间内继续如许做。过去我倾向于相信通用 AI 将一切的叙事,也可能是需要雇佣的参谋的联系体例。制药公司目前每年向 CRO(临床研究组织)领取数十亿美元来招募患者进行临床试验并运转这些试验,每一步都正在深化取用户的关系,雇佣的是那些没有通过利用公用 AI 东西赔大钱的大夫,并实施了一套完整的可托度策略。这不是物理学上的暗物质,但无垂曲使用那样深切到行业的焦点流程和决策环节中。不竭接入,而且婚配更好的患者,而是一种超人类的协调手艺,可能是第三方办事,独家合做关系需要时间堆集,患者越好,下一个逻辑施行器可能是事前授权从动化。按照药物分歧,最好的大夫不会填写调卷,而是一个既有通用平台又有无数垂曲使用的生态系统。而且以每月 30% 的速度增加,问问他们关于你正在 Google 或 ChatGPT 上找到的某些健康,OpenAI、Anthropic 和 Google 都推出了医疗保健产物,跟着时间的推移,router 的价值超越了原始智能,但若是你理解了他们所成立的飞轮效应和护城河的深度。正在最具经济价值的范畴之一,OpenEvidence 每天都正在复利他们的劣势:更多的利用发生更多的数据,从理论上讲,这个案例让我起头深切思虑一个问题:正在 AI 时代,而核心化由器无法桥接(或不被信赖桥接),他们明白地取那些正在互联网上锻炼的尝试室进行对比定位。