Cointime

扫码下载App
iOS & Android

能够引领产业革命未来的13家 AI 创业公司

个人专家

作者:Mario Gabriele. 编译:Cointime.com QDD

内容概览

  • 增强人类健康。初创公司正在使用人工智能改善医疗保健结果并研发新的治疗方法。例如,Alife利用技术改进体外受精治疗,使患者有更好的怀孕机会。该公司的方法可能会在未来从根本上改变该行业的成本结构。NewLimit是另一家利用人工智能的医疗初创公司。其团队致力于发现治疗以前难以治愈的疾病的更好方法。
  • 企业服务。许多生成式人工智能趋势已在面向消费者的观众中展现。普通互联网用户可以体验复杂的模型,创造文本和图像。有几家有前途的公司更直接地追求企业,构建产品并整合内部数据,遵守公司准则。Glean、Lamini、Dust和Lance是这一趋势的例子。
  • 使用人工智能抵御人工智能。人工智能革命可能带来许多新机会,但也带来了许多威胁。特别是生成式人工智能使得创建逼真的书面消息变得轻而易举,增加了“矛头钓鱼”诈骗的数量和复杂性,旨在从收件人那里获取个人信息。像Abnormal Security这样的公司已经出现,利用人工智能来检测恶意的人工智能消息。
  • 跨越美国之外。虽然美国拥有许多行业的大公司,比如OpenAI和谷歌,但有前景的初创公司正在美国以外发展。Mistral正在从巴黎总部构建开源的大型语言模型——一位贡献者预计它们将挑战OpenAI的影响力。德国企业Sereact已经开发出一款令人印象深刻的人工智能机器人产品,并与工业巨头签订了合同。

一、通过人工智能改善体外受精结果:Alife

在任何生育程序中,都存在着人类决策的特定时刻。体外受精(IVF)中最相关的两个时刻是“卵巢刺激”和“胚胎选择”。

“卵巢刺激”是指确定患者接受药物剂量以刺激卵巢中卵泡的生长,并在何时进行刺激,从而促使卵子从这些卵泡释放出来。掌握刺激时机非常关键——如果刺激过早,可能会获得早熟的卵子;如果刺激过晚,可能会获得过熟的卵子或数量不足。

“胚胎选择”意味着选择要使用和植入哪个受精卵。目前,临床医生和胚胎学家通常使用自己的经验和训练、形态分级系统以及试错方法来做出决策。如果一个周期的药物剂量或时机不正确,他们会在下一个周期进行调整。许多医生在这方面非常出色,这在一定程度上导致了技能在成果中的广泛差异。对于生育这个供应非常有限的市场来说,这意味着非常高昂的价格,尤其是为了找到最优秀的医生,而在该领域内结果差异很大。

Alife利用人工智能构建工具来改善体外受精(IVF)的结果。该公司为医生提供超能力,利用大量输入和结果的数据集,以AI工具增强他们的决策过程。现在,通过一个简单的界面,医生可以输入患者的特征,并在生育过程中的关键时刻得到精确的建议,这些建议来自于成千上万个先前周期的结果。这些数据集来自已有的大量患者结果资源,并且随着每个使用Alife产品的患者增多,数据集将变得越来越好。

这些工具将改变生育行业的性质。Alife的研究表明,他们的机器学习模型可以帮助医生优化触发剂在50%的患者中的使用,以及帮助获得更多的成熟卵子、受精卵和胚胎,平均增加数量分别为三个、两个和一个。Alife的产品可以大大扩大获得生育治疗的范围,通过降低所需药物剂量并提高每个昂贵的体外受精周期的成功率,降低每个患者的费用。这将使医生的竞争更加公平,使那些经验不足的医生可以获得更广泛的知识和输入。

Rebecca Kaden,联合广场风险基金的常务合伙人:最终,您可以想象Alife的工具在整个过程中提供所有判断时刻所需的所有输入,使得医生之外的从业人员可以执行周期,从而从根本上改变该行业的成本结构和可用性。更重要的是,数据驱动的精准医学将用个性化的建议来增强或最终取代个人判断,在体外受精等领域并不独特。在医学的各个领域,存在着成千上万个类似的时刻,有机会利用数据来彻底改变结果和对重要过程和治疗的获得。

二、企业搜索及更多:Glean

在工作中找到所需的确切信息,确切地在需要时找到它,应该快速而简单。由于每个人用于完成工作的应用程序数量众多,以及由此产生的数据和文档量,这并不总是情况。不断增长的“知识”和越来越分散的工作性质增加了找到现有知识所需的时间。换句话说,在工作中“搜寻”东西是相当有问题的。

为了帮助雇主解决这个问题,Arvind Jain及其团队构建了Glean,一款面向职场的人工智能统一搜索平台。它为员工提供一个直观的工作助手,帮助他们在需要的时候准确地找到所需的信息,并主动发现他们应该知道的事情。

该公司的使命从一开始就很简单:帮助人们更快地找到职场问题的所有答案,减少挫败感和浪费时间。但自那以后所取得的成果远远超越了搜索范畴。例如,Glean不仅可以在工作中的每一个应用程序和知识库(如Slack、Teams、Google Drive、Figma、Dropbox、Coda等)之间进行搜索;它还能理解自然语言和上下文,根据人们的角色和公司内外部关系个性化每个用户的交互。它智能地呈现您公司最受欢迎和验证的信息,帮助您发现团队所知的内容,并以权限感知的方式保持同步。

随着组织越来越分散,知识越来越分散,像Glean这样直观的工作助手不再是可有可无的工具,而是在提高员工生产力方面发挥着关键作用。公司开发的东西将打破减缓进展的壁垒,创造更积极和高效的工作体验。

此外,Glean的搜索技术使其能够在遵循企业严格的权限和数据管理要求的情况下将生成式人工智能引入职场。如今,企业要将人工智能应用程序投入生产,关键障碍之一是无法强制执行适当的管理控制(例如“我的应用程序是否理解最终用户被允许看到和不允许看到的内容?”;“推理是在我的服务器还是OpenAI的服务器上进行的?”;“什么来源数据导致特定的模型输出,并且谁拥有这些数据?”)。通过与企业内部环境实时数据权限进行连接,Glean已成为帮助企业在规模上解决管理问题并自信地利用内部数据进行模型训练和推理的理想解决方案,充当企业级的AI数据平台/向量存储。

Kleiner Perkins合伙人Josh Coyne:随着时间的推移,我们相信每个公司都会拥有自己的AI助手,个性化地理解业务和员工的细微差别。我们相信Glean正朝着抓住这个机会的目标迈进。

三、多模态数据的存储和管理:Lance

我们都玩过Midjourney,大多数人都见过GPT-4写代码的演示。Midjourney(文本转图像)和GPT-4(图像转文本/代码)展示了模型变得多模态的可能性,弥合了文本、图像和音频等不同形式媒体之间的差距。虽然当前人工智能的热潮大多围绕文本模型展开,但多模态模型是构建更准确的世界表现形式的关键。

随着我们在机器人技术、医疗保健、制造业、娱乐业和广告业等行业解锁下一个人工智能应用的浪潮,越来越多的公司将在多模态模型的基础上构建产品。像RunwayFlair.ai这样的参与者是各自领域新兴的领导者,它们的产品受到了巨大的用户需求,而谷歌等老牌公司也开始发布类似的多模态功能。

但是,使用多模态模型也带来了一个挑战:如何存储和管理数据?传统的存储格式如Parquet并不针对非结构化数据进行优化,因此机器学习团队在数据加载、分析、评估和调试方面面临着性能缓慢的问题。此外,缺乏单一的真相源使得机器学习工作流在微妙的方式上更容易出错。Lance是最近出现的一家公司,致力于解决这一难题。像Midjourney和WeRide这样的公司正在将PB级的数据集转换为Lance格式,并与传统格式如Parquet和TFRecords相比,性能得到了显著改进,增量存储成本减少了一个数量级。

Lance的工作并不止于存储——他们意识到需要重新构建整个数据管理栈,以更好地适应我们正在向之移动的世界,即一个以非结构化多模态数据为组织最宝贵资产的世界。他们的首个平台产品LanceDB(目前处于私人测试阶段)为开发者提供了一个无缝的嵌入式体验,以便将多模态功能集成到他们的应用程序中。

CRV合伙人Saar Gur:Lance只是一个公司将开发者引入多模态未来的例子——我对其他技术推动多模态应用边界的新技术非常兴奋。随着人工智能的发展速度,不久之后这个未来就会成为现实。

四、遏制AI增强的网络攻击潮流:Abnormal Security

我对生成式人工智能抱有坦率的乐观态度,但并非天真。例如,我担心“社交工程”攻击,比如利用电子邮件获取敏感信息的“矛头钓鱼”攻击,这类攻击自去年ChatGPT爆发以来已大幅增加。

Abnormal Security称,每千人的攻击次数在过去一年从500次以下飙升至2500次以上。而且攻击的复杂程度急剧增加。正如任何学生可以利用ChatGPT写出一篇完美的文章一样,它也可以用来产生语法完美且危险个性化的虚假消息,而无需进行谷歌搜索。

根据FBI的数据,自2013年以来,这类针对企业的“商业电子邮件妥协”攻击已造成超过500亿美元的损失。而且情况将会更加糟糕。每天,数不清的网络犯罪分子和其他不法分子都在使用“WormGPT”等黑帽工具,这是一种聊天机器人,旨在挖掘恶意软件数据,从而制定最具说服力和可扩展性的欺诈活动。

幸运的是,Abnormal的联合创始人Evan ReiserSanjay Jeyakumar正在努力利用人工智能来应对这一威胁。可以将其称为利用人工智能来抵御人工智能。从历史上看,电子邮件安全系统扫描已知的恶意行为特征,比如特定的IP地址或尝试访问员工的个人可识别信息(PII)。

借助人工智能的力量,Abnormal对此进行了颠覆。由于AI增强的攻击被设计成看起来合法,因此Abnormal的方法是深入了解已知的良好行为,以至于即使是细微的偏差也会变得显而易见。该公司使用大型语言模型构建了对其内部和外部工作的详细表示,例如通常彼此交流的人员以及他们可能围绕哪些内容进行交互。如果我的合作伙伴Reid Hoffman给我发了一封邮件,说:“嘿,请给我发送Inflection.AI的最新演示文稿。”Abnormal的AI引擎很快就会注意到Reid很少以“嘿”开头,也很少发送一句话的备注——他从未要求我发送有关Inflection的文件。(作为公司的联合创始人和董事会成员,他对文稿的访问权限比我更多!)

不出所料,随着对生成式人工智能安全担忧的增加,Abnormal看到了企业客户需求的加速增长。考虑到Abnormal公司在使用人工智能解决了由人工智能加速的问题,我觉得它的成功尤为令人满意。在技术变革的时期,恶意分子通常在先发优势上享有较长时间的优势。毕竟,他们可以利用创新,而无需担心产品质量、安全性或尚未制定新法律的监管机构。(垃圾邮件和勒索软件的历史提供了有趣的案例研究。)

Greylock合伙人Saam Motamedi:与此同时,技术初创公司理所当然地专注于为其创新开发强大的新用例,而不是阻止非法或破坏性的用例。但像所有与人工智能相关的事物一样,由于滥用可能带来的潜在网络破坏非常可怕。幸亏有了Abnormal团队的远见,网络犯罪者可能会变得至少稍微不那么顺利。

五、增强知识工作者:Dust

显而易见,大型语言模型(LLMs)将提高知识工作者的生产力。但是目前还不清楚具体是如何做到的。Dust致力于弄清楚这一点。由于LLMs在企业中没有内部数据的情况下帮助有限,Dust构建了一个平台,用于索引、嵌入和实时更新公司的内部数据(Notion、Slack、Drive、GitHub),以向LLM支持的产品提供数据。

Dust的联合创始人Gabriel HubertStanislas Polu曾将一家公司出售给Stripe,并在那里工作了五年。他们亲眼目睹了快速发展的公司在扩张过程中可能面临的挑战。他们看到了他们所称的“信息债务”逐渐产生,并且现在专注于应用LLMs来解决相关的重要问题。目前,他们正在对平台进行以下应用的探索:

1、答案引擎:重点是确保事实准确,因为这对广泛采用至关重要。

2、组合助手:在内容创建时提供模板化辅助,例如,根据内部数据生成你所缺失的段落。

3、自动更新文档:文档所有者会在公司内部的信息有更新时收到通知和预先制定的建议。

4、结构化事件提取:用户可以根据预定义的模板从非结构化数据(例如Slack的线程)生成结构化事件。

5、内部数据监控:智能规则下的企业数据监控。例如,如果个人可识别信息(PII)不慎出现在不应出现的地方,可以收到警报。

Konstantine Buhler,Sequoia合伙人:尽管这是一个庞大的任务,但Dust的创始人们相信这些领域的大部分研究最终会贡献于构建一个统一的产品。他们目前还处于探索的初期,并正在形成Dust最终的聚焦方向。基于他们最初的尝试,他们相信他们已经验证了他们的核心假设:可以通过使用公司数据并为LLM应用程序提供支持,来增强(而非取代)知识工作者,并为此构建一种新型的“团队操作系统”。

六、解锁商业数据:Labelbox

“大数据的兴起”已经持续了20多年,尽管公司继续摄取更多的数据,但许多公司仍然难以利用这些数据为其AI模型生成洞见。数据处理和标注仍然是AI流程中最繁琐和昂贵的部分,但也是质量结果最重要的部分。即使预训练的大型语言模型正在崛起,企业仍需专注于利用其专有数据(跨多种模式)来创建产生差异化服务、洞见和提高运营效率的生产AI。

Labelbox通过简化公司将数据集馈送到AI模型的过程来解决这一挑战。它帮助数据和机器学习团队找到正确的数据,对其进行处理和标注,将模型推向生产环境,并持续度量和改进性能。

Labelbox的新平台利用生成AI的趋势。模型工厂允许团队快速实验各种主要封闭和开源提供者的AI基础模型,使他们能够仅需点击几下即可对数据进行预标注和快速实验。通过这样做,他们可以了解哪个模型在其数据上表现最佳。模型工厂会为每次实验运行自动生成详细的性能指标,并对结果进行版本控制和快照。

其影响可能是深远的。传统上,人们需要花费数天的时间才能完成一个简单但耗时的任务,例如对具有多段文本的电子商务列表进行分类。然而,使用GPT-4,这个任务可能只需数小时。模型工厂使企业能够自行发现这些效率。

这仅仅是一个例子。早期结果显示,超过88%的标注任务可以通过一个或多个基础模型实现显著加速。与编码和构建数据到模型的流程相比,Labelbox使任何人都能轻松预标注数据。它的目标是让团队能够协作工作,并吸引跨功能专业知识来维护数据质量保证的人类监督。这种功能使AI更加民主化,使机器学习专家和业务专业人士能够轻松评估模型、丰富数据集并合作构建智能应用。

Labelbox已经证明能够显著降低世界上最大型企业(包括沃尔玛、宝洁、吉尼迪药厂和Adobe)的成本并提高模型质量。

Robert Kaplan,SoftBank合伙人:对于企业来说,现在的竞争重点是释放这些基础模型在其专有数据上的潜力,以解决业务问题。我们对Labelbox如何帮助企业解锁其数据并以更高的效率提供更好的产品感到兴奋。

七、一个新的创意套件:Runway

AI无处不在,越来越成为一种商品。在大多数情况下,公司将AI作为聊天机器人来丰富现有的应用程序。而更少见的是,有AI应用能够重新设计产品体验,利用技术来根本改变我们与产品互动的方式 - 类似于Google的搜索引擎如何改变了我们浏览互联网的方式,或者Instagram如何改变了我们用手机分享照片的方式。这些AI应用需要对现有用户体验有深刻的理解、具有远见的产品思维和尖端技术。

Runway就是一个这样的例子 - 利用应用AI研究来重新设计创意体验并构建一个新的创意套件(Lux有幸从其最早阶段开始与该公司合作)。

1、对用户体验有深刻理解。创始人Cristobal ValenzuelaAnastasis GermanidisAlejandro Matamala-Ortiz曾是纽约大学互动通信项目的研究人员,有多年的设计经验。Runway团队从直接经验中了解了创意工具生态系统,并了解了民主化的障碍。例如,创意电影制作通常需要昂贵的设备、软件资源和高水平的培训。因此,它过去主要集中在大型制片厂。Runway看到了扩大和改进创意工具可访问性的机会。

2、具有远见的产品思维。Runway很早就意识到AI的一个拐点可以极大地改善用户体验,不仅仅是增强现有的创意工具,而是彻底改变这些工具的工作方式。例如,用户可以利用简单的文本提示从零开始创建全新的视频内容。关键的是,这些视频的质量非常高,可以从台式机或移动设备上共享。无论技能水平、背景还是资源如何,Runway都可以节省数小时或数天的编辑工作。这是一个具有远见的产品,能够将简单的提示转化为生动、动人的作品。

3、领先的AI技术专家。Runway不仅解决了一个问题,还重新构想了底层的研究和技术基础。Runway的内部研究机构处于图像和视频合成的深度神经网络领先地位。该公司开发了Gen-2,这是一个比当今市场上任何模型都更强大、更强大的多模态AI视频模型。它是第一个公开可用的能够将文本转化为视频的模型。在此之前,Runway发布了Gen-1,该模型引领了在视频生成工具中产生高质量输出的范式转变。Runway的研究人员还开创了文本到图像模型的稳定扩散方法。

自2022年10月以来,Runway已经开发了30多个AI“魔术工具”,涵盖视频、图像、3D和文本,并服务于从前期制作到后期制作的创意过程的每个方面。他们的客户群体包括CBS的《斯蒂芬·科尔伯特深夜秀》,New Balance,Harbor Picture Video,Publicis和Google等世界500强和全球2000强企业。该平台还被用于编辑奥斯卡提名的电影,如好莱坞大片《Everything Everywhere All at Once》。

Grace Isford,Lux Capital合伙人:最令人兴奋的AI应用是重新构想现有的产品体验,重新思考用户与产品的互动方式。通过Runway,用户可以在几秒钟内创建全新的视频作品,无论他们是第一次拍摄视频的人还是专业制片厂。这是一种转变性的转变,也是AI如何重新构想不同行业的一个例子。

八、重塑细胞命运:NewLimit

细胞是地球上最复杂的计算机系统。与计算机芯片类似,DNA由基本单元组成,这些基本单元超叠工作,产生复杂的功能。与基于位的代码不同,基于原子的代码是随机的和分层的。这些系统依赖于其他物理系统 - 每个物理系统都受到热量、酸度和细胞微环境中的分子的影响。

尽管存在这些相互依赖,细胞的机器代码(DNA)可以高效地运行不同的程序。尽管你的肝细胞和皮肤细胞包含相同的基因组,但这些细胞类型看起来、感觉和功能都不同。为什么会这样?这是因为它们执行了不同的表观遗传程序,其中包含了哪些基因被调高和哪些基因被调低,以及程度如何。

2006年,Takahashi等人使用四种转录因子(TF)蛋白质组合将成熟的细胞重新编程成干细胞,从而开创了表观遗传重编程的领域。使用之前的类比,TF是将基因的调节高低转化为一个蛋白质,从而实际上改变了所运行的“程序”。 Takahashi和Yamanaka的这一发现导致了诱导多能干细胞(iPSCs)的发现,并获得了诺贝尔奖。从那时起,许多研究小组都应用了独特的TF组合来改变细胞状态,恢复受损细胞和恢复年轻的细胞表型。

虽然表观遗传重编程变得更加易于操作,但这肯定并不简单。研究小组必须确定哪种TF组合能够高效地将细胞从状态A转变为期望的状态B。未来的TF组合可能会使我们能够将患病细胞转化为健康细胞,从而开启一种新型的药物类别。由于许多应用程序的确切TF组合仍然未知,因此需要进行更大规模的重编程筛选。由于存在1500多个原生人类TF,即使只有五个成员的组合,也将产生超过6 x 10^13种实验不可行的组合 - 这需要一种更高效的搜索方法。我们相信NewLimit正在开发这样的方法。

在单细胞测序和机器学习(ML)方面的进展推动了NewLimit将先前的手工制作学科转变为数据驱动的科学。该公司在分子生物学家和计算生物学家之间有良好的分工,为构建一个日益高效的闭环平台奠定了文化基础。结合专业知识和多模态输出(scRNA-Seq、scATAC-Seq等),NewLimit旨在发现治疗性重编程因子,以治疗以前难以治疗的疾病。

在每一轮实验中,NewLimit都使用ML技术来:

1、将多个测量结果组合和压缩为包含细胞当前状态A和期望状态B的较低维优化空间。

2、枚举新的TF组合,可能将细胞驱向其期望状态。

3、建议哪种类型的数据将有助于改进模型,并在何时/何地应用更昂贵、低通量的实验方法。

4、提名应对平台进行的更改,以最大程度地提高每美元产生的有用信息量。

除了其杰出的团队、技术实力和雄心勃勃的愿景之外,我们还钦佩NewLimit的务实态度。虽然该公司尚未公开分享其初期商业策略的细节,但我们相信这种方法是有创意的、风险相对较小的,对人类可能具有变革性的。创始团队明白平台生物技术可能类似于昂贵的科学项目,不能在短期内生成资产。为此,NewLimit是透明的,从创立以来就记录了其技术进展。

Simon Barnett,Dimension研究总监:我们应该对自然的复杂性感到谦卑。毫无疑问,生物学比我们自己设计的硅设备更难编程。维度的目标是赋予开创性的企业家(如NewLimit)权力,他们寻求在技术和生物学的交界处测试可能性的边界。

九、软件开发的基础AI:Poolside

虽然OpenAI专注于通用AI,DeepMind专注于科学发现,但AI的第三个基本用例是理解和创建软件。

GPT-4正在逐步融入有经验和初学者开发者的工作流程中。但是,这种范式转变仍处于初级阶段。根据过去几个月的趋势,AI辅助编程将很快变得无处不在。展望未来,自然语言将成为构建软件的抽象层。

虽然其他公司已经发布了仅基于代码的大型模型,如StarCoder,但迄今为止,没有任何方法能够达到GPT-4的性能水平。我认为,这是因为仅在代码上训练模型无法产生出色的软件开发能力。正是出于这种观点,我注意到了Poolside。该公司由GitHub的前首席技术官Jason Warner和source{d}的创始人Eiso Kant创立,后者是世界上首家专注于代码的人工智能公司。

Poolside的独特之处在于,他们采用了OpenAI的基础模型方法,但专注于代码生成这一能力。他们的技术策略依赖于代码可以执行,从而在学习过程中获得即时和自动的反馈。这允许通过代码执行进行强化学习,是强化学习通过人类反馈(RLHF)的一个引人注目的替代方法,这正是Eiso在2017年探索的内容。

Matan Grinberg,Factory联合创始人兼首席执行官:虽然人工通用智能(AGI)对于极大地造福人类的潜力是不可否认的,但实现这一目标仍然遥远。但是为什么要等待AGI呢?通过专注于推进特定领域的人工智能,比如软件开发,我们可以消除更多的创作障碍。我对于看到Poolside团队实现这一构建专用软件基础模型愿景感到兴奋。

十、在法国OpenAI的竞争对手:Mistral

最近,在生成式AI领域,巴黎涌现出了大量项目。为什么?我的假设是,那里聚集着全球一流的生成式AI人才,这些人才仍在OpenAI的事件地平线之外。在这些项目中,最引人注目的无疑是Mistral。Mistral由Guillaume LampleArthur MenschTimothe Lacroix创立,旨在构建最优秀的开源语言模型,并以此建立一个繁荣的生态系统。

我与Guillaume认识已有四年时间,我们都深度参与了将大型语言模型(LLM)应用于数学,尤其是形式数学。我们在OpenAI和Meta共事期间形成了友好的竞争关系。Guillaume是我曾经合作过的最有才华的研究人员之一,我有幸见证了他从Meta的研究工作到创立Mistral的过程。在这个过程中,我还认识了Arthur Mensch。我一直对他的工作印象深刻,尤其是他在Chinchilla方面的工作,重新定义了高效训练大型语言模型的方法,以及在增强检索语言建模方面的工作,我认为该领域仍未得到充分探索。

现在,让我们深入了解Mistral的独特之处。这家初创公司的愿景是建立一个以一流的开源模型为支撑的生态系统。该生态系统将成为项目、团队甚至企业的发射台,加速创新和对LLM的创造性应用。

以基于人类反馈的强化学习(RLHF)为例。通常情况下,进行RLHF是耗时且昂贵的。它涉及对AI执行的操作进行手动“标记”,这可能需要大量的工作量。只有当AI模型足够有前途,值得投资这样的工作时,这种努力才是值得的。对于像OpenAI这样的大型企业,投资这一过程是有意义的-公司有资源使其工作。但传统的开源社区通常需要“领袖”站出来担当这一重任。

Mistral有机会做到这一点,他们投资于对开源模型进行RLHF。通过这样做,Mistral将为创新开辟一扇爆发性的大门。开源开发者将可以访问经过良好标记的模型,他们可以调整和定制以适应不同的需求。最终的受益者将是更广泛的市场,因为它将比仅靠一家封闭公司所能提供的多得多。

谁拥有最优秀的开源模型,谁就有可能吸引兴趣和价值。我对Mistral押注,因为该团队正在积极推进效率/性能的前沿。他们的团队在破解这个难题方面是世界上最优秀的。

Stanislas Polu,Dust联合创始人:Mistral已经确保了团队和资源,以执行这一最初的愿景,并开发出可以快速替代其他开源模型的更优模型。他们还与合作伙伴合作,对这些模型进行企业级用例的评估。请密切关注Mistral-他们准备向OpenAI发起挑战。

十一、更智能的工业机器人:Sereact

我们经常听到预测,即AI和机器人将在长期内增强或自动化手动任务。如今,这已经越来越成为紧迫的商业需求。

到2030年,欧洲的工龄人口预计将减少1350万人,劳动力成本正以20年来最快的速度上涨。随着电子商务的兴起,仓库的压力比以往任何时候都更大,企业要保持竞争力变得越来越具有挑战性。

在仓库运营的费用中,有55%来自订单拣选,但对于希望转向自动化系统的公司来说,前景并不乐观。我们在AI优先SaaS中所关联的灵活应用,或者在其他领域中看到的大量开源解决方案,在机器人领域还没有出现。

相反,希望自动化拣选和包装的企业不得不选择昂贵且不灵活的机器人解决方案。他们必须应对众多专有接口,这些接口需要大量的编程时间和专业知识。这些系统还难以应对不断变化的产品组合,需要定期人工干预,并且在处理特殊情况时表现不佳。

Sereact解决了这些挑战。他们的软件基于强大的模拟环境,训练机器人手臂了解任何潜在的真实世界情景的空间和物理细微差别。然后,通过实际部署后的持续学习进行优化。这也意味着他们可以解决传统上具有挑战性的物品抓取问题,如电子设备、纺织品、软水果、瓷砖和木材。

最令人兴奋的是,他们的机器人技术堆栈使用大型语言模型(LLMs),实现对机器人的直观自然语言控制。他们开发了一个名为PickGPT的变压器模型,允许用户通过语音或文本向机器人提供指令和反馈。这使得任何人都可以向机器人提供执行所需任务的指令,无论他们的技术水平如何。

Sereact将其联合创始人的两大专业知识相结合。首席执行官Ralf Gulde一直在AI和机器人交叉领域进行研究,而首席技术官Marc Tusher专攻深度学习。这两个人在德国斯图加特大学进行了同行评审的研究,在自动化和工业制造领域是德国最负盛名的大学之一。

尽管是一家年轻的公司,但Sereact已经吸引了一系列令人印象深刻的合作伙伴,包括Daimler Truck、Schmalz、Zenfulfillment、Zimmer Group和Material Bank。这表明拣选和包装行业的巨大潜在市场机会。

除了在电子商务仓库中的明显应用-无论是拣选订单还是拆垛箱-还有一系列其他用例。例如,在传统制造业中,有一个耗时的过程叫做装配套件,它涉及到精心收集组装所需的细小组件。过去,机器人手臂难以抓取小组件,或者在混乱的环境中选出单个零件。Sereact的软件可以识别这些组件,并选择合适的抓取器将其取出。

Nathan Benaich,Air Street Capital常务合伙人:Sereact团队将技术精湛与对客户操作环境的敏锐理解相结合,真诚希望帮助解决劳动力短缺问题,实现高效持续运营。作为第一个将LLMs和拣选从学术可能性转化为实际影响的团队,我对他们执行和扩展真实的机器人挑战者能力有信心。

十二、定制的LLM引擎:Lamini

每家企业都在试图将AI融入他们的业务中。世界上最大的公司认识到AI的潜力,在S&P 500的首席执行官中,有20%的人在2021年第一季度财报电话中提到了AI。大型语言模型(LLMs)可以通过加速客户支持、外部销售和编码等核心功能,显着提高业务效率。LLMs还可以通过基于AI的助理来改进核心产品体验,回答客户问题或创建全新的生成式AI工作流程,从而让客户满意。

鉴于大公司在采用新技术方面通常较慢,我们对企业已经开始迅速使用AI来构建业务感到惊讶。但并不令人惊讶的是,许多企业希望在内部构建自己的AI模型和解决方案。每家企业都拥有大量的专有客户数据,这些数据通常是其核心业务的要塞。这些企业认为将最宝贵的数据发送到基础模型API或具有不确定可靠性的新创企业存在风险。即使数据隐私不是问题,公共LLMs(如GPT-4或Claude)完全是基于开放数据训练的,因此它们缺乏针对企业特定用例和客户群的定制性。

一些科技公司,如Shopify和Canva,已经内部启动了“AI虎队”,使用现成的开源模型将AI融入到适合的业务的各个部分。然而,大多数公司没有资源或经验丰富的AI研究人员来自己构建和部署私有LLMs。他们认识到这一AI浪潮可能是对其业务未来具有转型意义的时刻,但是直到现在,他们不能从中受益或掌控自己的AI发展。

因此,我们对Sharon ZhouGreg Diamos及其团队在Lamini上构建的事物感到非常激动。Lamini是一款LLM引擎,可以让开发人员轻松快速地训练、微调、部署和改进他们的LLMs,并通过人类反馈进行优化。它提供了令人愉悦的开发人员体验,抽象化了与AI模型工作的复杂性,更重要的是,它允许企业在其自有数据上构建AI解决方案,无需雇用AI研究人员,也不会让数据离开他们的私有云。我们在去年秋季首次与Sharon和Greg合作。从那时起,我们就有机会支持这个非常技术化和以客户为中心的创始团队,执行了一个改变企业采用AI方式的雄心勃勃的愿景。

具体而言,使用Lamini部署私有LLM相比使用公共解决方案,有许多好处。由内部工程团队处理构建过程可以保证数据隐私,以及在LLM选择和整体计算和数据堆栈方面的更好灵活性。使用Lamini还可以产生具有较低幻觉、较低延迟、可靠稳定时间和更低成本的模型,而不像现成的API。这些性能优化来自Lamini团队根据数十年的研究和行业经验,在AI模型和GPU优化方面建立的核心技术见解。

James Wu,First Round Capital投资者;Todd Jackson,First Round Capital合伙人:已知的初创公司和大企业已经开始使用Lamini在内部和向客户部署LLMs,他们对部署速度、性能和可靠性感到非常满意。在未来,我们相信每家企业都会将AI应用于其业务和产品,但只有少数公司将拥有专门的AI团队。Lamini是正在平衡竞争优势,帮助所有公司利用这项变革性技术的初创公司。而且,由于最近与Databricks的合作,现在公司更容易通过在现有的Databricks数据湖和计算集群上设置Lamini来运行其AI解决方案。

十三、你的编程“机器人”:Factory

如果你想让计算机为你做事情,今天你必须将你的思想转化为“计算机语言”-一种编译器能够理解的超文字代码。成为一名工程师就是要扭曲你的大脑,让它像一台机器一样思考。但是我们正在达到一个转折点,人工智能可以将人类语言翻译成代码。从人类工程师到数字工程师的过渡,很可能是我们一生中最重要的技术转折点之一。

我们还处于这个过渡的初级阶段。像BabyAGIAutoGPT这样的AI代理已经激发了公众的想象力。但是,尽管像Github Copilot这样的编程助手代表了一步进步,它们仍然非常有限-主要是作为已经在代码中实现的想法的自动完成。

Factory则不同。这家公司由Matan GrinbergEno Reyes于2023年创立,前者是一名前弦理论物理学家,后者是一名机器学习工程师。当我见到Matan时,他的愿景立即吸引了我,他展望未来,工程师们可以委托繁琐的任务,专注于解决困难的问题,使构建事物成为一种乐趣。为此,Matan和Eno创造了自主编码的“机器人”。

机器人是可以处理常规任务的AI工程师,例如代码审查、调试和重构。与现有产品不同,Factory的机器人是无干预的-它们可以独立地审查代码,解决错误并回答问题。你还可以像对待初级开发者一样使用你的机器人,利用它们来进行头脑风暴并卸载功能性工作。机器人有强大的防护措施:它们将智能定向于用户需求,不太容易“产生幻觉”错误答案。

代码生成将成为人工智能革命中最具变革性的领域之一。而Factory拥有一切必要的工具来取得成功。

1、团队。Factory的首席执行官Matan在普林斯顿大学从事弦理论物理学研究,想象了黑洞的奇点。Eno在Hugging Face担任机器学习工程师,亲自处理乏味的工程过程。这是一个独一无二的团队。

2、实用性。虽然机器人目前还不能像人工程师一样表现得那么好,但它们非常适合工程师讨厌的任务。将乏味重复的工作交给它们吧。

3、速度。Factory在短短几个月内构建了一些了不起的东西。而其他人想象了AI工程师,Matan和Eno则着手开发了它们。他们正在迅速改进已经是一款非常优秀的产品。

人类的故事是将重复性工作卸载出去,让我们可以转向更复杂的任务。当人类发明农业时,它释放了我们建设城市的能量。工业革命后,我们建造了把我们带到月球的火箭。下一代节省任务的方法将是数字化的-使人类摆脱在线繁琐的工作,进一步推动技术前沿。

Markie Wagner,Delphi Labs创始人兼首席执行官:当唯一的限制是我们的想象力时,我们下一步要建造什么呢?

评论

所有评论

推荐阅读

  • Cointime 5月4日要闻速

    1. Base链上Gas总消耗量突破1万枚ETH

  • 普华永道中国与香港Xalts达成合作拟探索区块链和代币化商业机会

    据普华永道香港官方网站披露,普华永道中国(PWC China)已与香港Xalts达成合作拟探索区块链和代币化商业机会,Xalts是一家代币化可编程资产基础设施提供商,助金融机构以高效且可扩展的方式实施代币化和可编程资产应用,据悉普华永道与Xalts之间的合作正值香港金融管理局 (HKMA) 推出批发央行数字货币 (wCBDC) 试点项目 Project Ensemble之际,普华永道称已看到了可编程资产为金融服务行业带来重要创新的巨大潜力,包括批发支付和贸易融资。

  • Blockchain Asset Management宣布为合格投资者推出一支专属区块链基金

    规模达1亿美元的加密货币基金Blockchain Asset Management宣布推出为合格投资者推出一支专属区块链基金,目前暂未披露该基金的具体募资金额,但据称其规模已达到“8位数”,即千万美元级别。此外,新基金的投资门槛为10万美元,并要求所有投资者都符合认可标准(年收入超20万美元,净资产超100万美元)。

  • 雷诺旗下BWT Alpine F1车队宣布与ApeCoinDAO达成合作

    雷诺旗下BWT Alpine F1车队在X平台发文宣布宣布与ApeCoinDAO达成合作,只在将APE引入Alpine F1生态系统,并联合全球代币持有者,以及推出首ApeCoin启发的周边商品和数字资产。据悉根据双方合作内容称,未来BAYC NFT或将可以穿上带有Alpine车队LOGO的装备和服饰。

  • 四月Solana链上NFT销售额略高于1.5亿美元,创年内迄今最低水平

    据Cryptoslam数据显示,四月Solana链上NFT销售额略高于1.5亿美元,达153,304,602.45美元,创2024年内迄今为止的最低单月纪录,上月Solana链上NFT交易量约为218万笔,同样创下年内迄今最低水平,其中独立卖家地址约25万个,独立买家地址约48.7万个。

  • BTC突破63000美元

    行情显示,BTC突破63000美元,现报63014.9美元,日内涨幅达到6.11%,行情波动较大,请做好风险控制。

  • Base链上Gas总消耗量突破1万枚ETH

    据链上分析平台Dune Analytics数据显示,Base链上Gas总消耗量已突破10000枚ETH,本文撰写时达到10,839.5062枚ETH(按照当前价格计算超过3360万美元),平均Gas使用金额约0.1754美元(0.000059661 ETH),总区块数量触及1341万个,每个区块的平均交易量约为14.63笔。此外,数据显示Base链上总交易量已超过1.962亿笔,用户数量超过836.6万,用户交易量已超过1.84亿笔,本文撰写时达到184,403,451笔。此外,Base链上已创建的合约总量已超过了6400万份,当期触及64,056,573份。