Vectara发布基于升级版Hughes幻觉评估模型的事实一致性评分,以提高生成式人工智能响应的透明度

公司 文传商讯

Vectara在其无服务器RAGaaS平台上推出了由其广受欢迎的开源Hughes幻觉评估模型提供支持的事实一致性评分,这一业内首创通过提供详细的准确性和幻觉评估,提高了人工智能响应的透明度和用户控制能力。

加州帕罗奥多–(美国商业资讯)–广受信赖的生成式人工智能产品平台Vectara宣布为所有生成式响应加入基于开创性Hughes幻觉评估模型(HHEM)进化版本的事实一致性评分(FCS),HHEM是Hugging Face上排名第一的幻觉评估模型,自去年11月发布以来已获得超过10万次的下载量。与之相关的大模型幻觉率排行榜现已成为大型语言模型(LLM)衡量其平均事实一致性的行业标准。Vectara的端到端检索增强生成即服务(RAGaaS)平台作为行业首创,通过提供实时端到端RAG可观察性,为生成式人工智能响应透明度设定了新标准。这一创新指标为Vectara RAGaaS平台内汇总响应的事实一致性提供了前所未有的可见性,使用户能够根据详细的准确性评分设置个性化的响应可接受度阈值。

市场上LLM的平均幻觉率从3%至16.2%不等,其响应中存在的未知不准确性风险仍是一个主要问题,阻碍了这一强大技术在企业中的广泛应用。Vectara通过提供事实一致性评分,对生成的响应是否是幻觉的可能性进行评分,从而为企业降低了这种不确定性。只有采用标准化、科学计算的方法对响应进行分级,企业才能负责任地将生成式人工智能引入到关键业务应用中。用户能够根据详细的准确性评分设置响应可接受度阈值,从而使产品团队能够根据自己的偏好灵活处理这些信息。

Vectara的事实一致性评分是生成式人工智能的开创性工具,为实时幻觉检测设定了新基准,并具有卓越的性能、可负担性和速度,标志着在信任方面的重大飞跃。其高效性和有效性使企业能够将生成式人工智能部署到关键产品用例中,而不必担心幻觉响应可能导致的责任风险。

Vectara的事实一致性评分使开发人员有能力完善和增强从内部问答系统到与终端消费者的互动质量等各种应用。该评分的优势在于其校准性,使其可直接解释为概率,例如,0.98分表示事实一致性概率为98%。这与许多当代的机器学习分类器形成了鲜明对比,后者无视校准,从而牺牲了清晰度和直接可解释性。

Yobi应用程序创始人兼首席执行官Ahmed Reza表示:“将Vectara的事实一致性评分整合至Yobi应用程序中,将彻底改变我们处理人工智能透明度和准确性的业务用例。通过保证我们平台所提供答案的可见性和问责制,我们将坚守提供企业可信赖的负责任人工智能的承诺。作为Vectara的联合创新合作伙伴,我们很高兴看到如此先进的技术直接融入Vectara平台。”

先进的HHEM为事实一致性评分提供了比之前发布的开源版本更强的可视性,具有更高的准确性和更广泛的语言支持。该方案是Vectara致力于提高透明度和控制力的一部分,使企业能够自主有效地管理人工智能响应。

Vectara联合创始人兼首席执行官Amr Awadallah表示:“正如我们在早期率先采用RAG来提高生成内容的相关性和质量一样,我们再次站在了负责任人工智能的最前沿,完全公开我们为降低生成式人工智能中的幻觉所做出的努力。通过让客户能够实时访问事实一致性评分,我们不仅建立了信任,而且还移交了控制权,帮助他们在如何利用RAGaaS平台生成的响应这一问题上做出明智的决策。”

关于Vectara

Vectara是一个端到端平台,可将强大的生成式人工智能功能嵌入到应用程序中,从而取得非凡成果。Vectara作为端到端检索增强生成(RAG)平台,能够通过安全可靠的可信入口点,提供通往正确答案/行动的最短路径。Vectara从未利用客户数据训练其模型,因此企业在嵌入生成式人工智能功能时无需担忧数据和隐私侵权风险。如需了解更多信息,请访问vectara.com

✽本文转载自互联网,请读者仅作参考,并自行核实相关内容(BW)。

慕尼黑和印度孟买--(美国商业资讯)--全球技术咨询和数字解决方案公司LTIMindtree [NSE: LTIM, BSE: 540005]已与Vodafone达成合作,后者是全球物联网(IoT)托管领域的领导者,在全球拥有超过1.75亿…
欧洲领先的数字化转型咨询公司壮大了Kinaxis不断扩展的全球业务版图 安大略省渥太华和慕尼黑--(美国商业资讯)--端到端供应链协调领域的全球领导者Kinaxis® Inc. (TSX:KXS)今天欢迎其最新的系统集成商(SI)合作伙伴、…
Kiani将于周三在第六届全球患者安全部长级峰会上发表演讲,探讨基于人工智能的医疗解决方案如何为临床医生赋能并改善患者安全 智利圣地亚哥--(美国商业资讯)-- Masimo (NASDAQ: MASI)今天宣布,公司创始人兼首席执行官Jo…
圣迭戈--(美国商业资讯)-- TradeSun与Wells Fargo达成协议,Wells Fargo将利用TradeSun业界领先的贸易金融与合规数字化解决方案,采用人工智能(AI)和其他先进技术,简化全球银行业复杂的人工流程。 Tra…
中信证券1月31日发布评级报告,首次覆盖中烟香港,给予“买入”评级。报告称,鉴于公司独家经营的市场地位、业绩高确定性和标的稀缺性,综合DCF 模型及相对估值,判断公司合理市值为约87亿港元,目标价13港元,对应2024年15xPE。 研报指…
  • 公司
  • 2月1日
  • 每日财经网