图 摘要作业的 控制台输出

Comprehensive data collection focused on Saudi Arabia's information.
Post Reply
suchona.kani.z
Posts: 115
Joined: Sat Dec 21, 2024 6:15 am

图 摘要作业的 控制台输出

Post by suchona.kani.z »

图 Do Khac 等人 (2022) 的章节,法律与“权利”之间的紧张关系示例摘要

我将这些文本部分输入到机器摘要中(参见图 5 中的“提示”),并将中间摘要(参见图 5 中的“摘要”)拖到下一个摘要中。
通过这种方法,可以假设代币数量非线性增加,并且成本与之相关。在具有许多事件的业务应用程序中,这可能成为一个重要的成本因素。我试图在下表中说明这一点。在这里,我们看到了三个迭代,每个迭代都使 丹麦 whatsapp 数据​ 用滑动提示(参见上图)和非滑动提示进行推断。尽管我没有对其进行标准化(这肯定会更清晰但不太现实),但您可以看到滑动提示在第二次迭代中添加了 33 个额外标记,在第三次迭代中添加了 150 个额外标记。可以使每个摘要的标记保持稳定,但这不会添加更多信息。我的结论是,这种方法会导致成本非线性增加。

挑战:处理时间和幻觉
从上一节你已经可以猜到,滑动摘要不仅可能会很快变得更加昂贵,而且还会带来最大的处理速度。由于每个总结都必须被接管到下一个工作步骤中,因此并行化实际上是不可能的。要总结的文本越长,可能的迭代次数就越多,这反过来又增加了总体运行时间。

自巴德营销活动失败以来,幻觉一直是法学硕士的一个已知问题。这是不正确信息的复制。语言模型存在将输入文本中不存在的内容添加到摘要中的风险。一种可能的解决方法是检查生成的摘要是否实际上可以通过输入内容的激活来生成。使用要定义的阈值,可以将低激活的摘要排除在进一步处理之外,并且可以降低产生幻觉的风险。

当与客户一起定义合适的摘要时,需求工程可能会非常令人兴奋。绩效无法从法学硕士背景窗口的大小中得出,并且成本可能会迅速呈指数级增长。在这篇博文中,我解决了一些要求和情况,在第二部分中,我将介绍技术挑战和我们的工业化解决方案建议。

您想了解更多关于 adesso 世界中令人兴奋的话题吗?那么请看一下我们之前发布的博客文章。


Lilian Do Khac 参与数据驱动决策支持人工智能解决方案的构思和实施。值得信赖的人工智能需求在这里发挥着重要作用。她不仅从 IT 实施的角度,而且作为一名科学家,活跃在这一领域。
Post Reply