博客

技术分享

什么情况下不适用 LLM 和 Gen AI

2024.11.08 21分钟阅读

生成型人工智能并不总是最佳选择

 

多年来,深度学习和人工智能已经成为生成型人工智能和大型语言模型的代名词。它的普遍性使得任何提及人工智能的地方都等同于主导对话的 GenAI 和 LLM。不应低估语言模型和创造性人工智能的突破性能力和对创新的影响。

虽然它们的能力是深远的,但我们不禁要认识到生成型人工智能无效的一些用例。反而早期经典的、深度学习 AI、机器学习或基于规则的算法似乎更适合。

生成型人工智能和 LLM 擅长什么?

 

GenAI 和 LLM 擅长文本生成、摘要、对话式 AI、知识发现以及其他情况,在这些情况下,它所训练的数据可以以更易于理解的输出提供给用户。另一种思考 GenAI 和 LLMs 的方式就像百科全书,它有丰富的信息,可以在提示时反馈给你。

但是,有了这么多的知识,GenAI 和 LLMs 有时会在不同的主题之间混淆。这就是为什么检索增强生成可以通过为初始提示提供额外的上下文来增强生成型人工智能,以开发更好的响应。

然而,由于 GenAI 通过引用其知识库或训练数据来创建独特的响应,因此它们并不是解决每个问题的最佳选择,尤其是需要精确或推理的工作负载。

生成型人工智能不是最佳选择的3个用例

 

生成型人工智能非常适合生成文本、解释主题和总结,但在精度、数据关系、预测等方面存在困难。我们将介绍几个常见的人工智能用例,其中 GenAI 不是主要引擎,并提供哪些机器学习方法更适合手头的任务。

  1. 智能商业的数据分析

 

在结构化数据分析中,手动或自动设计特征的能力至关重要,这对于使用人工智能通过预测、规划和决策做出业务决策至关重要。特征是影响输出或决策的特定属性或变量。

为什么生成型人工智能不适合数据分析和预测:

  • 数值精度:数据分析需要基于历史数据进行精确的数值预测。生成型人工智能更适合内容创作,但可能缺乏做出可靠定量预测所需的精度。

     

  • 时间依赖性和优化:预测通常涉及了解时间模式和随时间变化的趋势,因此 ARIMA(自回归综合移动平均)、LSTM(长短期记忆)和其他时间序列模型等模型是专门为捕捉这些时间依赖性而设计的,这些时间依赖关系会生成未优化的模型。规划和决策涉及优化算法,其中 GenAI 在导数和数学方面还不够好,不够有效。

     

  • 可解释性和一致性:在数据分析中,特别是在金融或运营等领域,解释和解释预测的能力至关重要。传统的预测模型提供了更一致和可解释的结果,而生成模型可能会引入不必要的可变性。

 

在规划和决策中,优化问题很常见,例如最大化收入、最小化成本或有效分配资源。虽然 LLM 可以分析文本数据中的模式,但它们并没有针对检测或利用结构化数据中的这种关系进行优化。阅读Snap Finance利用机器学习来区分他们对消费者融资的信用评估:

数据分析和预测任务要求模型具有很强的数值精度、对时间趋势的理解和清晰的可解释性,这使得ARIMA、LSTM 和其他专业模型比生成型人工智能更适合。

2. 分割和分类

分割和分类任务通常更适合用于图像数据或决策树的卷积神经网络(CNN)和用于结构化数据的支持向量机(SVM)。这些模型擅长以精确和结构化的方式识别模式和区分类别。

为什么生成型人工智能不适合分割和分类:

  • 精度和边界检测:分割和分类任务需要精确识别边界和明确区分类。专注于创建新内容的生成型人工智能可能会引入可变性或缺乏这些任务所需的清晰度。

     

  • 任务特定优化:CNN 是专门为图像分割和分类等任务设计的,优化了区分不同片段或类别的准确性。生成模型不是为这种特异性水平量身定制的。

     

  • 可解释性和一致性:分割和分类通常需要清晰、可解释的结果。生成模型可能不太一致,更容易产生模糊的输出,当目标是可靠地对数据进行分类或分割时,这并不是我们所想要的结果。

 

你可能想知道为什么你可以让 LLM 聊天机器人识别图像中的对象。GenAI 不是主要引擎,而是采用计算机视觉模型进行预测,并将数据反馈给聊天机器人,然后聊天机器人生成输出响应。

虽然生成模型可以产生类似于输入数据的输出,但它们并没有针对需要类或段之间明确边界的任务进行优化。他们对生成而非区分的关注可能会导致分割和分类场景中的结果不准确或不可解释。

3. 推荐系统

推荐系统通常更适合于专门为分析用户项目交互而设计的算法,如协同过滤、基于内容的过滤或矩阵分解技术。这些方法经过优化,通过识别用户行为和项目属性的大型数据集中的模式和相似性来预测用户偏好。

为什么生成型人工智能不适合推荐系统:

  • 精确性和特异性:推荐系统需要用户偏好和项目之间的精确匹配。旨在创建或生成新内容的生成型人工智能模型可能会引入可变性或噪声,从而降低推荐的准确性。

     

  • 可扩展性和效率:推荐系统通常需要扩展到数百万用户和项目,其中效率是关键。传统的推荐算法针对这种规模进行了优化,而生成模型可能需要更多的资源。

     

  • 数据结构:推荐系统最适合结构化数据(例如用户评级和购买历史),其中算法可以利用模式和相关性。生成型人工智能模型本身并不是为了高效地处理这种结构化的表格数据而设计的。

     

总之,虽然生成型人工智能可用于生成个性化内容或产品描述等任务,但传统的推荐算法,如协同过滤、矩阵分解或混合模型,通常更有效地基于用户-项目交互提供准确高效的推荐。

 

总结

生成型人工智能和 LLM 虽然是人工智能领域最热门的话题,但它并不是我们应该关注的唯一。可以收集数据并用于预测的传统机器学习模型和算法总是最适合专门的模型。

然而,为了分发和呈现这些数据,GenAI 和 LLM 可以帮助将研究结果整理成易于理解的文本。世界是建立在文字和文本之上的,因此将复杂的数据关系翻译成易于理解的摘要可以节省时间并提高生产力。

在与客户讨论人工智能及其用例时,我们一般会询问他们对生成型人工智能和 LLM 的看法。 文中的 Snap Finance 是一家从事信用评估的金融科技公司,它部署了机器学习算法来评估借款人接受信用评分以外因素的风险。由于工作负载取决于时间动态和数据关系,LLM 和 GenAI 不适合。

在决定生成型人工智能是否是一个合适的模型时,您可以参考以下一些范围的验证问题:

  1. 结果是否需要一致性和精确性?

  2. 您需要执行任何优化吗?

  3. 您是否需要定义如何读取/解释数据的规则

  4. 你的模型是否负责得出基于数据的结论

 

无论是运行生成型人工智能、LLM 模型还是任何其他人工智能算法,拥有强大的计算基础设施对于平稳运行都是必不可少的。就像选择合适的模型来训练人工智能模型或开发机器学习算法一样,选择适合您预算和需求的适配硬件。

相关贴子

敬请登记。

登记
本网站受 reCAPTCHA 保护,适用 Google隐私政策和服务条款。