中小型AI模型受到企业青睐

2024年7月18日12:12 CST

WPP的首席技术官Stephan Pretorius说，随着范围的扩大，大模型的成本很快就会失控。

图片来源：WPP

Google Cloud全球生成式AI产品上市策略副总裁Oliver Parker表示，在过去三个月里，他已经看到企业转向中型模型，部分原因是这些模型符合捕捉更多企业用例的标准。

非银行抵押贷款服务商和发起人Mr. Cooper首席信息官Sridhar Sharma说，Mr. Cooper正在其呼叫中心测试中型模型的功能，以分析语音数据，帮助座席人员了解对话的可能走向，以及客户可能会问的问题。

Sharma说：“我们不需要仅仅因为某个东西更大就对其进行过度设计，”并称Mr. Cooper也在使用大型基础模型来处理更复杂的用例。

到目前为止，道明银行(TD Bank)一直在使用GPT-4等OpenAI的GPT系列模型和其他模型来帮助呼叫中心工作人员更快地回答客户咨询。道明银行首席AI科学家Maksims Volkovs称，该行最近还与AI模型提供商Cohere签订了合作协议，将研究是Cohere的小型模型还是中型模型在该用例和其他用例中更有效、更具成本效益。

Volkovs说，他将从成本、准确性和延迟方面对Cohere的模型和OpenAI的产品进行评估。Volkovs说，他预计中型模型将在某些情景下胜出。

他说，在准确性和成本之间进行权衡应该更有利。

营销服务公司WPP的首席技术官Stephan Pretorius说，一些企业一年前还倾向于使用少数大模型。他说，当企业在有限的试点范围内使用大模型时，这种做法还算不错，但现在随着范围的扩大，大模型的成本很快就会失控。WPP正在使用谷歌Gemini系列中的几个模型，包括中型模型Flash。

Flash适合用于分析不同国家的购物习惯，并利用分析结果为给定产品撰写合适的网络文案。例如，在英国销售的睫毛膏的文案最好能突出防水功能。撰写这样的文案正是中型模型大显身手之处，Pretorius说。

Pretorius说，对于需要海量数据、创造力和进行解释的复杂用例，大模型仍然具有实用价值。他举例称，大模型适用于读取莎士比亚(Shakespeare)的所有作品，并分析女性角色与男性角色在不同时期的对比情况。但这并不在WPP的任务清单上。