中小型AI模型受到企业青睐

企业在慢慢转向部署更多AI用例的同时,也面临着对这种昂贵技术控制成本和回报的压力。

图片来源:Andy Barton/Zuma Press

WPP的首席技术官Stephan Pretorius说,随着范围的扩大,大模型的成本很快就会失控。

图片来源:WPP

Google Cloud全球生成式AI产品上市策略副总裁Oliver Parker表示,在过去三个月里,他已经看到企业转向中型模型,部分原因是这些模型符合捕捉更多企业用例的标准。

非银行抵押贷款服务商和发起人Mr. Cooper首席信息官Sridhar Sharma说,Mr. Cooper正在其呼叫中心测试中型模型的功能,以分析语音数据,帮助座席人员了解对话的可能走向,以及客户可能会问的问题。

Sharma说:“我们不需要仅仅因为某个东西更大就对其进行过度设计,”并称Mr. Cooper也在使用大型基础模型来处理更复杂的用例。

到目前为止,道明银行(TD Bank)一直在使用GPT-4等OpenAI的GPT系列模型和其他模型来帮助呼叫中心工作人员更快地回答客户咨询。道明银行首席AI科学家Maksims Volkovs称,该行最近还与AI模型提供商Cohere签订了合作协议,将研究是Cohere的小型模型还是中型模型在该用例和其他用例中更有效、更具成本效益。

Volkovs说,他将从成本、准确性和延迟方面对Cohere的模型和OpenAI的产品进行评估。Volkovs说,他预计中型模型将在某些情景下胜出。

他说,在准确性和成本之间进行权衡应该更有利。

营销服务公司WPP的首席技术官Stephan Pretorius说,一些企业一年前还倾向于使用少数大模型。他说,当企业在有限的试点范围内使用大模型时,这种做法还算不错,但现在随着范围的扩大,大模型的成本很快就会失控。WPP正在使用谷歌Gemini系列中的几个模型,包括中型模型Flash。

Flash适合用于分析不同国家的购物习惯,并利用分析结果为给定产品撰写合适的网络文案。例如,在英国销售的睫毛膏的文案最好能突出防水功能。撰写这样的文案正是中型模型大显身手之处,Pretorius说。

Pretorius说,对于需要海量数据、创造力和进行解释的复杂用例,大模型仍然具有实用价值。他举例称,大模型适用于读取莎士比亚(Shakespeare)的所有作品,并分析女性角色与男性角色在不同时期的对比情况。但这并不在WPP的任务清单上。