登录客服
使用财视扫码登陆 中金二维码

下次自动登录

登录
忘记密码?立即注册

其它账号登录:新浪QQ微信

手机网
首页>>港股>>市场分析>>  正文
精华推荐 财经号
博客 直播

热点精选:农业科技+机器人+有色金属+CPO

海西一狼:关注反弹一个重要阻力区域!

商业观察:化肥工业上市公司汇总(附股)

反弹是部分品种减仓机会探底回升重返整理格局

柳哥财经:行情以退为进,4000点是新机会

热点精选:低空经济+数字货币+保健品+城建概念

海西一狼:信号出现,来个大胆分析!

  • 徐小明 天赢居 寒江钓客 洛阳上官 幽兰行天下
  • 老孙头谈股 秦国安 龍哥论市 蒋律 股海潜蛟
  • 山东虎子 牛家庄 孔明看市 A炼金师 先知窝窝
  • 灵枝 旗帜先明 短线高手 牛传千股 龙头1988
  • 鸿牛 短线王 律动天成 海西一狼 五域论湛
  • 狗蛋 李博文 波段龙一 股市猎枪 涨停板老黄
  • MORE图说财经

    国联民生证券:模型单位成本重要性不断提升 多模态与“视觉执行”走向前台

    2026-02-04 14:53:02 来源:智通财经 已入驻财经号
      

    智通财经APP获悉,国联民生证券发布研报称,在传统对话范式下,单次交互仅需少数几次模型调用;但在工作流范式下,一个任务往往横跨计划、检索、工具调用、校验纠错及外部系统写入等多个阶段。相较基础聊天,面向复杂任务的agent服务可能会消耗数十倍多的token,模型单位成本的重要性在不断提升。Agent时代,大模型正从“聊天工具”进化为“自主员工”。掌握核心算法与行业接口的大模型厂商有望深度受益于万物智能化的红利,建议关注“大模型双子星”MiniMax-WP(00100)与智谱(02513)。   

    国联民生证券主要观点如下:

      

    事件:截至2026年2月2日,Clawdbot在代码托管平台GitHub上的星标数量已超过13万个,官网累计访问量突破200万人次,成为近期增长最快的开源技术项目之一。以及近期出现的“AI-only社区”如Moltbook,该平台在极短时间内聚集了百万个代理账号规模,这类交互天然对应更高的请求密度与更频繁的API触发。其最直接的外显变量是API调用频次与token吞吐的阶跃式抬升。在Clawdbot创始人Peter   Steinberger的力荐下,国内AI独角兽MiniMax旗下擅长长文本与逻辑推理的M2.1模型被成功带火。

      

    模型单位成本的重要性在提升

      

    在传统对话范式下,单次交互仅需少数几次模型调用;但在工作流范式下,一个任务往往横跨计划、检索、工具调用、校验纠错及外部系统写入等多个阶段。这导致模型调用频率、上下文长度及中间信息的复杂程度倍增。多步推理与多轮工具调用天然带来“多回合上下文”,同时重试与自纠错会额外产生无效token。相较基础聊天,面向复杂任务的agent服务可能会消耗数十倍多的token。

      

    因此“模型的单位成本×单位产出”就变成了Agent类产品能否规模化落地的“生死线”——因为在执行任务时,多轮推理与工具协同将会把成本线性放大。正因如此,Clawdbot的创始人会直言推荐MiniMax,其M2.1模型的“兼具效率与成本的优势、长文本能力强、推理与编程能力”的特点符合当下众多用户的需求。

      

    兼具效率与成本:M2.1模型旨在通过极致的成本优势解决当前开发者在自动化编程中面临的高昂token成本痛点,其定价体系约为Claude   Sonnet的8%。且Coding   Plan创新性地引入“每5小时重置额度”的高频刷新机制,打破了行业通用的按天或按月限额模式,释放了高频重度开发场景下的生产力。计费模式上,不同于底层大模型厂商通用的token按量计费(Pay-as-yougo)逻辑,公司转而采用分层月度订阅制。

      

    长文本能力强:真实的工作流里,持续演进的上下文通常包含工具调用、历史信息、检索片段、约束条件等等。M2.1的长文本能力让它更适合完成“持续记忆”,即读更长的文档、容纳更多中间结果、减少因截断导致的逻辑断裂。

      

    推理与编程能力:在Clawdbot这种强调自动化执行与纠错闭环的产品里,模型被用于写代码、改代码、做判断、做校验。M2.1在推理与编程能力上的“够用且性价比极高”,使它成为最适合被放进生产系统、被高频调用的选择。

      

    国联民生证券指出,在Agent时代,“谁更聪明”固然重要,但更重要的是“谁能以更低成本把强能力变成高频可用的生产力”,这是MiniMax的优势所在。

      

    多模态与“视觉执行”走向前台

      

    Agent进入办公与生产场景后,输入不再主要来自纯文本,而大量来自截图、PDF、表格、图表、界面元素等视觉信息。在Clawdbot这种“能执行”的工作流里,用户不仅输入结构化文本,同时也伴随着截图、网页界面、报错弹窗、表格/图表或PDF页面等。

      

    MiniMax的多模态能力辅助Agent更好地理解界面、提取关键信息、输出可执行的步骤/代码、再用截图回读做校验纠错。这让Clawdbot可以做“视觉驱动的自动化”:例如识别表格字段后自动填表、读报错截图后定位原因并改脚本、从图表中抽数并写入报告、对比前后截图确认任务是否真正完成等等。MiniMax凭借自己的多模态能力,能更好的完成服务的闭环、减少人工转述、快速纠错,达到更强的可交付性。

      

    风险提示

      

    技术路线变革具有不确定性;行业竞争加剧。

    该信息由智通财经网提供

    热门搜索

    为您推荐