SERVICE PHONE
13988889999发布时间:2026-01-28 23:16:55 点击量:
昨天下午,Kimi 的朋友跟我说:K2.5 发了。开始没当回事,想当成个快讯发一下,
行业国产头部旗舰模型里,Kimi 首先突破了多模态这一关,并且实践得非常好
质感Kimi 用这张答卷,回归到了那个有品位、有艺术、更有技术的天才少年形象
在过去的半年中,国内持续发旗舰模型的「非大厂」「非 DeepSeek」就三家:智谱、MiniMax、Kimi。它们的最新模型里,只有 Kimi 真正支持了多模态
K2.5 在 K2 基础上继续训练了约 15T 混合视觉-文本 tokens,原生多模态架构。能直接从视频输入生成代码,不需要额外的视觉 MCP
那篇文章用的就是 Kimi 的 API 作为示例,因为真的喜欢当时的质感,就是一种...难以名状的...学术偶像?
但后来,慢慢的,质感变了。海量广告投放、各种 Marketing 狠活....我有点疏远了。不是说营销不好,只是觉得那不太像最开始认识的那个 Kimi
这个与模型无关,但在我看来,是这种气质回归的一个最典型的特征,现在打开网站,它显示的内容和 GitHub 开源的网站是完全一样的:moonshotai.github.io
一家公司能把主页做成这样,让开发者、让专业人员感到舒服,这在全世界都少见
然后,就看到了吾等开发者们,无论小齿佬还是大技霸,都兴奋了起来,Twitter Tech 榜一骑绝尘
我用 Agent 调用的时候报错了。打开 F12 找报错记录,准备联系 Kimi 的朋友看看是不是通路问题
然后发现,报错信息里直接标出了当前访问场景的 ID这种细节,让人感觉他们是真的在用心干事
在 Kimi 的 Agent 产品里,最近更新了一个「Agent 集群」,说白了就是一堆 Agent 一起干活。技术上叫Agent Swarm,最多 100 个子智能体,1500 个并行工具调用,运行时间最高缩短 4.5 倍。目前是 Beta,会逐步开放
对于虚拟出来的 Agent,我总觉得有点恶趣味,比如给我写代码的程序员叫「狄柯」
还有一个细节:在 Agent 模式下,如果它需要一张图片作为背景或插图,会自己画一个。不知道具体用的什么模型,但这个功能确实顺滑
官方给了一个更复杂的例子:投喂 40 篇心理学和 AI 的论文,Kimi 先通读一遍,然后衍生出几个子 agent 分别负责不同章节,最后主 agent 把关验收,生成一份几十页的 PDF 综述
用 AI 生成的网站往往都是同一种风格。你一眼就能看出来这是 AI 做的。配色、布局、动效,有一种很难形容的「AI 味」
K2.5 生成的东西不太一样,举个例子:我拿它给 AGI Bar 做了个品牌网站
给它的 prompt(大致上):温暖的科技感,充满智识上的玩味但绝不冰冷。深炭灰主导,琥珀金黄强调,气泡泡沫图案充当数据可视化的隐喻
最后,效果超预期,真的实际可用,然后我真的把它部署到了agi.bar(考虑到 DNS 缓存,有些地区可能现在就能刷到了,最迟 24小时)
这里再放几个官方 Case,我都很喜欢,以下这些,都是仅凭单条 Prompt 实现的
然后也可以传个录屏进去,K2.5 用干净专业的代码,从头到尾复现,讲道理,「从视频,直接到完美网页」,这种体验在其他模型上,是前所未有的
长程 Agent 场景下,指令遵循经常出问题。整体体感依然无法达到海外主流模型的水平
与海外的代差在这里,这个谁也否认不了。可能再给 3 到 6 个月,能追上现在的海外主流
公众号后台的光标,走走停停中间还专门给这篇文章,写了个样式,让它更像 MoonShot 的风格
一边写就会有新的想法,一边尝试又在 Kimi 里找到了更多印证,真的,满怀期待,将话筒交给未来吧
