200万上下文!月之暗面Kimi又长长长了,一次处理500个文件,还能读懂甄嬛传了 siyushenqi.com • 2025 年 8 月 13 日 下午11:07 • 海外营销 • 阅读 84 月之暗面的路线是,无损上下文长度是每一扇门的钥匙。 成立一年,拿了大把融资,大模型“长文本路线”代表人物月之暗面(Moonshot AI)现在最关心的是什么? ——依然是“长”。 去年10月,月之暗面发布支持20万汉字输入的Kimi智能助手(下简称Kimi),彼时Claude-100k支持约8万字,GPT-4-32k支持约2.5万字。Kimi是全球市场上能够产品化使用的大模型服务中最长的上下文输入长度。 20万字的“胃口”,现在变成200万了。 这是什么概念呢。举个例子,目前微信读书上单本超过200万字的作品只有5部。 会议室里,月之暗面 AI Infra负责人许欣然拿出了一个全本《倚天屠龙记》的复印版本——A4纸打印,叠起来几乎有一瓶350ml的怡宝纯净水的一半高,约100万字——还有一整个《甄嬛传》剧本,现在的Kimi Chat一次可以吃掉这俩。 一本《倚天屠龙记》的厚度 图源:硅星人 这意味着什么? 如果把上下文长度理解成大模型的“精力”,那么现在Kimi能够一口气精读500个甚至更多数量的文件,帮助用户快速分析所有文件的内容,并且支持通过自然语言进行信息查询和筛选。在Kimi还是20万字输入长度的时候,它的能力界限还在50个文件左右。 比如你可以直接扔给Kimi 500份简历,然后让它把其中符合要求的人初筛出来。 图源:月之暗面 每个文件也可以长一点。 英伟达GPT大会又要开场了,如果需要一些背景知识,你可以把英伟达过去几年的完整财报一次性扔给Kimi,让它成为一位临时的英伟达财务研究专家,来帮你分析总结英伟达历史上的重要发展节点。 图源:月之暗面 甚至你可以把LLM库的源代码直接给Kimi,然后你将会收获一个大概懂大模型是怎么回事的同事——它了解这个代码库里的所有细节,还能快速梳理出代码的结构。 图源:月之暗面 “有个1万小时定律,意思是投入1万小时的话在任何领域你都会成为一个专家,我们希望Kimi可以用10分钟完成同样的事。”许欣然说。 当然它也能做些不那么严肃的事,比如刚才提到的《甄嬛传》。 当我把全集几十万字的剧本传给Kimi, 然后提问剧本中有哪些细节表明甄嬛的孩子是果郡王的。Kimi竟然能在不同时间段、各个场景的故事情节里把甄嬛、果郡王的情感线以及关于孩子的真相理顺,堪比一个看了好几十遍电视剧的“甄”学家。 图源:月之暗面 SimilarWeb数据显示,去年12月Kimi的周访问量还在10万次上下,到了1月下旬才突破40万,但是从春节开始访问量疾速攀升,到现在周访问量已经超过160万次。 然后Kimi收到的用户反馈也越来越多,从这些反馈来看,20万字很长,足够做很多更有价值的事——但还不够长。在尝试更复杂的任务,解读更长的文档时依然会遇到对话长度超出限制的情况。这也是Kimi的上下文长度需要继续提升的一个直接原因。 月之暗面相信长文本技术是大模型“登月计划”的第一步,关于大模型幻觉的问题,实用价值低的问题,本质上都是因为困在文本长度的限制里。甚至模型微调也只是目前文本长度有限情况下的权宜之计。 “所有问题都是文本长度的问题。如果你有10亿的 context length(上下文长度),今天看到的问题都不是问题”。月之暗面CEO杨植麟在之前的采访中表示。 如果单单只是为了“变长”,办法很多。长文本最终要建立在lossless(信息不随着文本长度增加而损失)上才有意义。而无损的⻓上下文将会是通往AGI的关键基础技术。某种程度上,绝对的文本长度是花架子,无损压缩的能力才能分模型的胜负。 “从word2vec到RNN、LSTM,再到Transformer,历史上所有的模型架构演进,本质上都是在提升有效的、无损的上下文⻓度。”杨植麟此前表示。 月之暗面方面透露,这次上下文长度从20万字扩展到200万字由于没有采用常规的渐进式提升路线,研发和技术团队遇到的技术难度也是指数级增加的。为了达到更好的⻓窗口无损压缩性能,团队从模型预训练到对⻬、推理环节均进行了原生的重新设计和开发。许欣然所领导的AI Infra层目前效率已经提升到了原来的3倍。 而无损上下文长度的线性变化最终会决定上层建筑的形态——也就是人们到底能用大模型做什么。 领域专家、可完成复杂多步任务的Agent、多模态模型。许欣然提到了这三个方向,或许这也会是忠于长文本路线的月之暗面未来的发展方向。 Kimi智能助手已支持200万字超⻓无损上下文,并于即日起开启产品“内测”。对大模型超⻓无损上下文能力有需求的用户,可到Kimi智能助手网⻚版kimi.ai首⻚申请抢先体验。之后,月之暗面会逐步开放更多用户来体验具备超⻓无损上下文能力的Kimi智能助手。 本文源自「私域神器」,发布者:siyushenqi.com,转载请注明出处:https://www.nodgame.com/33586.html 赞 (0) 打赏 微信扫一扫 支付宝扫一扫 0 0 生成海报 关于作者 siyushenqi.com 关注私信 11.2K 文章 0 评论 298 问题 16 粉丝 私域神器:海外私域营销拓客软件 Sora并非完美,致命缺点也很多 上一篇 2025 年 8 月 13 日 下午11:07 英伟达新核弹B200发布,一台服务器顶一个超算,万亿参数大模型30倍推理加速 下一篇 2025 年 8 月 13 日 下午11:08 相关推荐 海外营销 STOREEL COO 张睿 确认担任 PAGC 2025丨第五届全球产品与增长展会 短剧出海增长峰会圆桌嘉宾 STOREEL COO 张睿 确认担任 PAGC 2025丨第五届全球产品与增长展会 短剧出海增长峰会圆桌嘉宾 siyushenqi.com 2025 年 8 月 17 日 56000 海外营销 开发者分享:如何用叙事工具让游戏剧情和玩法更有吸引力? 在大多数的游戏里,剧情都是非常重要的。优秀的游戏故事可以提升玩家的代入感,也是带动长线参与的关键因素。 siyushenqi.com 2025 年 8 月 3 日 60000 海外营销 中国短剧“刷屏”全球!出海掘金水深鱼大风浪高 短剧出海市场火爆,“掘金”密码是啥? siyushenqi.com 2025 年 8 月 17 日 53000 海外营销 一场内容战引起的跨圈风潮 卷起了多少营销创意 内容为王时代风头正盛,游戏厂商怎能止步不前? siyushenqi.com 2025 年 8 月 24 日 74000 海外营销 跨境电商,想出圈要烧钱 电商出海近来上演冰火两重天。 siyushenqi.com 2025 年 8 月 13 日 54000 海外营销 “中国Zara”SheIn拟赴美上市,主打欧美、中东、印度市场 | Morketing Global Morketing Global 3月6日消息,具有“中国Zara”之称的国内快时尚跨境出口电商品牌SheIn,已与投行进行接触,计划最快于2020年完成赴美上市。 siyushenqi.com 2025 年 8 月 13 日 50000 海外营销 PAGC 2025丨展会推荐官 雷霆游戏 CTO 生辉、风眼科技 COO 梁炳甲、战吼网络 创始人 刘楠 邀您参与万人出海展会 PAGC 2025丨展会推荐官 雷霆游戏 CTO 生辉、风眼科技 COO 梁炳甲、战吼网络 创始人 刘楠 邀您参与万人出海展会 siyushenqi.com 2025 年 8 月 17 日 59000 海外营销 法国将投资1090亿欧元,大力发展AI 法国总统马克龙宣布,未来几年法国AI领域将获得1090亿欧元的私人投资,用于推动AI发展,并与OpenAI、软银等创建的“星际之门”项目展开竞争。 siyushenqi.com 2025 年 8 月 13 日 44000 海外营销 头部主播们怎么都去做短剧了? 离开直播间两年多后,薇娅也开始做起了短剧。 siyushenqi.com 2025 年 8 月 18 日 47000 海外营销 智冠、掌中云、Useepay 确认入驻PAGC 2025丨第五届全球产品与增长展会! 智冠、掌中云、Useepay 确认入驻PAGC 2025丨第五届全球产品与增长展会! siyushenqi.com 2025 年 8 月 17 日 65000 海外营销 董宇辉逼近小杨哥,但东方甄选跟得上吗? 净利润下滑过半,东方甄选要努力了。 siyushenqi.com 2025 年 8 月 12 日 43000 海外营销 爆款题材融合热门玩法,“重生爽文”小游戏冲榜 本篇文章统计微信小游戏、QQ小游戏、抖音小游戏、硬核小游戏以及App Store和Google Play上的新游爆款,并按照分类制作表格,将游戏排名情况等信息公布。 siyushenqi.com 2025 年 8 月 18 日 61000 海外营销 印度统一支付接口十月交易量突破20亿笔大关 根据印度国家支付公司(NPCI)发布的最新数据显示,十月印度统一支付接口(UPI)交易量达到20.7亿笔 siyushenqi.com 2025 年 8 月 26 日 65000 海外营销 繁荣了20年的亚马逊,“中年危机”还未到来 它仍然试图在每一个拐点,轻盈地转身 siyushenqi.com 2025 年 8 月 13 日 48000 海外营销 最受消费者热捧竟是它?Jumia各站点热卖品类大揭秘! 今年6月1日,Jumia开启了为期一个月的周年庆大促,日前Jumia2023年周年庆活动圆满收官。 siyushenqi.com 2025 年 8 月 13 日 51000 海外营销 传腾讯拟斥资约150亿美元收购韩国游戏巨头Nexon 据彭博社报道,腾讯正考虑以约150亿美元收购韩国知名游戏开发商Nexon,已与Nexon已故创始人金正宇家族接洽,但谈判是否进入实质性阶段尚不确定。 siyushenqi.com 2025 年 8 月 15 日 49000 海外营销 亚马逊又一新增收费,10月Prime大促正式生效! 随着时间来到8月的后半段,不少亚马逊卖家已深刻体会到淡季运营的不易。 siyushenqi.com 2025 年 8 月 5 日 63000 海外营销 海外3年流水15亿,回国却遇冷?腾讯初尝这一赛道,打法很“凶”! 芬兰游戏厂商Metacore开发、腾讯代理发行的合成休闲手游《庄园合合》国服上线。 siyushenqi.com 2025 年 8 月 18 日 53000 海外营销 2023年韩国电商运营战略:销售平台多样化、聚焦买家服务质量 韩国电商市场变动是其趋于成熟稳定且孩子啊不断成长进化的有效信号 siyushenqi.com 2025 年 8 月 13 日 47000 海外营销 提前免费!百度连发两款模型 百度推出了两款新的大模型,文心大模型X1和文心大模型4.5。文心X1是一款深度思考模型,具备更强的理解、规划、反思和进化能力,支持多模态和多工具调用。文心4.5则是一款原生多模态基础大模型,擅长多模态理解和语言生成,且在逻辑推理、代码能力等方面有显著提升。这两款模型已在百度多个产品中上线,并且目前免费。 siyushenqi.com 2025 年 8 月 13 日 58000 海外营销 埃及知名B2B电商平台有意进入沙特市场 埃及知名B2B电商平台有意进入沙特市场 siyushenqi.com 2025 年 8 月 12 日 53000 海外营销 2022年北美旺季分析:美国人有存款,但仍唯“低价”是瞻 74%的受访者表示仍在努力收紧裤腰带过日子 siyushenqi.com 2025 年 8 月 13 日 42000 海外营销 4.5亿美元的市场,中东地区还有个留给中小游戏厂商的机遇? 波斯语的使用范围在中东地区排名第二,对应也诞生了足够体量的市场需求。 siyushenqi.com 2025 年 8 月 24 日 70000 海外营销 【市场洞察】2024 年初移动市场表现 预测在2024年,用户在社交媒体领域的直接支出将出现增长,而事实也正朝着我们预测的方向发展。 siyushenqi.com 2025 年 8 月 18 日 54000 海外营销 对话「妙鸭」产品负责人:AIGC 的产品第一天不收钱,就可能收不到钱 近日,妙鸭产品负责人张月光接受了包括极客公园在内多家科技商业媒体的群访 siyushenqi.com 2025 年 8 月 19 日 58000 海外营销 年营收近10亿美元,他的独立站冲上类目第三 可穿戴技术已经存在了很长时间,它可以提供智能设备的大部分功能,并记录日常活动中的生物数据,可用来调节和监控个人的生活方式。由于COVID-19,可穿戴技术的使用出现了前所未有的增长。 siyushenqi.com 2025 年 8 月 13 日 47000 海外营销 大投3亿,秘密开发三年,中手游要拿出今年最炸的一款「开放世界」 中手游与它的手中的潜力股。 siyushenqi.com 2025 年 8 月 24 日 74000 海外营销 多款产品折戟,畅销百名开外,一款成功的率土like怎么就如此难做? 品类的下一个突破点在哪? siyushenqi.com 2025 年 8 月 24 日 79000 海外营销 Meta版ChatGPT来了?小扎、LeCun官宣650亿参数SOTA大语言模型LLaMA 前一阵大语言模型的火热中,Meta一直保持沉默。今天,Meta终于官宣自家的大语言模型,并且会向AI研究人员开源。 siyushenqi.com 2025 年 8 月 14 日 50000 海外营销 私域神器每周合作精选No.151|寻找印尼巴西FB代投;游戏投放视频供应商;提供预算/短剧内容寻流量渠道;社交产品寻注册渠道 本期精选的合作类型涵盖寻找印尼巴西FB代投;游戏投放视频供应商;提供预算/短剧内容寻流量渠道;社交产品寻注册渠道等。接下来就一起看看吧~ siyushenqi.com 2025 年 8 月 17 日 51000 发表回复 请登录后评论...登录后才能评论 提交