这是个有意思的估算题。我直接基于公开信息和工程经验来推算,不需要动代码。

一、微信有多少行代码?

微信从来没公开过代码量,但可以从几个公开线索倒推:

已知公开线索

  • 微信安装包(主程序)安卓端早年就超过 1.5GB 的解压体积,iOS 端二进制 200MB+。
  • 张小龙团队 2019 公开过:微信"展示一张图片"的代码路径牵涉极其庞大的兼容逻辑。
  • 微信是个超级 App:即时通讯、朋友圈、公众号、小程序运行时(等于内置了一个浏览器/JS 引擎)、微信支付、视频号(短视频+直播+推荐)、企业微信打通、音视频通话(自研引擎)、跨平台四端(iOS/Android/Win/Mac/Linux/Web)。

分模块粗估(仅客户端 + 核心后端,不含基础设施)

模块量级(行)
客户端四端 UI + 业务逻辑2000 万 ~ 3000 万
小程序运行时/引擎300 万 ~ 500 万
音视频引擎(自研)100 万 ~ 200 万
后端 IM/消息系统(海量长连接)500 万 ~ 1000 万
支付系统(含风控、清结算)500 万+
视频号(推荐/转码/直播/CDN)500 万+
公众号/开放平台/小程序后台数百万

合理区间:整个微信生态约 5000 万 ~ 1 亿行代码。 取一个中位数 约 7000 万行 来算。

参考系:Windows 操作系统约 5000 万行,Google 全公司单仓约 20 亿行。微信作为承载十几亿用户、横跨支付/社交/内容的超级平台,7000 万行是合理量级。


二、用 AI 重写一套完整微信要多少 token?

这里要把"生成代码"和"真正开发出来"分清楚,差别是几个数量级。

口径 A:只算"把这些代码打印出来"的理论下限

代码的 token 密度大约 1 行 ≈ 8~12 token(含缩进、符号、变量名)。取 10。

7000 万行 × 10 token/行 ≈ 7 亿 token(纯输出下限)

但这个数字毫无意义——它假设 AI 一次成型、零思考、零返工、零上下文。

口径 B:真实 AI 工程化开发的消耗

实际用 Claude/Agent 这类工具写代码,token 消耗主要不在"输出代码",而在:

  1. 输入侧(读上下文):每写一段新代码,要把相关文件、接口、规范读进上下文。真实项目里 输入 token 通常是输出的 5~20 倍
  2. 思考/推理:架构设计、调试、改 bug。
  3. 返工:一段功能平均要改 3~10 遍才正确。

经验系数:「最终留存的 1 行代码,全过程平均烧掉 500 ~ 2000 token」(涵盖读上下文、思考、试错、重写、测试)。这个比例在大型 agentic 编码实践里是相对靠谱的量级。

取中位 1000 token/最终行:

7000 万行 × 1000 token/行 ≈ 700 亿 token

考虑到微信的复杂度(分布式、超大规模、风控、合规、四端适配),实际更可能偏向上限:

综合估算:约 500 亿 ~ 2000 亿 token,中位数 ~1000 亿 token。


三、换算成成本和时间感

按 Opus 4.8 的价格量级(输入 ~$5/百万、输出 ~$25/百万 token,混合按 ~$10/百万 估):

  • 1000 亿 token × $10/百万 ≈ 100 万美元 纯模型 API 费用(口径 B 中位)。
  • 区间约 50 万 ~ 200 万美元

这还仅仅是 token 账单,不含:

  • 产品设计、需求迭代(微信是十几年打磨出来的)
  • 真机测试、灰度、十亿级压测
  • 安全/支付牌照/合规
  • 人类工程师 review 与决策

一句话结论

微信生态约 7000 万行代码(5000万~1亿区间);用 AI 从零重写,理论纯输出下限约 7 亿 token,但真实工程化开发(含读上下文、思考、返工、测试)需 约 1000 亿 token(500亿~2000亿区间),折合纯模型费用约 百万美元量级

而且必须说清:token 够了也造不出微信——它真正的壁垒是十几年的产品演进、十亿级分布式工程经验和生态,而不是代码行数本身。